- 概述
- 入门指南
- Activities (活动)
- Insights 仪表板
- Document Understanding 流程
- 快速入门教程
- 框架组件
- 模型详细信息
- 概述
- Document Understanding - ML 包
- DocumentClassifier - ML 包
- 具有 OCR 功能的 ML 包
- 1040 - ML 包
- 1040 附表 C - ML 包
- 1040 附表 D - ML 包
- 1040 附表 E - ML 包
- 1040x - ML 包
- 3949a - ML 包
- 4506T - ML 包
- 709 - ML 包
- 941x - ML 包
- 9465 - ML 包
- ACORD125 - ML 包
- ACORD126 - ML 包
- ACORD131 - ML 包
- ACORD140 - ML 包
- ACORD25 - ML 包
- 银行对账单 - ML 包
- 提单 - ML 包
- 公司注册证书 - ML 包
- 原产地证书 - ML 包
- 检查 - ML 包
- 儿童产品证书 - ML 包
- CMS1500 - ML 包
- 欧盟符合性声明 - ML 包
- 财务报表 (Financial statements) - ML 包
- FM1003 - ML 包
- I9 - ML 包
- ID Cards - ML 包
- Invoices - ML 包
- InvoicesAustralia - ML 包
- 中国发票 - ML 包
- 希伯来语发票 - ML 包
- 印度发票 - ML 包
- 日本发票 - ML 包
- 装运发票 - ML 包
- 装箱单 - ML 包
- 工资单 - ML 包
- 护照 - ML 包
- 采购订单 - ML 包
- 收据 - ML 包
- 汇款通知书 - ML 包
- UB04 - ML 包
- 水电费账单 - ML 包
- 车辆所有权证明 - ML 包
- W2 - ML 包
- W9 - ML 包
- 其他开箱即用的 ML 包
- 公共端点
- 流量限制
- OCR 配置
- 管道
- OCR 服务
- 支持的语言
- 深度学习
- 数据与安全性
- 许可和计费逻辑

Document Understanding classic user guide
简介
Document UnderstandingTM is the main starting point for creating new projects. You can use it for structured or semi-structured documents, and also along with pre-trained models. You can always start a training session from scratch, validate your documents, and customize the projects as needed.
Overview page
在这里,您可以找到所有已创建项目的列表,以及特定的详细信息。您可以按字母顺序或日期对项目进行排序,创建新项目并自定义页面视图。
项目
显示所有已创建项目的列表。项目的排序分为三种类型:
- 按字母顺序升序排列
- 按字母顺序降序排列
- By creation date. The default sorting order is by the creation date.
创建项目后,您可以选择文档类型。有两个选项:
- Using Forms AI (fixed layout format) - intended for Forms AI
- Using Semi-Structured AI - intended for Document Manager
如果要删除文档类型,请打开项目,选择要删除的文档类型,打开“操作”菜单,然后单击“删除”选项。
列
Use this function to customize the amount of details available for the Projects list. Here's the full list of details that can be displayed for each created project.
- Name - Displays the name of the project.
- Document types - Displays the type of documents used for each project.
- Extractors - Displays the number of extractors used for each project.
- Documents processed - Displays the number of processed documents for each project.
- Creation Date - Displays the creation date for each project.
- Refresh - Refreshes the information in the displayed columns for all projects.
提示:
You can select which column are displayed from the Columns ˅ drop-down menu. If you click Reset, all fields will be displayed, no matter of the previous selections.
New project
Create a new project by using the New project button. Clicking on the New project opens a new popup window.
创建新项目时,需要提供以下信息:
| 选项 | 描述 | 字段状态 |
|---|---|---|
| 名称 | 为新项目命名。 | 必需 |
| 描述 | 提供有关项目的更多详细信息。 | 可选 |
| OCR 方法 | 为新项目选择 OCR 方法。 在以下选项之间选择:
| 必需 |
| OCR URL | 提供与所选 OCR 方法对应的 OCR URL。 Here 's the list of the OCR URLs corresponding to the UiPath OCR method. 以下是其他常用 OCR URL 的列表: https://vision.googleapis.com/v1/images:annotate Microsoft Read 3.2 Azure: <Azure_resource_Endpoint>/vision/v3.2/read/analyze Microsoft Read 3.2 On-Prem: http://<IP_addr>:<port_number>/vision/v3.2/read/analyze Microsoft Read 2.0 Azure: <Azure_resource_Endpoint>/vision/v2.0/read/core/asyncBatchAnalyze Microsoft Read 2.0 On-Prem: http://<IP_addr>:<port_number>/vision/v2.0/read/core/Analyze | 必需 |
| OCR API 密钥 | 为所选 OCR 方法提供 OCR API 密钥。 If the OCR method is UiPath OCR, or UiPath Chinese, Japanese, Korean OCR, then the value of this field is available on the cloud platform by going to Home > Admin > Licenses > Consumables > AI Units | 可选 |
| 将 OCR 应用于 PDF | Establishes if the OCR process should be applied or not to PDF documents. If set to Yes , the OCR is applied to all PDF pages of the document. If set to No , the OCR is not applied to any pages and returns only the text embedded in the PDF . When set to Auto OCR applies only to the scanned pages of the document. The default value is Auto . | 必需 |
| AI Center 项目 | 提供要导入的 AI Center 项目的名称。 | 可选 |
| 从 AI Center 导入 | 启用/禁用从 AI Center 导入功能 | 可选 |
UiPath OCR API Key is also available on the cloud platform by going to Admin/Licenses/Robots & Services/Document Understanding and copying the available key.
链接到 AI Center 的项目可通过 AI Center 图标轻松识别。
如果要删除链接到 AI Center 的项目,则删除时也会自动将该项目从 AI Center 中删除。
Project page
您可以在此处找到有关已创建项目的更多详细信息,编辑项目名称或创建新的文档类型。
第一行信息显示以下详细信息:
- Project name - The name of the project.
- Date - Details about the project time creation.
- Settings - Opens the popup menu from the Overview page. More details about it can be found here.
文档类型和提取程序
在一般详细信息下方,您可以找到两个选项卡:
Document type - Provides a list of all the available document types for the selected project. Defining a document type is mandatory for creating an extractor or classifier. A document type can be an invoice, a purchase order, or a standardized form.
| 文档类型菜单 | 描述 |
|---|---|
| 名称 | 显示所有已创建文档类型的名称列表。 |
| 提取方法 | 显示所选文档类型所使用的提取方法类型。 |
| 页面 | 显示在每种文档类型中找到的总页数。 |
| 刷新 | 刷新项目列表。 |
Extractors - Provides the list of extractors created for the document types of the selected project. Use extractors to train the document types.
| “提取程序类型”菜单 | 描述 |
|---|---|
| 名称 | 显示已创建文档类型中所有提取程序的名称列表。 |
| 类型 | 显示使用的提取程序的类型。 |
| 创建日期 | 显示每个提取程序的创建日期。 |
| 已处理的页数 | 显示每个提取程序已处理的页面数。 |
| 状态 | 显示每个提取程序的状态。 |
| 刷新 | 刷新提取程序列表。 |
| 提取程序的菜单 | 可以用于复制提取程序的 URL 链接。 |
Both Document types and Extractors have three types of sorting the information:
- 按字母顺序升序排列。
- 按字母顺序降序排列。
- By creation date. The default sorting order is by the creation date.
备注:
Document types are mandatory in a project, while extractors are optional. You can choose to add an extractor for any of the document types.
其他选项
以下选项适用于 Document Understanding 的整个界面。
Search option enables you to initiate a search among the available list of projects, document types, or extractors. Search is active separately for each selected tab, meaning that if you want to search for an extractor, you should select the Extractors tab. Same applies for Document types. Start a search by typing the name of the project inside the Search bar.
Refresh - Refreshes the list of projects.
Remove project - Deletes the selected project. The Remove project button becomes visible only after opening the action menu.
When deleting a project, all containing document types and extractors are deleted along with the project.
Page scrolling - Easy scroll through the list of project pages, document types, or extractors. Go page by page or skip directly to the first/last page.
Items per page - Select the number of projects, document types, or extractors displayed per project page.
REST API - Opens the REST API framework capabilities.
许可
在本指南的“许可”类别中,您可以查看以下信息:
RPA 集成
如果要将 Document Understanding 项目集成到 RPA 工作流中,请确保按照以下步骤操作:
- 打开 UiPath Studio 并通过从模板列表中选择 Document Understanding 流程创建一个新项目。
还应将以下包添加到 UiPath Studio 项目中:
- UiPath.Intelligent OCR.Activities
- UiPath.OCR.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.OmniPage.Activities
确保在租户上启用 Document Understanding。
启用 Document Understanding 后,左侧导航栏中将显示 Document Understanding 选项卡。