- 概述
- 入门指南
- Activities (活动)
- Insights 仪表板
- Document Understanding 流程
- 快速入门教程
- 框架组件
- 模型详细信息
- 概述
- Document Understanding - ML 包
- DocumentClassifier - ML 包
- 具有 OCR 功能的 ML 包
- 1040 - ML 包
- 1040 附表 C - ML 包
- 1040 附表 D - ML 包
- 1040 附表 E - ML 包
- 1040x - ML 包
- 3949a - ML 包
- 4506T - ML 包
- 709 - ML 包
- 941x - ML 包
- 9465 - ML 包
- ACORD125 - ML 包
- ACORD126 - ML 包
- ACORD131 - ML 包
- ACORD140 - ML 包
- ACORD25 - ML 包
- 银行对账单 - ML 包
- 提单 - ML 包
- 公司注册证书 - ML 包
- 原产地证书 - ML 包
- 检查 - ML 包
- 儿童产品证书 - ML 包
- CMS1500 - ML 包
- 欧盟符合性声明 - ML 包
- 财务报表 (Financial statements) - ML 包
- FM1003 - ML 包
- I9 - ML 包
- ID Cards - ML 包
- Invoices - ML 包
- InvoicesAustralia - ML 包
- 中国发票 - ML 包
- 希伯来语发票 - ML 包
- 印度发票 - ML 包
- 日本发票 - ML 包
- 装运发票 - ML 包
- 装箱单 - ML 包
- 工资单 - ML 包
- 护照 - ML 包
- 采购订单 - ML 包
- 收据 - ML 包
- 汇款通知书 - ML 包
- UB04 - ML 包
- 水电费账单 - ML 包
- 车辆所有权证明 - ML 包
- W2 - ML 包
- W9 - ML 包
- 其他开箱即用的 ML 包
- 公共端点
- 流量限制
- OCR 配置
- 管道
- OCR 服务
- 支持的语言
- 深度学习
- 数据与安全性
- 许可和计费逻辑

Document Understanding classic user guide
表单 AI
Forms AI is part of Document UnderstandingTM and can be used for uploading and processing structured forms with standard layouts and fields.
创建 Forms AI
Forms AI is the first extraction method available in Document Understanding. Read more information about how to create a new project in Document Understanding.
创建项目后,您需要按照后续步骤在项目中使用 Forms AI 创建文档类型。
- 打开项目。
- Select the New Document Type button.
- 为您的文档类型添加名称。
If you want to train your document classifiers straight from Document Understanding, than you can use the One Click Classification functionality.
Fixed layout forms used with Forms AI can each have a maximum length of five pages.
将 Forms AI 转换为半结构化文档类型
您可以将 Forms AI 文档类型转换为半结构化文档类型。
将 Forms AI 文档类型转换为半结构化 (Document Manager) 文档类型时,您可以使用 Document Manager 中的所有可用功能
转换选项非常适合用于训练功能更强大的深度学习机器学习模型的复杂场景。
如何转换 Forms AI 会话
如果您决定将 Forms AI 会话转换为 Document Manager 会话,则可以选择两个选项。
从项目的文档类型列表中
您可以直接从项目的“文档类型”列表中转换文档类型。
Access the Open access menu of the document type you want to convert and click the Convert to Semi-Structured option. A popup window is displayed asking you to confirm the action.
转换文档类型后,您将无法撤消 Actions。
从打开的 Forms AI 会话
打开已创建的 Forms AI 会话,以将其转换为半结构化会话。
从打开的会话中单击“访问菜单”
,然后单击“转换为半结构化”选项。
Once a Document Type has been converted, you cannot reverse the action. The Convert to Semi-Structured button is not displayed if the project does not have an AI Center link.
导入文档
创建新的 Forms AI 后,系统将打开一个新窗口,要求您导入数据。您最少可以导入两个文档,最多可以导入二十个文档,每个文档最多包含五页。通过拖放或浏览来上传文件。
导入文档是将表单 AI 转换为半结构化 AI 文档类型的另一种方法。 如果您尝试上传超过 20 个文档,或者任何文档超过 20 页,则会显示一个选项。 屏幕上将显示一个弹出窗口,询问您是否要将 FormsAI 会话转换为半结构化会话。
Automatically extracted fields should also be checked for Content Type accuracy. For example, if a date field was automatically extracted, then the Content Type should be date. Any inaccuracies should be manually corrected.
Management bar
在页面顶部,您可以找到管理栏。您可以使用管理栏执行多项操作:在文档之间导航、删除/还原档、搜索/筛选文档、运行 AI 模型预测以及导入和导出文档。
以下是管理栏中的可用项目:
| 项目 | 图标 | 描述 |
|---|---|---|
| 导航 | 在与活动筛选器匹配的文档之间导航。在两个箭头之间显示一个计数器。它显示了与活动搜索/筛选器匹配的文档总数和当前文档的编号。 | |
| “搜索”和“在文档中搜索” | 搜索 - 启动搜索或筛选文档。导出数据文档时,系统也会应用筛选器。您可以按文档中的词语或文档名称进行筛选。 在文档中搜索 - 通过单击 或使用快捷键 Ctrl + Shift + F,在文档中发起文本搜索 | |
| 删除/还原 | 删除或还原文档。已删除的文档位于“已删除”筛选器下。 | |
| 导入 | 打开“导入数据”对话框。 | |
| 导出 | 打开“导出文件”对话框。 | |
| 文档名称和类型 | 不适用 | 当前处于活动状态的文档的名称及其类型。 |
| 下载 | 该选项位于文档名称旁边的下拉列表中。 单击图标可下载包含原始文档的 Zip 文件。除了原始文档外,还会下载由 Document Manager 内部转换为 .jpeg 图像的所有页面。 | |
| 永久删除 | The option is available in the dropdown next to the document name. Permanently deletes individual files. The .pdf and all its .jpeg images are deleted from the AI Center dataset and all the metadata is deleted from the database. When clicking the button, a pop-up message appears asking you if you are sure you want to permanently delete the document. Click OK to continue or Cancel to revert to the previous screen. | |
| 预测 | 运行 AI 模型预测并显示结果。 配置预标记后,将在管理栏中启用该按钮。单击该按钮,以预标记当前文档。 目前,将“预测”选项与“公共端点”一起使用时,只能预标记文档的前 10 页。这是一个已知问题,正在修复中。但是,在 AI Center 中将“预测”选项与 ML 技能一起使用并不会施加这样的限制。 | |
| 发布 | 发布 Forms AI 提取程序并创建关联的链接,该链接可在项目的提取程序列表中找到。 | |
| 设置 | 配置 OCR 和预加标签设置,或者访问“如何…”面板。设置按钮有两个可用选项:
| |
| 会话 | 不适用 | The name of the current session, found at the top of the page, next to the UiPath® Document Understanding TM logo. |
Let's go a little bit deeper in understanding the difference between Delete and Permanently Delete options.
- The Delete option deletes the files, without permanently removing them from your project. You can still find the deleted files under the deleted filter from the Search bar, and restore them by using the Restore option.
- The Permanently Delete option deletes the selected files without any possibility of restoring them.
The Settings button has two available options:
- Settings - where you can configure the OCR service
- How to... - which has the purpose of a help menu
列字段
新建列字段
- 在页面顶部的表格部分单击
,以添加新的“列”字段。系统将显示“创建列字段”窗口。 - 在“输入唯一字段名称”字段中填写字段的唯一名称。该字段不接受大写字母。只能包含小写字母、数字、下划线
_和短划线-。 - 单击“确定”。
编辑列字段
Click the Edit field
button. The available options for column fields can be found in the table below.
| 选项 | 描述 |
|---|---|
| 字段名称 | 字段的唯一名称。 _ 和短划线 -。 |
| 内容类型 | 字段的内容类型:
|
| 快捷方式 | 字段的快捷键。允许使用一个或两个按键。 |
| 拆分项目 | 如果要将此字段用作表格中行项目或行之间的分隔符,请选中此复选框。出现此字段的任何行都会被视为表格中的新行项目或行。这通常用于发票行项目中的“行金额”字段。 |
单击“保存”以保存您的设置。
Grouping table rows is different than in the AI Center Document Manager. Here, the rows are automatically grouped based on the state of the Split items checkbox on each column fields. This is only relevant for tables with rows that contain multiple lines of text. In this case you must check the Split items checkbox on any of the fields that have only one line for each table row. For instance, on an invoice, the line item amount would be a typical field on which you might check the Split items option. In the context of Forms AI you would do the same thing on forms.
删除列字段
要删除列字段,请执行以下步骤:
- 单击与要删除的列字段对应的“编辑字段”
按钮。 - 单击“删除”按钮。
- 单击“确定”。
- 列字段及其关联的带标签数据将被删除。
字段
Create a new field
- Click
on the right pane in the Fields section. The Create a new regular field window is displayed. - 在“输入唯一字段名称”字段中填写字段的唯一名称。该字段不接受大写字母。只能包含小写字母、数字、下划线
_和短划线-。 - 单击“确定”。
删除所有字段
- 在页面顶部的表格部分单击
,以删除所有已创建的字段。使用此函数可删除当前“文档类型”集合中文档上的所有字段,包括“常规”字段和“列”字段,以及所有标签。此操作无法撤销。 - Click the Delete button from the Delete all fields dialog box.
编辑字段
Click the Edit field
button. The available options for regular fields can be found in the table below.
| 选项 | 描述 |
|---|---|
| 字段名称 | 字段的唯一名称。 _ 和短划线 -。 |
| 内容类型 | 字段的内容类型:
|
| 快捷方式 | 字段的快捷键。允许使用一个或两个按键。 |
| 多行 | 常规 |
单击“保存”以保存您的设置。
删除常规字段
要删除常规字段,请执行以下步骤:
- 单击与要删除的常规字段对应的“编辑字段”
按钮。 - 单击“删除”按钮。
- 单击“确定”。
- 字段及其关联的带标签数据将被删除。
文档视图和标签
对于多页文档,您可以像在任何 PDF 查看器中一样自然地滚动页面。要放大或缩小,请使用 Ctrl 并滚动鼠标滚轮。
您可以通过选择文字框并按下相应的按键,将文档分配给某个字段,从而标记文档。您也可以右键单击文字框并验证提取的信息。
For more details on how to label documents, visit this page.
复选框
应为每个字段手动标记 Forms AI 中可用的复选框。也可以使用“列字段”选项标记表格中的复选框。在 Forms AI 中标记复选框时,应同时考虑选中和未选中的复选框。
Here you can find more detailed information about how to label checkboxes.
You can choose to integrate your Document Understanding project into an RPA workflow by following the steps presented here.
或使用快捷键 Ctrl + Shift + F,在文档中发起文本搜索