- 概述
 - Document Understanding 流程
 - 快速入门教程
 - 框架组件
 - ML 包
 - 管道
 - Document Manager
 - OCR 服务
 - 部署在 Automation Suite 中的 Document Understanding
 - 在 AI Center 独立版中部署的 Document Understanding
 - 深度学习
 - 许可
 - 参考
- UiPath.Abbyy.Activities
 - UiPath.AbbyyEmbedded.Activities
 - UiPath.DocumentUnderstanding.ML.Activities
 - UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
 - UiPath.Intelligent OCR.Activities
 - UiPath.OCR.Activities
 - UiPath.OCR.Contracts
 - UiPath.DocumentProcessing.Contracts
 - UiPath.OmniPage.Activities
 - UiPath.PDF.Activities
 
 

Document Understanding 用户指南
您可以重命名字段。只需单击“编辑字段” 按钮,即可在窗口顶部编辑字段的名称。
            
如果您稍后决定不使用某些字段来训练 ML 模型,则可以将其删除,也可以始终可以使用“编辑字段”窗口中的“隐藏”复选框将其隐藏。
发票单据上的行项目“说明”或“单价”就是列字段的示例。
新建列字段
- 在页面顶部的表格部分单击 
,以添加新的“列”字段。系统将显示“创建列字段”窗口。
 - 在“输入唯一字段名称”字段中填写字段的唯一名称。该字段不接受大写字母。只能包含小写字母、数字、下划线 (
_) 和短划线 (-)。 - 单击“确定”。系统将显示“编辑字段”窗口,并打开“常规”选项卡。
                        
 - 从“内容类型”下拉列表中,选择内容类型。
 - 单击“热键”字段,然后按键盘上的某个键以自动填充该字段。
 - 如果要将此字段用作表格中明细项目或行之间的分隔符,请选中“拆分项目”复选框。出现此字段的任何行都会被视为表格中的新行项目或行。这通常用于发票明细项目中的“明细金额”字段。
 - 如果您不希望此字段成为导出数据集的一部分,请选中“隐藏”复选框。
 - 单击“高级”选项卡。
 - 从“评分”下拉列表中,选择在运行模型预测评估时用来确定准确性的度量。
 - 在“颜色”字段中,填写所需字段颜色的十六进制代码。
 - 单击“保存”以保存您的设置。
 
编辑列字段
单击“编辑字段”按钮 。可以在下表中找到列字段的可用选项。
                  
| 
                                  选项  | 
                                  选项卡  | 
                                  描述  | 
|---|---|---|
| 
                                  字段名称  | 
                                  不适用  | 
                                  字段的唯一名称。 该字段不接受大写字母。只能包含小写字母、数字、下划线  
                                 
                              _ 和短划线 -。
                                  | 
| 
                                  内容类型  | 
                                  常规  | 
                                  字段的内容类型: 
  | 
| 
                                  快捷方式  | 
                                  常规  | 
                                  字段的快捷键。允许使用一个或两个按键。  | 
| 
                                  拆分项目  | 
                                  常规  | 
                                  如果要将此字段用作表格中行项目或行之间的分隔符,请选中此复选框。出现此字段的任何行都会被视为表格中的新行项目或行。这通常用于发票行项目中的“行金额”字段。  | 
| 
                                  隐藏  | 
                                  常规  | 
                                  如果您不希望此字段成为导出的数据集的一部分,请选中此复选框。  | 
| 
                                  颜色  | 
                                  高级  | 
                                  字段的颜色,以十六进制格式表示。如果值无效,则生成一个新值。  | 
| 
                                  计分  | 
                                  高级  | 
                                  用于在运行模型预测评估时确定准确度的方法。只能为字符串内容类型配置此选项。所有其他内容类型均使用精确匹配评分策略。选项: 
  | 
删除列字段
要删除列字段,请执行以下步骤:
- 单击与要删除的列字段对应的“编辑字段”按钮 
。
 - 单击“删除”按钮。
 - 输入字段的确切名称。
                        
 - 单击“确定”。
 - 列字段及其关联的带标签数据将被删除。
 
这些字段在给定文档中仅出现一次。发票单据上的行项目“发票编号”或“总金额”就是列字段的示例。
新建常规字段
- 单击“常规字段”部分右侧窗格中的 
。系统将显示“创建常规字段”窗口。
 - 在“输入唯一字段名称”字段中填写字段的唯一名称。该字段不接受大写字母。只能包含小写字母、数字、下划线 (
_) 和短划线 (-)。 - 单击“确定”。系统将显示“编辑字段”窗口,并打开“常规”选项卡。
 - 从“内容类型”下拉列表中选择内容类型。
 - 单击“快捷方式”字段,然后按键盘上的某个键以自动填充该字段。
 - 如果要检查的字段可能跨越多个文本行,例如地址或说明,请选中“多行”复选框。如果未选择此选项,则仅返回第一行。
 - 如果您不希望此字段成为导出数据集的一部分,请选中“隐藏”复选框。
 - 单击“高级”选项卡。
 - 如果模型预测给定页面上某个字段的多个实例,请从“后处理”下拉列表中选择后处理机制。
 - 从“评分”下拉列表中,选择在运行模型预测评估时用来确定准确性的度量。
 - 在“颜色”字段中,填写所需字段颜色的十六进制代码。
 - 单击“保存”以保存您的设置。
 
编辑常规字段
单击“编辑字段”按钮 。可以在下表中找到常规字段的可用选项。
                  
| 
                                  选项  | 
                                  选项卡  | 
                                  描述  | 
|---|---|---|
| 
                                  字段名称  | 
                                  不适用  | 
                                  字段的唯一名称。 该字段不接受大写字母。只能包含小写字母、数字、下划线  
                                 
                              _ 和短划线 -。
                                  | 
| 
                                  内容类型  | 
                                  常规  | 
                                  字段的内容类型: 
  | 
| 
                                  后处理  | 
                                  高级  | 
                                  后处理机制。如果模型在给定页面上预测了某个字段的多个实例,则模型将返回: 
  | 
| 
                                  快捷方式  | 
                                  常规  | 
                                  字段的快捷键。允许使用一个或两个按键。  | 
| 
                                  多行  | 
                                  常规  | 
                                  对于可能跨多个文本行的字段(地址或说明),请选中此复选框。否则,仅返回第一行。  | 
| 
                                  隐藏  | 
                                  常规  | 
                                  如果您不希望此字段成为导出的数据集的一部分,请选中此复选框。  | 
| 
                                  后处理  | 
                                  高级  | 
                                  后处理机制。如果模型在给定页面上预测了某个字段的多个实例,则模型将返回: 
  | 
| 
                                  计分  | 
                                  高级  | 
                                  用于在运行模型预测评估时确定准确度的方法。只能为字符串内容类型配置此选项。所有其他内容类型均使用精确匹配评分策略。选项: 
  | 
| 
                                  颜色  | 
                                  高级  | 
                                  字段的颜色,以十六进制格式表示。如果值无效,则生成一个新值。  | 
删除常规字段
要删除常规字段,请执行以下步骤:
- 单击与要删除的常规字段对应的“编辑字段”按钮 
。
 - 单击“删除”按钮。
 - 输入字段的确切名称。
                        
 - 单击“确定”。
 - 常规字段及其关联的带标签数据将被删除。
 
整体上引用文档的数据点。例如,收据的“费用类型”(伙食费、住宿费、航空费、交通费)或发票的“币种”(美元、欧元和日元)就是分类字段的示例。
新建分类字段
- 单击“分类字段”部分右侧窗格中的 
。系统将显示“创建分类字段”窗口。
 - 在“输入唯一字段名称”字段中填写字段的唯一名称。该字段不接受大写字母。只能包含小写字母、数字、下划线 (
_) 和短划线 (-)。 - 单击“确定”。 系统将显示“编辑字段”窗口。
 - 在文本区域中,填写类列表,然后以逗号分隔列表的形式键入名称。
 - 单击“保存”以保存您的设置。
 
编辑分类字段
:) 之后(选项 1 : 说明 1)。
                  删除分类字段
要删除分类字段,请执行以下步骤:
- 单击与要删除的分类字段对应的“编辑字段”按钮 
。
 - 单击“删除”按钮。
 - 
                        
输入字段的确切名称。
 - 单击“确定”。
 - 分类字段及其关联的带标签数据将被删除。