- 概述
- 文档处理合同
- 发行说明
- 关于文档处理合同
- Box 类
- IPersistedActivity 接口
- PrettyBoxConverter 类
- IClassifierActivity 接口
- IClassifierCapabilitiesProvider 接口
- 分类器文档类型类
- 分类器结果类
- 分类器代码活动类
- 分类器原生活动类
- 分类器异步代码活动类
- 分类器文档类型功能类
- ContentValidationData Class
- EvaluatedBusinessRulesForFieldValue Class
- EvaluatedBusinessRuleDetails Class
- 提取程序异步代码活动类
- 提取程序代码活动类
- 提取程序文档类型类
- 提取程序文档类型功能类
- 提取程序字段功能类
- 提取程序原生活动类
- 提取程序结果类
- FieldValue Class
- FieldValueResult Class
- ICapabilitiesProvider 接口
- IExtractorActivity 接口
- 提取程序有效负载类
- 文档操作优先级枚举
- 文档操作数据类
- 文档操作状态枚举
- 文档操作类型枚举
- 文档分类操作数据类
- 文档验证操作数据类
- 用户数据类
- 文档类
- 文档拆分结果类
- DomExtensions 类
- 页类
- 页面分区类
- 多边形类
- 多边形转换器类
- 元数据类
- 词组类
- 词类
- 处理源枚举
- 结果表格单元类
- 结果表值类
- 结果表列信息类
- 结果表类
- 旋转枚举
- Rule Class
- RuleResult Class
- RuleSet Class
- RuleSetResult Class
- 分区类型枚举
- 词组类型枚举
- IDocumentTextProjection 接口
- 分类结果类
- 提取结果类
- 结果文档类
- 结果文档范围类
- 结果数据点类
- 结果值类
- 结果内容引用类
- 结果值令牌类
- 结果派生字段类
- 结果数据源枚举
- 结果常量类
- 简单字段值类
- 表字段值类
- 文档组类
- 文档分类类
- 文档类型类
- 字段类
- 字段类型枚举
- FieldValueDetails Class
- 语言信息类
- 元数据输入类
- 文本类型枚举
- 类型字段类
- ITrackingActivity 接口
- ITrainableActivity 接口
- ITrainableClassifierActivity 接口
- ITrainableExtractorActivity 接口
- 可训练的分类器异步代码活动类
- 可训练的分类器代码活动类
- 可训练的分类器原生活动类
- 可训练的提取程序异步代码活动类
- 可训练的提取程序代码活动类
- 可训练的提取程序原生活动类
- 基本数据点类 - 预览
- 提取结果处理程序类 - 预览
- Document Understanding ML
- Document Understanding OCR 本地服务器
- Document Understanding
- 智能 OCR
- 发行说明
- 关于“智能 OCR”活动包
- 项目兼容性
- 加载分类
- 将文档数字化
- 分类文档作用域
- 基于关键词的分类器
- Document Understanding 项目分类器
- 智能关键词分类器
- 创建文档分类操作
- 创建文档验证工件
- 检索文档验证工件
- 等待文档分类操作然后继续
- 训练分类器范围
- 基于关键词的分类训练器
- 智能关键词分类训练器
- 数据提取作用域
- Document Understanding 项目提取程序
- Document Understanding 项目提取程序训练器
- 基于正则表达式的提取程序
- 表单提取程序
- 智能表单提取程序
- 文档脱敏
- 创建文档验证操作
- 等待文档验证操作然后继续
- 训练提取程序范围
- 导出提取结果
- 机器学习提取程序
- 机器学习提取程序训练器
- 机器学习分类器
- 机器学习分类训练器
- 生成分类器
- 生成式提取程序
- 配置身份验证
- ML 服务
- OCR
- OCR 合同
- OmniPage
- PDF
- [未公开] Abbyy
- [未列出] Abbyy 嵌入式

Document Understanding 活动
训练提取程序范围
UiPath.IntelligentOCR.Activities.Training.TrainExtractors
描述
为要训练的任何提取程序活动提供作用域。您必须在此作用域内添加提取程序活动。
项目兼容性
Windows - Legacy | Windows
属性
属性面板
常见
- “显示名称”- 活动的显示名称。
输入
- “文档对象模型” - 要用于验证文档的文档对象模型。此模型存储在
Document变量中,可以从“数字化文档”活动中检索。请访问数字化文档,了解如何实现此目的。此字段仅支持Document变量。 - DocumentPath - The path to the document you want to validate. This field supports only strings and
Stringvariables.备注:The supported file types for this property field are:
.png,.gif,.jpe,.jpg,.jpeg,.tiff,.tif,.bmp, and.pdf. - DocumentText - The text of the document itself, stored in a String variable. This value can be retrieved from the Digitize Document activity. Visit Digitize Document to learn how to achieve this. This field supports only strings and
Stringvariables. - HumanValidatedData - The output from the Validation Station, stored in an
ExtractionResultproprietary variable.备注:如果“文档对象模型”和“人工验证的数据”文件具有不同来源,则系统会在运行时抛出错误。
其他
- “私有”- 选中后将不再以“Verbose”级别记录变量和参数的值。
“配置提取程序”向导
-
将“训练提取程序作用域”活动添加到工作流中。
-
在“属性”面板中,在“文档对象模型”、“文档路径”、“文档文本”和“人工验证数据”字段中添加自定义配置。
-
Add an extractor trainer activity (for instance, Machine Learning Extractor Trainer), or create a custom activity for extractor training by implementing the classes and place it inside the Train Extractors Scope activity.
-
To configure your extractors, select Configure Extractors. You can now see the Configure Extractors wizard.
Figure 1. Overview of the Configure Extractors wizard

-
要对整个文档类型或该文档中的特定字段使用特定的提取程序,请选中文档类型或字段旁边的复选框。选择整个文档类型后,系统也将自动选择所有相应的字段。
Figure 2. Animated image showing the process of selecting document types or corresponding fields for extraction

-
-
Select Get of refresh extractor capabilities, for the extractors that support this functionality, to map your taxonomy fields with the available extractor fields, or refresh them in case the extractor fields have changed. After you configure the capabilities, select Get Capabilities, to reflect the changes in the Configure Extractors wizard.
Figure 3. Animated image showing the process of refreshing the extractor capabilities for a Machine Learning Extractor

-
To train the extractor based on its extraction result, start by entering any alphanumeric value in the Framework Alias field. After this, go on to set the exact value in the corresponding Framework Alias field of one or more trainers. This creates a link between the extractor and the respective trainer(s).
-
Select Save once all the extractors are selected.
Document Understanding 集成
The Train Extractors Scope activity is part of the Document Understanding solutions. Visit the Document Understanding Guide for more information.