activities
latest
false
- 概述
- 文档处理合同- 发行说明
- 关于文档处理合同
- Box 类
- IPersistedActivity 接口
- PrettyBoxConverter 类
- IClassifierActivity 接口
- IClassifierCapabilitiesProvider 接口
- 分类器文档类型类
- 分类器结果类
- 分类器代码活动类
- 分类器原生活动类
- 分类器异步代码活动类
- 分类器文档类型功能类
- ContentValidationData Class
- EvaluatedBusinessRulesForFieldValue Class
- EvaluatedBusinessRuleDetails Class
- 提取程序异步代码活动类
- 提取程序代码活动类
- 提取程序文档类型类
- 提取程序文档类型功能类
- 提取程序字段功能类
- 提取程序原生活动类
- 提取程序结果类
- FieldValue Class
- FieldValueResult Class
- ICapabilitiesProvider 接口
- IExtractorActivity 接口
- 提取程序有效负载类
- 文档操作优先级枚举
- 文档操作数据类
- 文档操作状态枚举
- 文档操作类型枚举
- 文档分类操作数据类
- 文档验证操作数据类
- 用户数据类
- 文档类
- 文档拆分结果类
- DomExtensions 类
- 页类
- 页面分区类
- 多边形类
- 多边形转换器类
- 元数据类
- 词组类
- 词类
- 处理源枚举
- 结果表格单元类
- 结果表值类
- 结果表列信息类
- 结果表类
- 旋转枚举
- Rule Class
- RuleResult Class
- RuleSet Class
- RuleSetResult Class
- 分区类型枚举
- 词组类型枚举
- IDocumentTextProjection 接口
- 分类结果类
- 提取结果类
- 结果文档类
- 结果文档范围类
- 结果数据点类
- 结果值类
- 结果内容引用类
- 结果值令牌类
- 结果派生字段类
- 结果数据源枚举
- 结果常量类
- 简单字段值类
- 表字段值类
- 文档组类
- 文档分类类
- 文档类型类
- 字段类
- 字段类型枚举
- FieldValueDetails Class
- 语言信息类
- 元数据输入类
- 文本类型枚举
- 类型字段类
- ITrackingActivity 接口
- ITrainableActivity 接口
- ITrainableClassifierActivity 接口
- ITrainableExtractorActivity 接口
- 可训练的分类器异步代码活动类
- 可训练的分类器代码活动类
- 可训练的分类器原生活动类
- 可训练的提取程序异步代码活动类
- 可训练的提取程序代码活动类
- 可训练的提取程序原生活动类
 
 
- Document Understanding ML
- Document Understanding OCR 本地服务器
- Document Understanding
- 智能 OCR
- ML 服务
- OCR
- OCR 合同
- OmniPage
- PDF
- [未公开] Abbyy
- [未列出] Abbyy 嵌入式
重要 :
请注意,此内容已使用机器翻译进行了部分本地化。
新发布内容的本地化可能需要 1-2 周的时间才能完成。

Document Understanding 活动
上次更新日期 2025年10月28日
要从相同类型的文档中自动提取和验证数据时,可以使用这些活动。发票或采购订单非常适合此类任务。
以下工作流重点关注对发票使用“数字化文档”活动,然后使用“呈现验证站点”活动来验证信息。 为此工作流选择的 OCR 引擎是“UiPath™文档 OCR ”,但您可以将其替换为我们的任何其他 OCR 引擎。 系统将使用根据所选发票单据创建的简单分类。 请访问分类概述,查看如何创建分类。
- 打开 Studio,并新建一个默认命名为“主要”的“流程”。
- 将序列容器拖动至工作流设计器。
- 选择“序列”容器并创建以下变量:
                  - 变量名称:taxonomy;
- 变量类型:文档分类;
- 默认值:无。
 
- 变量名称:
- 在“序列”容器中添加“加载分类”活动。
                  在“分类”字段中添加“taxonomy”变量。
- 在“加载分类”活动之后的“序列”容器内添加“遍历循环”活动。
                  - 在遍历循环字段中添加表达式doc。
- 在输入字段中添加表达式directory.GetFiles("TestData\InputDocs\")。
- 在“ 属性 ”面板中,从“ 类型参数” 下拉列表中选择“字符串”选项。
 
- 在遍历循环字段中添加表达式
- 选择“遍历循环”活动的“正文”容器,并创建下表中显示的变量:
                  
                  表 1. 要创建的变量 变量类型 默认值 docName泛型值 不适用 dom文档 不适用 text字符串 不适用 extractionResults提取结果 不适用 validatedResults提取结果 不适用 
-  在“ 正文 ” 容器中添加“分配”活动。
                  - 在“收件人”字段中添加“docName”变量。
- 在“值”字段中添加表达式“System.IO.Path.GetFileNameWithoutExtension(doc)”。
 
- 在“收件人”字段中添加“
- 在“分配”活动下添加“写入行”活动。
                  在“文本”字段中添加表达式"Digitizing "+docName。
- 在“分配”活动之后添加“写入行”活动。
                  - 将 DocumentPath 设置为 doc。
- 在“文档文本”字段中添加“text”变量。
- 在“ 文档对象 模型”字段中添加变量 dom。
 
- 将 DocumentPath 设置为 
- 将 OCR 引擎拖动到“ 数字化文档” 活动中。 本示例使用UiPath 文档 OCR 。
- 在“ 数字化文档” 活动之后添加“ 写入行 ”活动。
                  在“文本”字段中添加表达式docName+" was digitized."。
- 在“写入行”活动之后添加“写入行”活动。
                  在“文本”字段中添加表达式"Opening the Validation Station"。
- 在“写入行”活动之后添加“Try Catch”活动。
- 在“ 尝试 ”部分中添加“序列”容器。
-  在“ 序列 ” 容器中添加“演示验证站点”活动。
                  - 在“ 文档路径” 字段中添加 doc作为值。
- 在“文档文本”字段中添加“text”变量。
- 在“ 文档对象 模型”字段中添加变量 dom。
- 在“分类”字段中添加“taxonomy”变量。
- 在“ 自动提取 结果” 字段中添加变量 extractedResults。
- 在“ 已验证 的提取结果”字段中添加变量 validatedResults。
 
- 在“ 文档路径” 字段中添加 
- 在“显示验证站点”活动后添加“写入文本文件”活动。
- 运行流程。 机器人自动提取数据,对文档进行分类,提取特定字段,准备数据以进行验证,并显示提取的文档。
请访问以下链接,下载示例的 
            
            
         ZIP 存档:示例。