- 概述
- 文档处理合同
- 发行说明
- 关于文档处理合同
- Box 类
- IPersistedActivity 接口
- PrettyBoxConverter 类
- IClassifierActivity 接口
- IClassifierCapabilitiesProvider 接口
- 分类器文档类型类
- 分类器结果类
- 分类器代码活动类
- 分类器原生活动类
- 分类器异步代码活动类
- 分类器文档类型功能类
- ContentValidationData Class
- EvaluatedBusinessRulesForFieldValue Class
- EvaluatedBusinessRuleDetails Class
- 提取程序异步代码活动类
- 提取程序代码活动类
- 提取程序文档类型类
- 提取程序文档类型功能类
- 提取程序字段功能类
- 提取程序原生活动类
- 提取程序结果类
- FieldValue Class
- FieldValueResult Class
- ICapabilitiesProvider 接口
- IExtractorActivity 接口
- 提取程序有效负载类
- 文档操作优先级枚举
- 文档操作数据类
- 文档操作状态枚举
- 文档操作类型枚举
- 文档分类操作数据类
- 文档验证操作数据类
- 用户数据类
- 文档类
- 文档拆分结果类
- DomExtensions 类
- 页类
- 页面分区类
- 多边形类
- 多边形转换器类
- 元数据类
- 词组类
- 词类
- 处理源枚举
- 结果表格单元类
- 结果表值类
- 结果表列信息类
- 结果表类
- 旋转枚举
- Rule Class
- RuleResult Class
- RuleSet Class
- RuleSetResult Class
- 分区类型枚举
- 词组类型枚举
- IDocumentTextProjection 接口
- 分类结果类
- 提取结果类
- 结果文档类
- 结果文档范围类
- 结果数据点类
- 结果值类
- 结果内容引用类
- 结果值令牌类
- 结果派生字段类
- 结果数据源枚举
- 结果常量类
- 简单字段值类
- 表字段值类
- 文档组类
- 文档分类类
- 文档类型类
- 字段类
- 字段类型枚举
- FieldValueDetails Class
- 语言信息类
- 元数据输入类
- 文本类型枚举
- 类型字段类
- ITrackingActivity 接口
- ITrainableActivity 接口
- ITrainableClassifierActivity 接口
- ITrainableExtractorActivity 接口
- 可训练的分类器异步代码活动类
- 可训练的分类器代码活动类
- 可训练的分类器原生活动类
- 可训练的提取程序异步代码活动类
- 可训练的提取程序代码活动类
- 可训练的提取程序原生活动类
- 基本数据点类 - 预览
- 提取结果处理程序类 - 预览
- Document Understanding ML
- Document Understanding OCR 本地服务器
- Document Understanding
- 智能 OCR
- 发行说明
- 关于“智能 OCR”活动包
- 项目兼容性
- 加载分类
- 将文档数字化
- 分类文档作用域
- 基于关键词的分类器
- Document Understanding 项目分类器
- 智能关键词分类器
- 创建文档分类操作
- 创建文档验证工件
- 检索文档验证工件
- 等待文档分类操作然后继续
- 训练分类器范围
- 基于关键词的分类训练器
- 智能关键词分类训练器
- 数据提取作用域
- Document Understanding 项目提取程序
- Document Understanding 项目提取程序训练器
- 基于正则表达式的提取程序
- 表单提取程序
- 智能表单提取程序
- 文档脱敏
- 创建文档验证操作
- 等待文档验证操作然后继续
- 训练提取程序范围
- 导出提取结果
- 机器学习提取程序
- 机器学习提取程序训练器
- 机器学习分类器
- 机器学习分类训练器
- 生成分类器
- 生成式提取程序
- 配置身份验证
- ML 服务
- OCR
- OCR 合同
- OmniPage
- PDF
- [未公开] Abbyy
- [未列出] Abbyy 嵌入式

Document Understanding 活动
发行说明
3.1.0 - preview
发布日期:2026 年 4 月 1 日
改进
增强型遥测和消耗跟踪
Document Understanding 活动现在包括改进的遥测和消耗跟踪功能。
3.0.0 - 预览
发布日期:2026 年 2 月 25 日
重大变更
- 已删除对“Windows - 旧版”项目的支持。从此版本开始,包仅与 Windows 项目兼容。
- 从此版本开始,升级包时需要验证使用“提取文档数据”活动输出的任何下游处理是否仍在正常运行。IXP 项目返回的数据结构发生了重大变化。因此,强烈建议您验证任何后处理逻辑是否保持兼容。已变更内容:
- 结果现在显示为“字段组” ,而不是“表格” 。
- 现在,值可以正确反映非结构化文档 IXP 项目中定义的字段类型。
- 货币数量现在作为专用字段类型返回。
- 文档验证任务会自动将结果显示为字段组,而不是表格。
- 必须更新数据操作逻辑,以相应地处理字段组值。
新增功能
- 日本发票– 建议用于日本发票文档。提取程序可以处理常见的日语发票布局,并且可以识别和提取关键发票字段,例如供应商信息、发票编号和币种。
- 中国发票- 建议用于中国发票单据。提取程序可以处理常见的中国发票布局,并可以识别和提取关键发票字段,例如供应商信息、发票编号和币种。
- 日本收据- 建议用于日语收据文档。您可以使用提取程序从日语收据中识别和提取商户名称、交易日期、总金额、税和币种等字段。
有关更多信息,请访问提取文档数据。
2.17.4
发布日期:2026 年 3 月 16 日
错误修复
修复了迁移 DU 项目后,分类文档和提取文档数据活动返回“找不到资源”错误的问题。即使您将活动配置为使用标签,它们仍会在内部使用版本号来查找分类器和提取程序。由于版本号在迁移期间会重置,因此活动找不到正确的资源。现在,活动使用配置的标签来查找资源。作为本次修复的一部分,Studio 中这些活动的“项目版本名称”属性不再可见。
已知问题
升级到UiPath.DocumentUnderstanding.Activities版本 2.17.0 或 2.17.4 后如果在 Studio 桌面版中启用“生成数据类型” ,则“提取文档数据”活动可能会引发以下错误: <type> is ambiguous in the namespace <namespace> 。
此问题将在即将发布的 Studio 桌面版中解决。
2.17.0(最新版本)
发布日期:2025 年 10 月 28 日
新增功能
在分类期间对文档中的页面重新排序
为了获得更大的灵活性,使用分类站点时,您现在可以在文档中对页面进行重新排序。要启用此功能,请使用“创建分类验证任务”和“创建分类验证任务并等待”活动中的EnablePageReordering属性。
验证站点精简模式
“验证站点”现可配合新界面一起使用:“紧凑显示模式”。这提供了更多的字段空间,更容易高亮显示需要注意的字段、集中的业务检查部分以及许多其他以验证人为中心的功能。要启用“紧凑模式”,请转到“创建验证任务”或“创建验证任务并等待” 活动,然后将“显示模式” 输入参数设置为“紧凑”。
错误修复
- 修复了在“提取文档数据”活动中选择资产会导致设计时错误的问题
- 修复了与通过分类站点处理文件以及对子文档进行后续数据提取操作相关的许多问题。
已知问题
升级到UiPath.DocumentUnderstanding.Activities版本 2.17.0 或 2.17.4 后如果在 Studio 桌面版中启用“生成数据类型” ,则“提取文档数据”活动可能会引发以下错误: <type> is ambiguous in the namespace <namespace> 。
此问题将在即将发布的 Studio 桌面版中解决。
2026 年 4 月 16 日勘误:由于我们这边的一次意外,此已知问题未在原始公告日提供。
2.16.1
发布日期:2025 年 9 月 11 日
错误修复
修复了导致 Action Center 中的某些操作无效的错误。仅当使用生成式提取程序或外部应用程序配置了提取文档数据活动时,才会发生此问题。
2.16.0
发布日期:2025 年 9 月 11 日
错误修复
我们修复了以下问题:在使用外部应用程序配置在 Document Understanding 新式项目中配置活动时,Studio 显示与租户相关的错误。
已知问题
当使用生成式提取程序或外部应用程序配置“提取文档数据”活动时,Action Center 中的操作将无效。此问题已在版本 2.16.1 中修复。
v2.14.0
发行日期:2025 年 4 月 16 日
按分类的文档类型提取文档数据:根据分类操作的结果使用提取程序
在传统和新式项目中,您现在可以使用提取文档数据活动中的分类文档活动的输出。这使您可以通过识别可以处理为DocumentData.DataType提供的文档类型的提取程序,自动选择要处理的适当提取程序。在提取程序列表中,为建议的提取程序选择“使用分类结果” 。请访问提取文档数据,了解有关使用分类结果选择提取程序的更多信息。
新增功能
使用新的提取程序增强了提取功能
要提供针对某一类文档量身定制的提取功能,您现在可以使用名为“生成式预定义”的专用新式项目类型。此项目类型提供以下提取程序:
- 长文档简单布局– 这是现有的生成式提取程序。
- 长文档复杂布局(预览)– 针对包含图像、手写内容、表单元素或其他复杂布局(例如浮动标注框)的长表单文档进行了优化。适用于此提取程序的文档示例包括:保险单或其他具有复杂布局的类似长文档。
- 短文档复杂布局(预览)– 针对包含图像、手写内容、表单元素或其他复杂布局(如浮动标注框)的短文档进行了优化。例如:身份证或布局复杂的医疗保健登记表。
有关更多信息,请访问提取文档数据。
使用标签和版本引用 Document Understanding 新式项目
为了使用模型的快照,活动和 API 现在允许您在分类和提取期间使用项目的某些版本。“标签”和“版本”属性为使用已发布模型的版本提供了精细控制。有关使用 DocumentUnderstanding.Activities 版本的更多信息,请访问分类文档和提取文档数据。有关在项目中公开版本的信息,请访问文档详细信息。有关用于使用标签和版本的新提供的 API 的信息,请访问发现 API和数字化 API 。
支持本地部署设置中的活动
现在,即使机器人已连接到本地 Orchestrator,您也可以使用“分类文档”和“提取文档数据”活动。在设计时,您可以使用来自不同组织或租户的 Document Understanding 资源。同样,在运行时,您可以在 Studio 中连接到本地 Orchestrator 的同时执行这些活动。
新的“设计时外部连接”和“运行时外部连接”属性允许您在设计时或运行时直接使用外部应用程序凭据或存储在 Orchestrator 中的凭据访问 Document Understanding 资源。
确保所选租户启用了 Document Understanding。如果创建运行时外部连接,请确保同时将 AI Unit 分配给选定的租户。
改进
- 对于“生成式预定义”项目,现有的生成式提取程序现在称为“长文档简单版式提取程序” 。
- 为生成式项目类型选择提取程序时,分类文档和提取文档数据活动中以前的提示词集合已重命名为文档类型详细信息(来自 Document Understanding),它更准确地描述了集合的目的。
- 文档处理工作流的数字化部分现在可以识别并返回包含带引号圈出的值、带下划线的值或划掉的值的文档中的数据。
v2.12.1
发布日期:2024 年 11 月 19 日
错误修复
由于默认超时,长时间运行的分类和提取流程失败。我们现在考虑将活动中设置的所有超时的总和作为所有后台操作的全局超时。此外,我们改进了错误消息,以便在此特定情况下更好地明确失败原因。
v2.4.5
发布日期:2024 年 10 月 21 日
错误修复
此版本解决了“AI Unit 使用概述”仪表板中因数据缺失而显示“未知”部分的问题。
v2.9.6
发布日期:2024 年 10 月 14 日
错误修复
此版本解决了“AI Unit 使用概述”仪表板中因数据缺失而显示“未知”部分的问题。
v2.12.0
发布日期:2024 年 10 月 3 日
新增功能
禁用按需生成文档数据,以增强高级实施的灵活性
现在,您可以使用新的“生成数据类型” 属性更改“提取文档数据” 活动的输出类型。当您将此属性设置为False时,输出类型会从IDocumentData<ExtractorType>更改为IDocumentData<DictionaryData> 。将“生成数据类型”设为Flase可简化检索和更改字段值的过程,并可让您更改“验证站点”中的文档类型。
改进
您现在可以设置 Orchestrator 存储桶,以便与“创建分类验证任务” 和“创建分类验证任务并等待” 活动的“其他选项” 一起使用。如果未创建特定存储桶,则可以创建一个默认存储桶。
错误修复
- 在 Mac 机器人上运行 Studio Web 工作流失败,出现以下异常:“无法加载文件或程序集‘UiPath.DocumentUnderstanding.Common.SDK’”。
- 手动更正文档中的某些数字或日期时,负责创建 Action Center 任务的活动发生崩溃。
- 修复了恢复工作流时 Studio Web 中发生的错误。以前,在首次验证文档分类后会发生此错误,其中涉及从 Microsoft OneDrive 检索文件并在 Action Center 中对其进行验证。
v2.2.6
发布日期:2024 年 10 月 3 日
我们通过将常见依赖项更新为最新版本来提高产品稳定性。 此升级是自动的,不需要您执行任何操作。
v2.9.5
发行日期:2024 年 7 月 31 日
错误修复
尝试在 UiPath TM Apps 中加载附加到实体的文档时,Studio Web 中使用“提取文档数据”活动的工作流不再导致“System.InvalidOperationException”错误。
v2.9.4
发行日期:2024 年 7 月 12 日
错误修复
修复了导致文档分类失败并显示“提供了无效的请求 URI”错误的问题。
v2.9.3
发行日期:2024 年 6 月 20 日
错误修复
手动更正文档中的某些数字或日期时,负责创建 Action Center 任务的活动发生崩溃。
v2.4.3
发行日期:2024 年 6 月 5 日
我们通过将常见依赖项更新为最新版本来提高产品稳定性。 此升级是自动的,不需要您执行任何操作。
v2.9.2
发行日期:2024 年 6 月 5 日
我们通过修改某些依赖项提高了产品稳定性。
v2.9.1
发行日期:2024 年 5 月 27 日
改进
- 提示大小从每个问题 500 个字符增加到 1000 个字符,以提高说明的清晰度。 此外,如果达到每个问题 1000 个字符的提示大小限制,您将收到“超出限制”错误。
- 增强了“提取文档数据”活动的错误消息,使其清晰度更高,调试更容易。
错误修复
- 使用“生成式提取程序”和“生成式分类器”活动后,或手动分配文档类型后,验证站点中的文档类型仍为“未知” 。
v2.9.0
发布日期:2024 年 4 月 29 日
这些发行说明包含 2023 年 11 月至 2024 年 3 月之间进行的所有更新。
如果从 v.2.4.1 之前的版本升级,请确保在升级UiPath.DocumentUnderstanding.Activities包后重新打开工作流。
新增功能
提高提取文档数据的提取置信度
我们改进了“提取文档数据”活动,以提高分数准确性并减少验证时间。此增强功能使用“自动验证”和“置信度阈值”属性,可根据生成模型交叉验证特定模型的提取结果。
请访问提取文档数据,了解如何提高提取的置信度。
分类验证任务
我们很高兴地宣布,您现在可以参加以下活动:
- 创建分类验证任务: 允许您在 Action Center 中创建验证任务。
- 创建分类验证任务并等待: 允许您在 Action Center 中创建验证任务并暂停工作流直至完成。
- 等待分类验证任务然后继续 (可选) :可让您暂停当前工作流的执行,直到指定的文档验证操作完成为止。
改进
- 您现在可以设置 Orchestrator 存储桶,以便与“创建验证任务”活动以及“等待 并 创建验证任务” 活动的“其他选项” 一起使用。如果未创建特定存储桶,则可以创建一个默认存储桶。
- 可选的“超时”属性现在可用于“提取文档数据”和“分类文档”活动。此参数可配置活动的超时时间。
- 现在, “提取文档数据”活动中选定的提取程序将覆盖文档类型。不适用于生成式模型。
- 对于多值字段,系统将在“提取文档数据” 活动的“文档数据” 下返回所有值。这些值可在
DocumentData.Data.FieldName.MultiValues[]中找到。 - 此版本对文档数据对象进行了以下更新:
- “文档类型”属性中的“名称”属性将替换为以下内容:
- 自定义模型的显示名称
- 开箱即用模型的ID
- 添加了两个新属性,并根据 Document Understanding 框架的结果填充:
- ID
- 显示名称
- “文档类型”属性中的“名称”属性将替换为以下内容:
已知限制
当前处于预览阶段的现有 Document Understanding Insights 仪表板不再显示跨平台 DocumentUnderstanding.Activities 包中的数据。 现在,它们仅报告来自 IntelligentOCR.Activities 工作流的数据。
来自跨平台 DocumentUnderstanding.Activities 的数据现在在单独的新 Insights 仪表板中报告。
错误修复
- 创建分类验证任务 活动的 分类结果 输出属性已重命名为 文档数据 。注意:
备注:
如果
CreatedClassificationValidationTask.ClassificationResults属性在当前工作流中,则在升级后将无法使用该属性。 - 创建验证任务 活动的输出属性 提取结果 已重命名为 文档数据( 在本例中为“文档数据”)。注意:
备注:
如果您的工作流使用
CreatedDocumentValidationTask.ExtractionResults属性,则在升级后将无法使用此属性。 - 修复了“等待验证任务,然后继续”活动无法识别
3.1342,7格式的数字,从而导致“输入字符串的格式不正确”错误的问题。现在完全支持所有数字格式。
v2.4.2
发行日期:2024 年 4 月 10 日
错误修复
解决了“提取文档数据”活动在打开时出错,且无法查看该错误的问题,因为该活动未展开。
v2.4.1
发布日期:2023 年 11 月 1 日
生成式功能正式发布
我们很高兴地宣布,UiPath.DocumentUnderstanding.Activities 生成式功能现已正式发布。其中包括以下各项:
- “分类文档”活动
- 提取文档数据活动
新特性和改进功能
macOS 系统现在支持 UiPath.DocumentUnderstanding.Activities 包。
为以下活动添加了新属性“提取的字段验证置信度 (%)”:
- 创建验证任务并等待
- 等待文档验证任务然后继续
v2.4.0
发布日期:2023 年 10 月 11 日
Document Understanding 活动正式发布
我们很高兴地宣布,UiPath.DocumentUnderstanding.Activities 包现已正式发布。
生成式功能仍处于公开预览阶段。
v2.2.4
发布日期:2023 年 9 月 28 日
新特性和改进功能
macOS 系统现在支持 UiPath.DocumentUnderstanding.Activities 包。
v2.2.3
发行日期:2023 年 5 月 11 日
错误修复
- 我们修复了在使用模板时导致“提取文档数据”活动停止加载的错误。
- 我们修复了
ActionCatalog字段不适用于“创建文档验证操作”和“创建验证任务和等待”活动的错误。 - 我们修复了在工作流中使用分类文档活动时导致错误的错误。
v2.2.2
发行日期:2023 年 5 月 11 日
错误修复
我们修复了一个错误,即用户在尝试使用通过“提取文档数据”活动提取的字段的值并且该值不存在时会收到错误。
已知问题
macOS 系统不支持 UiPath.DocumentUnderstanding.Activities 包。
v2.2.1
发行日期:2023 年 5 月 5 日
新特性和改进功能
“提取 PDF 文本”活动是该包中的最新成员,可用于提取指定 PDF 文件中的所有字符,并将其存储在字符串变量中。启用“应用 OCR”选项时,它会使用 OCR 提取信息;禁用时,它会提取原生内容。
已更新两个活动的名称,并已更新一个活动的字段:
- “创建文档验证任务”变为“创建验证任务”。
- “等待文档验证任务然后继续”已变为“等待验证任务然后继续”。
- “设置 PDF 密码”现在提供更详细的字段名称,例如:
- 新的管理密码
- 新的打开密码
- 当前管理密码
- 当前打开密码
- 3.1.0 - preview
- 改进
- 3.0.0 - 预览
- 重大变更
- 新增功能
- 2.17.4
- 错误修复
- 已知问题
- 2.17.0(最新版本)
- 新增功能
- 错误修复
- 已知问题
- 2.16.1
- 错误修复
- 2.16.0
- 错误修复
- 已知问题
- v2.14.0
- 按分类的文档类型提取文档数据:根据分类操作的结果使用提取程序
- 新增功能
- 使用新的提取程序增强了提取功能
- 使用标签和版本引用 Document Understanding 新式项目
- 支持本地部署设置中的活动
- 改进
- v2.12.1
- 错误修复
- v2.4.5
- 错误修复
- v2.9.6
- 错误修复
- v2.12.0
- 新增功能
- 禁用按需生成文档数据,以增强高级实施的灵活性
- 改进
- 错误修复
- v2.2.6
- v2.9.5
- 错误修复
- v2.9.4
- 错误修复
- v2.9.3
- 错误修复
- v2.4.3
- v2.9.2
- v2.9.1
- 改进
- 错误修复
- v2.9.0
- 新增功能
- 改进
- 已知限制
- 错误修复
- v2.4.2
- 错误修复
- v2.4.1
- 生成式功能正式发布
- 新特性和改进功能
- v2.4.0
- Document Understanding 活动正式发布
- v2.2.4
- 新特性和改进功能
- v2.2.3
- 错误修复
- v2.2.2
- 错误修复
- 已知问题
- v2.2.1
- 新特性和改进功能