UiPath Documentation
activities
latest
false
重要 :
请注意,此内容已使用机器翻译进行了部分本地化。 新发布内容的本地化可能需要 1-2 周的时间才能完成。
UiPath logo, featuring letters U and I in white

Document Understanding 活动

上次更新日期 2026年4月27日

发行说明

3.1.0 - preview

发布日期:2026 年 4 月 1 日

改进

增强型遥测和消耗跟踪

Document Understanding 活动现在包括改进的遥测和消耗跟踪功能。

3.0.0 - 预览

发布日期:2026 年 2 月 25 日

重大变更

  • 已删除对“Windows - 旧版”项目的支持。从此版本开始,包仅与 Windows 项目兼容。
  • 从此版本开始,升级包时需要验证使用“提取文档数据”活动输出的任何下游处理是否仍在正常运行。IXP 项目返回的数据结构发生了重大变化。因此,强烈建议您验证任何后处理逻辑是否保持兼容。已变更内容:
    • 结果现在显示为“字段组” ,而不是“表格”
    • 现在,值可以正确反映非结构化文档 IXP 项目中定义的字段类型。
    • 货币数量现在作为专用字段类型返回。
    • 文档验证任务会自动将结果显示为字段组,而不是表格。
    • 必须更新数据操作逻辑,以相应地处理字段组值。

新增功能

为了提供针对特定非拉丁语文档布局量身定制的提取功能,您现在可以在“提取文档数据” 活动中使用一种名为“预定义非拉丁语言” 的专用新式项目类型。此项目类型提供以下提取程序:

  • 日本发票– 建议用于日本发票文档。提取程序可以处理常见的日语发票布局,并且可以识别和提取关键发票字段,例如供应商信息、发票编号和币种。
  • 中国发票- 建议用于中国发票单据。提取程序可以处理常见的中国发票布局,并可以识别和提取关键发票字段,例如供应商信息、发票编号和币种。
  • 日本收据- 建议用于日语收据文档。您可以使用提取程序从日语收据中识别和提取商户名称、交易日期、总金额、税和币种等字段。

有关更多信息,请访问提取文档数据

2.17.4

发布日期:2026 年 3 月 16 日

错误修复

修复了迁移 DU 项目后,分类文档和提取文档数据活动返回“找不到资源”错误的问题。即使您将活动配置为使用标签,它们仍会在内部使用版本号来查找分类器和提取程序。由于版本号在迁移期间会重置,因此活动找不到正确的资源。现在,活动使用配置的标签来查找资源。作为本次修复的一部分,Studio 中这些活动的“项目版本名称”属性不再可见。

已知问题

升级到UiPath.DocumentUnderstanding.Activities版本 2.17.0 或 2.17.4 后如果在 Studio 桌面版中启用“生成数据类型” ,则“提取文档数据”活动可能会引发以下错误: <type> is ambiguous in the namespace <namespace>

此问题将在即将发布的 Studio 桌面版中解决。

2.17.0(最新版本)

发布日期:2025 年 10 月 28 日

新增功能

在分类期间对文档中的页面重新排序

为了获得更大的灵活性,使用分类站点时,您现在可以在文档中对页面进行重新排序。要启用此功能,请使用“创建分类验证任务”“创建分类验证任务并等待”活动中的EnablePageReordering属性。

验证站点精简模式

“验证站点”现可配合新界面一起使用:“紧凑显示模式”。这提供了更多的字段空间,更容易高亮显示需要注意的字段、集中的业务检查部分以及许多其他以验证人为中心的功能。要启用“紧凑模式”,请转到“创建验证任务”“创建验证任务并等待” 活动,然后将“显示模式” 输入参数设置为“紧凑”。

错误修复

  • 修复了在“提取文档数据”活动中选择资产会导致设计时错误的问题
  • 修复了与通过分类站点处理文件以及对子文档进行后续数据提取操作相关的许多问题。

已知问题

升级到UiPath.DocumentUnderstanding.Activities版本 2.17.0 或 2.17.4 后如果在 Studio 桌面版中启用“生成数据类型” ,则“提取文档数据”活动可能会引发以下错误: <type> is ambiguous in the namespace <namespace>

此问题将在即将发布的 Studio 桌面版中解决。

2026 年 4 月 16 日勘误:由于我们这边的一次意外,此已知问题未在原始公告日提供。

2.16.1

发布日期:2025 年 9 月 11 日

错误修复

修复了导致 Action Center 中的某些操作无效的错误。仅当使用生成式提取程序或外部应用程序配置了提取文档数据活动时,才会发生此问题。

2.16.0

发布日期:2025 年 9 月 11 日

错误修复

我们修复了以下问题:在使用外部应用程序配置在 Document Understanding 新式项目中配置活动时,Studio 显示与租户相关的错误。

已知问题

当使用生成式提取程序或外部应用程序配置“提取文档数据”活动时,Action Center 中的操作将无效。此问题已在版本 2.16.1 中修复

v2.14.0

发行日期:2025 年 4 月 16 日

按分类的文档类型提取文档数据:根据分类操作的结果使用提取程序

在传统和新式项目中,您现在可以使用提取文档数据活动中的分类文档活动的输出。这使您可以通过识别可以处理为DocumentData.DataType提供的文档类型的提取程序,自动选择要处理的适当提取程序。在提取程序列表中,为建议的提取程序选择“使用分类结果” 。请访问提取文档数据,了解有关使用分类结果选择提取程序的更多信息。

新增功能

使用新的提取程序增强了提取功能

要提供针对某一类文档量身定制的提取功能,您现在可以使用名为“生成式预定义”的专用新式项目类型。此项目类型提供以下提取程序:

  • 长文档简单布局– 这是现有的生成式提取程序。
  • 长文档复杂布局(预览)– 针对包含图像、手写内容、表单元素或其他复杂布局(例如浮动标注框)的长表单文档进行了优化。适用于此提取程序的文档示例包括:保险单或其他具有复杂布局的类似长文档。
  • 短文档复杂布局(预览)– 针对包含图像、手写内容、表单元素或其他复杂布局(如浮动标注框)的短文档进行了优化。例如:身份证或布局复杂的医疗保健登记表。

有关更多信息,请访问提取文档数据

使用标签和版本引用 Document Understanding 新式项目

为了使用模型的快照,活动和 API 现在允许您在分类和提取期间使用项目的某些版本。“标签”“版本”属性为使用已发布模型的版本提供了精细控制。有关使用 DocumentUnderstanding.Activities 版本的更多信息,请访问分类文档提取文档数据。有关在项目中公开版本的信息,请访问文档详细信息。有关用于使用标签和版本的新提供的 API 的信息,请访问发现 API数字化 API

支持本地部署设置中的活动

现在,即使机器人已连接到本地 Orchestrator,您也可以使用“分类文档”“提取文档数据”活动。在设计时,您可以使用来自不同组织或租户的 Document Understanding 资源。同样,在运行时,您可以在 Studio 中连接到本地 Orchestrator 的同时执行这些活动。

新的“设计时外部连接”“运行时外部连接”属性允许您在设计时或运行时直接使用外部应用程序凭据或存储在 Orchestrator 中的凭据访问 Document Understanding 资源。

备注:

确保所选租户启用了 Document Understanding。如果创建运行时外部连接,请确保同时将 AI Unit 分配给选定的租户。

改进

  • 对于“生成式预定义”项目,现有的生成式提取程序现在称为“长文档简单版式提取程序”
  • 为生成式项目类型选择提取程序时,分类文档和提取文档数据活动中以前的提示词集合已重命名为文档类型详细信息(来自 Document Understanding),它更准确地描述了集合的目的。
    • 在更新的“文档类型”详细信息集合中,以前的“生成式提示词”列现在是“指令”“说明”字段表示您要提供的有关应从特定字段名称提取的信息的说明。有关更新的更多信息,请查看“分类文档”“提取文档数据”活动。
  • 文档处理工作流的数字化部分现在可以识别并返回包含带引号圈出的值、带下划线的值或划掉的值的文档中的数据。

v2.12.1

发布日期:2024 年 11 月 19 日

错误修复

由于默认超时,长时间运行的分类和提取流程失败。我们现在考虑将活动中设置的所有超时的总和作为所有后台操作的全局超时。此外,我们改进了错误消息,以便在此特定情况下更好地明确失败原因。

v2.4.5

发布日期:2024 年 10 月 21 日

错误修复

此版本解决了“AI Unit 使用概述”仪表板中因数据缺失而显示“未知”部分的问题。

v2.9.6

发布日期:2024 年 10 月 14 日

错误修复

此版本解决了“AI Unit 使用概述”仪表板中因数据缺失而显示“未知”部分的问题。

v2.12.0

发布日期:2024 年 10 月 3 日

新增功能

禁用按需生成文档数据,以增强高级实施的灵活性

现在,您可以使用新的“生成数据类型” 属性更改“提取文档数据” 活动的输出类型。当您将此属性设置为False时,输出类型会从IDocumentData<ExtractorType>更改为IDocumentData<DictionaryData> 。将“生成数据类型”设为Flase可简化检索和更改字段值的过程,并可让您更改“验证站点”中的文档类型。

访问“提取文档数据”“文档数据”页面,查看如何使用“生成数据类型”属性以及可以使用什么方法来访问提取结果。

改进

您现在可以设置 Orchestrator 存储桶,以便与“创建分类验证任务” 和“创建分类验证任务并等待” 活动的“其他选项” 一起使用。如果未创建特定存储桶,则可以创建一个默认存储桶。

错误修复

  • 在 Mac 机器人上运行 Studio Web 工作流失败,出现以下异常:“无法加载文件或程序集‘UiPath.DocumentUnderstanding.Common.SDK’”。
  • 手动更正文档中的某些数字或日期时,负责创建 Action Center 任务的活动发生崩溃。
  • 修复了恢复工作流时 Studio Web 中发生的错误。以前,在首次验证文档分类后会发生此错误,其中涉及从 Microsoft OneDrive 检索文件并在 Action Center 中对其进行验证。

v2.2.6

发布日期:2024 年 10 月 3 日

我们通过将常见依赖项更新为最新版本来提高产品稳定性。 此升级是自动的,不需要您执行任何操作。

v2.9.5

发行日期:2024 年 7 月 31 日

错误修复

尝试在 UiPath TM Apps 中加载附加到实体的文档时,Studio Web 中使用“提取文档数据”活动的工作流不再导致“System.InvalidOperationException”错误。

v2.9.4

发行日期:2024 年 7 月 12 日

错误修复

修复了导致文档分类失败并显示“提供了无效的请求 URI”错误的问题。

v2.9.3

发行日期:2024 年 6 月 20 日

错误修复

手动更正文档中的某些数字或日期时,负责创建 Action Center 任务的活动发生崩溃。

v2.4.3

发行日期:2024 年 6 月 5 日

我们通过将常见依赖项更新为最新版本来提高产品稳定性。 此升级是自动的,不需要您执行任何操作。

v2.9.2

发行日期:2024 年 6 月 5 日

我们通过修改某些依赖项提高了产品稳定性。

v2.9.1

发行日期:2024 年 5 月 27 日

改进

  • 提示大小从每个问题 500 个字符增加到 1000 个字符,以提高说明的清晰度。 此外,如果达到每个问题 1000 个字符的提示大小限制,您将收到“超出限制”错误。
  • 增强了“提取文档数据”活动的错误消息,使其清晰度更高,调试更容易。

错误修复

  • 使用“生成式提取程序”和“生成式分类器”活动后,或手动分配文档类型后,验证站点中的文档类型仍为“未知”

v2.9.0

发布日期:2024 年 4 月 29 日

这些发行说明包含 2023 年 11 月至 2024 年 3 月之间进行的所有更新。

备注:

如果从 v.2.4.1 之前的版本升级,请确保在升级UiPath.DocumentUnderstanding.Activities包后重新打开工作流。

新增功能

提高提取文档数据的提取置信度

我们改进了“提取文档数据”活动,以提高分数准确性并减少验证时间。此增强功能使用“自动验证”“置信度阈值”属性,可根据生成模型交叉验证特定模型的提取结果。

请访问提取文档数据,了解如何提高提取的置信度。

分类验证任务

我们很高兴地宣布,您现在可以参加以下活动:

改进

  • 您现在可以设置 Orchestrator 存储桶,以便与“创建验证任务”活动以及“等待 创建验证任务” 活动的“其他选项” 一起使用。如果未创建特定存储桶,则可以创建一个默认存储桶。
  • 可选的“超时”属性现在可用于“提取文档数据”“分类文档”活动。此参数可配置活动的超时时间。
  • 现在, “提取文档数据”活动中选定的提取程序将覆盖文档类型。不适用于生成式模型。
  • 对于多值字段,系统将在“提取文档数据” 活动的“文档数据” 下返回所有值。这些值可在DocumentData.Data.FieldName.MultiValues[]中找到。
  • 此版本对文档数据对象进行了以下更新:
    • “文档类型”属性中的“名称”属性将替换为以下内容:
      • 自定义模型的显示名称
      • 开箱即用模型的ID
    • 添加了两个新属性,并根据 Document Understanding 框架的结果填充:
      • ID
      • 显示名称

已知限制

当前处于预览阶段的现有 Document Understanding Insights 仪表板不再显示跨平台 DocumentUnderstanding.Activities 包中的数据。 现在,它们仅报告来自 IntelligentOCR.Activities 工作流的数据。

来自跨平台 DocumentUnderstanding.Activities 的数据现在在单独的新 Insights 仪表板中报告。

错误修复

  • 创建分类验证任务 活动的 分类结果 输出属性已重命名为 文档数据 。注意:
    备注:

    如果CreatedClassificationValidationTask.ClassificationResults属性在当前工作流中,则在升级后将无法使用该属性。

  • 创建验证任务 活动的输出属性 提取结果 已重命名为 文档数据( 在本例中为“文档数据”)。注意:
    备注:

    如果您的工作流使用CreatedDocumentValidationTask.ExtractionResults属性,则在升级后将无法使用此属性。

  • 修复了“等待验证任务,然后继续”活动无法识别3.1342,7格式的数字,从而导致“输入字符串的格式不正确”错误的问题。现在完全支持所有数字格式。

v2.4.2

发行日期:2024 年 4 月 10 日

错误修复

解决了“提取文档数据”活动在打开时出错,且无法查看该错误的问题,因为该活动未展开。

v2.4.1

发布日期:2023 年 11 月 1 日

生成式功能正式发布

我们很高兴地宣布,UiPath.DocumentUnderstanding.Activities 生成式功能现已正式发布。其中包括以下各项:

  • “分类文档”活动
  • 提取文档数据活动

新特性和改进功能

macOS 系统现在支持 UiPath.DocumentUnderstanding.Activities 包。

为以下活动添加了新属性“提取的字段验证置信度 (%)”:

  • 创建验证任务并等待
  • 等待文档验证任务然后继续

v2.4.0

发布日期:2023 年 10 月 11 日

Document Understanding 活动正式发布

我们很高兴地宣布,UiPath.DocumentUnderstanding.Activities 包现已正式发布。

备注:

生成式功能仍处于公开预览阶段。

v2.2.4

发布日期:2023 年 9 月 28 日

新特性和改进功能

macOS 系统现在支持 UiPath.DocumentUnderstanding.Activities 包。

v2.2.3

发行日期:2023 年 5 月 11 日

错误修复

  • 我们修复了在使用模板时导致“提取文档数据”活动停止加载的错误。
  • 我们修复了ActionCatalog字段不适用于“创建文档验证操作”“创建验证任务和等待”活动的错误。
  • 我们修复了在工作流中使用分类文档活动时导致错误的错误。

v2.2.2

发行日期:2023 年 5 月 11 日

错误修复

我们修复了一个错误,即用户在尝试使用通过“提取文档数据”活动提取的字段的值并且该值不存在时会收到错误。

已知问题

macOS 系统不支持 UiPath.DocumentUnderstanding.Activities 包。

v2.2.1

发行日期:2023 年 5 月 5 日

新特性和改进功能

“提取 PDF 文本”活动是该包中的最新成员,可用于提取指定 PDF 文件中的所有字符,并将其存储在字符串变量中。启用“应用 OCR”选项时,它会使用 OCR 提取信息;禁用时,它会提取原生内容。

已更新两个活动的名称,并已更新一个活动的字段:

  • “创建文档验证任务”变为“创建验证任务”。
  • “等待文档验证任务然后继续”已变为“等待验证任务然后继续”。
  • “设置 PDF 密码”现在提供更详细的字段名称,例如:
    • 新的管理密码
    • 新的打开密码
    • 当前管理密码
    • 当前打开密码

此页面有帮助吗?

连接

需要帮助? 支持

想要了解详细内容? UiPath Academy

有问题? UiPath 论坛

保持更新