document-understanding
latest
false
重要 :
新发布内容的本地化可能需要 1-2 周的时间才能完成。
UiPath logo, featuring letters U and I in white

Document Understanding 用户指南

上次更新日期 2025年9月15日

生成式功能

生成式 AI 是 AI 技术的一种形式,它利用机器学习 (ML) 模型创建和生成新的内容、数据或信息。

大多数生成式 AI 任务的关键是大型语言模型 (LLM)。这些是基于大量文本数据进行训练的 ML 模型,旨在生成拟人化文本。LLM 还可以通过拟人化的方式完成句子或段落来理解和回应提示。

生成式标注

Primarily applied during the automatic annotation process of documents in the Build step, these generative models accelerate taxonomy design and help in training models efficiently.

Document Understanding 中的预标注是根据文档类型的架构,使用生成式模型和专用模型的组合来完成的。架构明确定义了要从特定文档类型中提取的字段。

To get a deeper understanding of how Generative Annotation works and how you can use it efficiently in your projects, check the Annotate documents page.

生成式提取

生成式提取是 Document UnderstandingTM 中的一个重要功能,它利用了生成式 AI 模型的强大功能。这些模型使用活动进行配置,主要在运行时用于数据提取。

生成式提取能够从非结构化或半结构化文档中解读和提取特定信息。例如,它可以扫描发票并准确检索详细信息,例如日期、账单金额和公司名称。这样可以从各种类型的文档中快速、高效且高度准确地收集信息。

相关活动

提示:有关如何更有效地使用生成式提取活动的更多信息,请查看“生成式提取程序 - 良好做法”页面。
注意:在公共部门环境中使用 Document Understanding 时,确保您使用的是以下最低活动版本:
  • IntelligentOCR.Activities 6.22 及更高版本
  • DocumentUnderstanding.ML.Activities 1.31.1 及更高版本
有几个活动可以帮助您从生成式提取功能中受益:

您还可以使用 Document Understanding API 来利用生成式提取功能。

支持的型号

生成预定义项目下可用的生成式提取程序可用于下表中描述的文档:
注意:长文档复杂布局和短文档复杂布局提取程序目前在 Automation CloudTM for Public Sector 环境 (FedRamp) 中不可用。
表格 1. 生成式提取程序支持的场景
提取程序推荐场景提供程序区域支持情况多模态支持1
长文档简单布局提取程序建议用于主要包含文本和标题的长文档。 例如,您可以在租赁协议、主服务协议或其他类似文档上使用“长文档简单布局提取程序”。 Azure OpenAI英国、澳大利亚、印度、加拿大不可用
长文档复杂布局提取程序建议用于包含复杂布局(例如图像、手写文字、表单元素)或独特布局(例如浮动标注框)的长文档。您可以将此提取程序用于保单等布局复杂的长文档。 Azure OpenAI美国、欧盟、日本、新加坡available
短文档复杂布局提取程序建议用于包含图像、手写文字、表单元素或复杂布局(例如浮动标注框)的较短文档(最多 20 页)。您可以将此提取程序用于政府身份证件或医疗接诊表等通常内容较短但布局更复杂的文档。 Azure OpenAI美国、欧盟、日本、新加坡available

1 多模式支持是指提取不同类型的数据输入,例如文本、图像、手写文本等的功能。

生成式分类

生成式分类使用 AI 模型在文档上传后立即自动对文档进行分类。

此自动分类流程利用 ML 模型来“读取”文档的内容,了解其上下文,从而将其归入预定义的类别。这样,系统可以高效地处理和组织多种类型的文档。

通过准确分类非结构化或半结构化文档,生成式分类改进了文档处理工作流、节省时间并增强整体文档管理。

相关活动

提示:有关如何更有效地使用生成式分类活动的更多信息,请查看生成式分类器 - 良好实践页面。
注意:在公共部门环境中使用 Document Understanding 时,确保您使用的是以下最低活动版本:
  • IntelligentOCR.Activities 6.22 及更高版本
  • DocumentUnderstanding.ML.Activities 1.31.1 及更高版本
有几项活动可以帮助您从生成式分类功能中受益:

您还可以使用 Document Understanding API 来利用生成式分类功能。

生成式验证

生成式验证是 Document Understanding 中的一个特有功能,在验证过程中扮演着重要角色。此功能主要在提取步骤之后使用,以验证使用专用模型提取的内容的置信度分数。

当 ML 模型的文档提取置信度分数较低时,系统将使用生成式验证来交叉检查输出。此验证流程涉及专用 ML 模型和生成式 ML 模型的协同工作,以确保准确性。

如果两个模型产生相同的输出,则可以绕过人工验证,从而大幅提高验证的时间效率。此流程不仅可以节省文档验证步骤中的宝贵时间,而且可以使用辅助生成模型来交叉验证输出,从而提高模型的准确性,最终提高模型的性能。

相关活动

注意:在公共部门环境中使用 Document Understanding 时,确保您使用的是以下最低活动版本:
  • IntelligentOCR.Activities 6.22 及更高版本
  • DocumentUnderstanding.ML.Activities 1.31.1 及更高版本
有几项活动可以帮助您从生成式验证功能中受益:

您还可以使用 Document Understanding API 来利用生成式验证功能。

  • 生成式标注
  • 生成式提取
  • 相关活动
  • 支持的型号
  • 生成式分类
  • 相关活动
  • 生成式验证
  • 相关活动

此页面有帮助吗?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath Logo
信任与安全
© 2005-2025 UiPath。保留所有权利。