- 概述
- 入门指南
- 构建模型
- 使用模型
- ML 包
- 公共端点
- 1040 - 文档类型
- 1040 计划 C - 文档类型
- 1040 计划 D - 文档类型
- 1040 计划 E - 文档类型
- 1040x - 文档类型
- 3949a - 文档类型
- 4506T - 文档类型
- 709 - 文档类型
- 941x - 文档类型
- 9465 - 文档类型
- ACORD125 - 文档类型
- ACORD126 - 文档类型
- ACORD131 - 文档类型
- ACORD140 - 文档类型
- ACORD25 - 文档类型
- 银行对账单 - 文档类型
- 提单 - 文档类型
- 公司注册证书 - 文档类型
- 原产地证书 - 文档类型
- 支票 - 文档类型
- 儿童产品证书 - 文档类型
- CMS 1500 - 文档类型
- 欧盟符合性声明 - 文档类型
- 财务报表 - 文档类型
- FM1003 - 文档类型
- I9 - 文档类型
- 身份证 - 文档类型
- 发票 - 文档类型
- 发票 2 - 文档类型
- 澳大利亚发票 - 文档类型
- 发票中国 - 文档类型
- 希伯来语发票 - 文档类型
- 发票印度 - 文档类型
- 日本发票 - 文档类别
- 发票运输 - 文档类型
- 装箱单列表 - 文档类型
- 工资单 - 文档类型
- 护照 - 文档类型
- 采购订单 - 文档类型
- 收据 - 文档类型
- 收据 2 - 文档类型
- 日本收据 - 文档类型
- 汇款通知书 - 文档类型
- UB04 - 文档类型
- 美国抵押贷款平交披露 - 文档类型
- 公用事业账单 - 文档类型
- 车辆标题 - 文档类型
- W2 - 文档类型
- W9 - 文档类型
- 支持的语言
- 数据与安全性
- 许可和计费逻辑
- 如何
- 故障排除

Document Understanding 用户指南
生成式 AI 是 AI 技术的一种形式,它利用机器学习 (ML) 模型创建和生成新的内容、数据或信息。
大多数生成式 AI 任务的关键是大型语言模型 (LLM)。这些是基于大量文本数据进行训练的 ML 模型,旨在生成拟人化文本。LLM 还可以通过拟人化的方式完成句子或段落来理解和回应提示。
Primarily applied during the automatic annotation process of documents in the Build step, these generative models accelerate taxonomy design and help in training models efficiently.
Document Understanding 中的预标注是根据文档类型的架构,使用生成式模型和专用模型的组合来完成的。架构明确定义了要从特定文档类型中提取的字段。
To get a deeper understanding of how Generative Annotation works and how you can use it efficiently in your projects, check the Annotate documents page.
生成式提取是 Document UnderstandingTM 中的一个重要功能,它利用了生成式 AI 模型的强大功能。这些模型使用活动进行配置,主要在运行时用于数据提取。
生成式提取能够从非结构化或半结构化文档中解读和提取特定信息。例如,它可以扫描发票并准确检索详细信息,例如日期、账单金额和公司名称。这样可以从各种类型的文档中快速、高效且高度准确地收集信息。
相关活动
- IntelligentOCR.Activities 6.22 及更高版本
- DocumentUnderstanding.ML.Activities 1.31.1 及更高版本
您还可以使用 Document Understanding API 来利用生成式提取功能。
支持的型号
提取程序 | 推荐场景 | 提供程序 | 区域支持情况 | 多模态支持1 |
---|---|---|---|---|
长文档简单布局提取程序 | 建议用于主要包含文本和标题的长文档。 例如,您可以在租赁协议、主服务协议或其他类似文档上使用“长文档简单布局提取程序”。 | Azure OpenAI | 英国、澳大利亚、印度、加拿大 | |
长文档复杂布局提取程序 | 建议用于包含复杂布局(例如图像、手写文字、表单元素)或独特布局(例如浮动标注框)的长文档。您可以将此提取程序用于保单等布局复杂的长文档。 | Azure OpenAI | 美国、欧盟、日本、新加坡 | |
短文档复杂布局提取程序 | 建议用于包含图像、手写文字、表单元素或复杂布局(例如浮动标注框)的较短文档(最多 20 页)。您可以将此提取程序用于政府身份证件或医疗接诊表等通常内容较短但布局更复杂的文档。 | Azure OpenAI | 美国、欧盟、日本、新加坡 |
1 多模式支持是指提取不同类型的数据输入,例如文本、图像、手写文本等的功能。
生成式分类使用 AI 模型在文档上传后立即自动对文档进行分类。
此自动分类流程利用 ML 模型来“读取”文档的内容,了解其上下文,从而将其归入预定义的类别。这样,系统可以高效地处理和组织多种类型的文档。
通过准确分类非结构化或半结构化文档,生成式分类改进了文档处理工作流、节省时间并增强整体文档管理。
相关活动
- IntelligentOCR.Activities 6.22 及更高版本
- DocumentUnderstanding.ML.Activities 1.31.1 及更高版本
您还可以使用 Document Understanding API 来利用生成式分类功能。
生成式验证是 Document Understanding 中的一个特有功能,在验证过程中扮演着重要角色。此功能主要在提取步骤之后使用,以验证使用专用模型提取的内容的置信度分数。
当 ML 模型的文档提取置信度分数较低时,系统将使用生成式验证来交叉检查输出。此验证流程涉及专用 ML 模型和生成式 ML 模型的协同工作,以确保准确性。
如果两个模型产生相同的输出,则可以绕过人工验证,从而大幅提高验证的时间效率。此流程不仅可以节省文档验证步骤中的宝贵时间,而且可以使用辅助生成模型来交叉验证输出,从而提高模型的准确性,最终提高模型的性能。
相关活动
- IntelligentOCR.Activities 6.22 及更高版本
- DocumentUnderstanding.ML.Activities 1.31.1 及更高版本
您还可以使用 Document Understanding API 来利用生成式验证功能。