- 概述
- 入门指南
- 构建模型
- 使用模型
- 模型详细信息
- Public endpoints for Automation Cloud and Test Cloud
- Public endpoints for Automation Cloud and Test Cloud Public Sector
- 1040 - 文档类型
- 1040 计划 C - 文档类型
- 1040 计划 D - 文档类型
- 1040 计划 E - 文档类型
- 1040x - 文档类型
- 3949a - 文档类型
- 4506T - 文档类型
- 709 - 文档类型
- 941x - 文档类型
- 9465 - 文档类型
- ACORD125 - 文档类型
- ACORD126 - 文档类型
- ACORD131 - 文档类型
- ACORD140 - 文档类型
- ACORD25 - 文档类型
- 银行对账单 - 文档类型
- 提单 - 文档类型
- 公司注册证书 - 文档类型
- 原产地证书 - 文档类型
- 支票 - 文档类型
- 儿童产品证书 - 文档类型
- CMS 1500 - 文档类型
- 欧盟符合性声明 - 文档类型
- 财务报表 - 文档类型
- FM1003 - 文档类型
- I9 - 文档类型
- 身份证 - 文档类型
- 发票 - 文档类型
- 发票 2 - 文档类型
- 澳大利亚发票 - 文档类型
- 发票中国 - 文档类型
- 希伯来语发票 - 文档类型
- 发票印度 - 文档类型
- 日本发票 - 文档类别
- 发票运输 - 文档类型
- 装箱单列表 - 文档类型
- 工资单 - 文档类型
- 护照 - 文档类型
- 采购订单 - 文档类型
- 收据 - 文档类型
- 收据 2 - 文档类型
- 日本收据 - 文档类型
- 汇款通知书 - 文档类型
- UB04 - 文档类型
- 美国抵押贷款平交披露 - 文档类型
- 公用事业账单 - 文档类型
- 车辆标题 - 文档类型
- W2 - 文档类型
- W9 - 文档类型
- 支持的语言
- Insights 仪表板
- 数据与安全性
- 日志记录
- 许可
- 如何
- 故障排除

Document Understanding 用户指南
关键概念
Familiarize yourself with the core concepts around UiPath® Document UnderstandingTM.
主动学习
Active learning is our modern approach to creating models for Document UnderstandingTM.
主动学习提供了一种交互式体验,其中学习算法可以查询用户,以使用所需的输出标记数据。此流程有助于将训练机器学习模型所需的时间和数据减少多达 80%。AI 用于指导流程,其中包括自动标注,这通常是最耗时的任务。该模型还使用内容丰富的数据集提供专家建议,以提高准确性。
Figure 1. How does Active Learning work 
使用主动学习,您还可以通过分析功能监控自动化。
文档类型
文档类型是指根据文档的内容、格式、目的或其他区别因素对文档进行的分类。相关示例包括发票、收据、合同、报告、医疗记录、法律文档等。
某些文档类型具有高度结构化的内容,而其他文档类型则主要包含自由文本。基于此,文档分为三种主要格式:
- Structured: documents designed to collect information in a specific format. For example, surveys, tax forms, passports, or licenses are all structured documents.
- Semi-structured: documents that do not follow a strict format and are not bound to specified data fields. Semi-structured documents include invoices, receipts, uility bills, bank statements, and others.
- Unstructured: documents that do not follow a specific or organized model. For example, contracts, leases, or news articles are all unstructured documents.
To learn more about document types, check the Document types section.
生成式 AI
Feature availability depends on the cloud platform that you use. For details, refer to the Choosing the deployment type page.
生成式 AI 是 AI 技术的一种形式,它利用机器学习 (ML) 模型创建和生成新的内容、数据或信息。
大多数生成式 AI 任务的关键是大型语言模型 (LLM)。这些是基于大量文本数据进行训练的 ML 模型,旨在生成拟人化文本。LLM 还可以通过拟人化的方式完成句子或段落来理解和回应提示。
In the context of Document UnderstandingTM, generative AI helps with:
- Information extraction: generative AI models can be used to extract specific information from unstructured or semi-structured documents. For example, it can go through an invoice to retrieve details like date, billed amount, and company name.
- Document classification: ML models are used to auto-categorize documents based on their content. These algorithms 'read' the document, understand its context, and can classify it into predefined categories.
- Data validation: generative AI can check the output of the ML model whenever the confidence score is too low. If both the ML models (generative and specialized) have the same output, a human can skip validating that document. This can improve time spending validating documents, as well as improving the performing of your models by checking the output with the help of a second generative model.
ML 模型
ML 模型就像虚拟助理,经过训练,可以从数据中学习并做出预测或决策。这些模型本质上是学习根据历史数据识别模式的算法。它们接触的数据越多,随着时间推移,就越能改进自己的预测或决策。
You can find several out of the box ML models in Document UnderstandingTM. These models help you classify and extract any commonly occurring data points from semi-structured or unstructured documents, with no setup required.
Check the Pre-trained document types page for the full list of pre-trained models and their fields.
只要 OCR 能够以高置信度识别文档和文本,就可以在大多数语言上训练 ML 模型。
光学字符识别
光学字符识别 (OCR) 是一种特殊技术,用于将不同类型的文档(例如扫描的纸质文档、PDF 文件或数码相机拍摄的图像)转换为可编辑和可搜索的数据。
OCR 引擎的准确性通常取决于原始文档的质量。采用可读字体的清晰且格式良好的文本通常会产生最佳输出。
For more information on the languages supported by the OCR engines options provided by UiPath®, check the OCR Supported Languages page.