document-understanding
latest
false
  • Document Understanding 发行说明
  • ML 包和公共端点发行说明
    • 常规 ML 包和公共端点更新
    • ML 包和公共端点版本历史记录
重要 :
新发布内容的本地化可能需要 1-2 周的时间才能完成。
UiPath logo, featuring letters U and I in white

Document Understanding 发行说明

上次更新日期 2025年10月1日

常规 ML 包和公共端点更新

UiPath DocPath 公共端点改进

发布日期:2025 年 8 月 14 日

新增功能

我们很高兴宣布,基于欧洲地区 UiPath DocPath 的公共端点现已实现精度提升。

此次发布后,下列模型也已基于欧洲地区的 UiPath DocPath 运行:
  • 9465
  • 中国发票
  • 希伯来语发票
  • 日本发票
  • 日本收据

此次新增后,财务报表外,所有模型现均已基于欧洲区域的 UiPath DocPath 运行。

新的文档类型

此版本引入了以下新的文档类型:
  • 发票 2:此文档类型经过训练,可从各种发票类型中提取关键数据点,包括标准发票、贷方票据、印度发票和运输发票。 增强的架构由 55 个常规字段、两个结构化表(一个用于行项目(13 列),一个用于银行支付详情(9 列))以及一个货币分类器组成。
  • 收据 2:此文档类型经过训练,可从各种收据类型中提取关键数据点,包括但不限于停车收据、火车票、酒店账单、机场购物、膳食、药房收据、电子收据等。 增强的架构由 60 个常规字段和一个包含 6 个列的结构化表组成。
  • 美国抵押贷款结算披露:此文档类型经过训练,可从标准美国抵押贷款结算披露表中提取关键数据点。 架构包括 20 个常规字段,用于捕获借款人详细信息、房产信息、贷款条款、交易摘要以及现金结算金额。

增强的字符识别功能

发布说明:2025 年 6 月 23 日

此更新对我们的光学字符识别 (OCR) 引擎进行了一系列改进,旨在提高更广泛输入样式的准确性和可靠性:

  • 增强了手写检测功能。

  • 增强等宽字体中“O”和“0”的区分度。

  • 改进了对点矩阵打印文本的识别。

这些改进提高了各种文档类型的可靠性。

通过 API 和活动可用的日本收据文档类型

发布说明:2025 年 5 月 19 日

您现在可以通过 API、IntelligentOCR 以及 Document Understanding 活动使用日本收据 (Receipts Japan) 文档类型。这适用于日本地区的所有租户。

移除版本低于 2023.4 的开箱即用模型

发布日期:2025 年 4 月 11 日

移除版本低于 2023.4 的开箱即用模型

随着新型替代方案和升级解决方案的发布,我们移除了对开箱即用模型的支持,包括 UiPath Document Understanding OCR 与 OCR_CPU、数据提取 ML 包以及文档分类器。

下表详细说明了移除计划。

特性或功能移除公布日期移除日期:注意
早于 2023.4 的开箱即用 ML 包2025 年 4 月2025 年 4 月我们建议使用最新版本的开箱即用 ML 包。

有关弃用的更多信息,请查看概述指南中的弃用时间线

UiPath Document OCR 公共端点发布版本

发布日期:2025 年 3 月 19 日

改进

  • 整体复选框、手写和打印文本检测得到改进。
  • 手写识别准确性得到了提升。
  • 针对日本印章的印章检测功能得到改进。
  • 边界框的大小和定位准确性得到了改进。

UiPath DocPath 公共端点版本

发布日期:2024 年 11 月 28 日

新的文档类型

此版本引入了一种新的文档类型:日本收据 (Receipts Japan)。这个新的公共端点可以从各种文档类型中提取关键详细信息,例如常规收银机收据、餐厅收据、旅馆收据、火车收据、停车收据以及其他类型的日语收据等。

基于 UiPath DocPath 的中国发票和日本发票的公共端点

我们很高兴宣布发布改进的中国发票日本发票端点。基于新的 UiPath LLM,即 UiPath DocPath 的新生成端点提高了准确性和性能。

日本发票改进

我们对“日本发票”公共端点进行了重大改进,添加了新字段,例如:
  • 常规字段:
    • 净减少额
    • 已扣税额
    • 未减少净额
    • 未扣税额
    • 预扣税额
    • 存款
  • 列字段:
    • 项目税率
    • 项目注册税
    • 项目费用

发布日本发票公共端点

发布日期:2024 年 10 月 29 日

在“日本发票”端点中发布

改进

我们对文档数字化流程进行了重大改进。现在,当使用 UiPath 扩展语言 OCR 或中文、韩语、日语 OCR 时,输出将是常规字词框,而不是单个字符。

发布新的日本发票公共端点

发布日期:2024 年 10 月 15 日

在“日本发票”端点中发布

改进

  • 提高了日本发票 ML 包的准确性。
  • 当中文、日语或韩语字符在文档中与拉丁字符、标点符号和数字混合使用时,我们增强了间距和字词分析。
  • 我们修复了一个问题,该问题导致 AI Center 训练管道不正确地为 ID NumberPhone Number 字段类型报告高分。这可确保报告的分数与实际分数相符。

UiPath 扩展语言 OCR 正式发布

发布日期:2024 年 10 月 3 日

我们很高兴宣布,UiPath 最新的 OCR 引擎UiPath 扩展语言 OCR现已正式发布。新版 OCR 能够将 200 多个语言的文档数字化,与前身相比有显著改进,尤其是在中文、日语和韩语方面。此外,它可以处理泰语、越南语、印度的所有主要语言以及使用西里尔字母的语言和希腊语的文档。

UiPath 扩展语言 OCR 当前仅可用作公共端点。

基于 UiPath™ DocPath 的新公共端点

发布日期:2024 年 9 月 17 日

UiPath DocPath 上改进的性能和加入的新模型端点

此版本提高了基于 UiPath DocPath(新的 UiPath LLM)的模型的准确性和性能。此外,以下模型现在也基于 UiPath DocPath:

  • 709
  • 941x
  • 1040x
  • 3949
  • 3949a

模型端点重定向到旧一代

由于性能问题,系统已将财务报表模型端点重定向到旧一代。

预览模型已删除

已从公共端点和数据提取 ML 包中删除 990(预览版)模型。

弃用 UiPath 中文、日语、韩语 OCR

发行日期:2024 年 7 月 8 日

自 2025 年 1 月起,我们将弃用 UiPath 中文、日语、韩语 OCR。我们建议改用 UiPath 扩展语言 OCR

查看“弃用时间线”页面,详细了解即将弃用和删除的内容。

基于 UiPath™ DocPath 的发票和收据公共端点

发布日期:2024 年 6 月 12 日

我们很高兴宣布发布改进的发票收据端点。基于新的 UiPath LLM,即 UiPath DocPath 的新生成功能提高了准确性和性能。

我们将逐步将模型替换为更新一代的模型。目前,所有公共端点都基于 DocPath,但以下端点除外
  • 709
  • 941x
  • 1040x
  • 3949a
  • 9465
  • 中国发票
  • 希伯来语发票
  • 日本发票

查看发行说明,以了解未来的公告。

基于 DocPath 的公共端点

发行日期:2024 年 5 月 29 日

我们很高兴宣布将发布改进的端点,用于开箱即用的预训练 ML 包。基于新的 UiPath™ LLM,即 UiPath DocPath 的新生成功能提高了准确性和性能。

我们将逐步将模型替换为更新一代的模型。目前,所有公共端点都基于 DocPath,但以下端点除外
  • 709
  • 941x
  • 1040x
  • 3949a
  • 9465
  • 发票
  • 中国发票
  • 希伯来语发票
  • 日本发票
  • 收据

查看发行说明,以了解未来的公告。

UiPath 扩展语言 OCR(公共预览版)

发行日期:2024 年 3 月 28 日

我们很高兴宣布,UiPath 最新 OCR 引擎 UiPath 扩展语言 OCR 现已推出公开预览版。新版 OCR 能够将 200 多个语言的文档数字化,与前身相比有显著改进,尤其是在中文、日语和韩语方面。此外,它可以处理泰语、越南语、印度的所有主要语言以及使用西里尔字母的语言和希腊语的文档。

UiPath 扩展语言 OCR 当前仅可用作公共端点。

冻结的主干训练

发行日期:2023 年 4 月 27 日

ML 包版本 v23.4 及更高版本现在拥有使用冻结主干进行训练的选项。对于 400 页以下的小型或低多样性训练集,这种新方法的训练速度更快,并且效果更好。您可以使用官方文档中记录的新训练管道环境变量覆盖此行为。

已弃用澳大利亚发票

发布日期:2022 年 11 月 29 日

我们宣布即将弃用澳大利亚发票预训练 ML 包。我们建议改用发票 ML 包。您可以在此处找到更多相关详细信息。

ML 分类端点公开预览

发行日期:2022 年 6 月 27 日

在端点中发布

ML 分类端点现已在公开预览中提供。

UiPath 中文、日语、韩语 OCR 版本

端点

发行日期:2022 年 6 月 20 日

在端点中发布

UiPath 中文、日语、韩语 OCR 公共端点已正式发布。

数据提取 ML 包

发行日期:2022 年 6 月 6 日

在 AI Center Cloud 中发布,适用于数据提取 ML 包

新的 OCR 方法,即 UiPath 中文、日语、韩语 OCR,现在可用,并且只能应用于 Document Understanding (Cloud) 中的新项目或已创建的项目。

此页面有帮助吗?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath Logo
信任与安全
© 2005-2025 UiPath。保留所有权利。