- Document Understanding 发行说明
- ML 包和公共端点发行说明
- 常规 ML 包和公共端点更新
- ML 包和公共端点版本历史记录

Document Understanding 发行说明
Release date: December 4, 2025
改进
Added support for Hawaiian diacritics to improve recognition accuracy in documents containing Hawaiian-language text.
发布日期:2025 年 11 月 7 日
新增功能
- Public endpoints for extraction models in the United States, with the exception of Financial Statements, are now based on DocPath.
- Public endpoints for the United States now include Receipts2, Invoices2, Receipts Japan, and US Mortgage Closing Disclosures. For more information, go to the Public endpoints documentation and expand the table for a full, scrollable list. We recommend you make sure your activity is connected to the correct endpoint according to each server region.
新增功能
- Public endpoints for extraction models in Japan, with the exception of Financial Statements, are now based on DocPath.
- Public endpoints for Japan now include Receipts2, Invoices2, and US Mortgage Closing Disclosures. For more information, go to the Public endpoints documentation and expand the table for a full, scrollable list. We recommend you make sure your activity is connected to the correct endpoint according to each server region.
发布日期:2025 年 8 月 14 日
新增功能
我们很高兴宣布,基于欧洲地区 UiPath DocPath 的公共端点现已实现精度提升。
- 9465
- 中国发票
- 希伯来语发票
- 日本发票
- 日本收据
此次新增后,除财务报表外,所有模型现均已基于欧洲区域的 UiPath DocPath 运行。
新的文档类型
- 发票 2:此文档类型经过训练,可从各种发票类型中提取关键数据点,包括标准发票、贷方票据、印度发票和运输发票。 增强的架构由 55 个常规字段、两个结构化表(一个用于行项目(13 列),一个用于银行支付详情(9 列))以及一个货币分类器组成。
- 收据 2:此文档类型经过训练,可从各种收据类型中提取关键数据点,包括但不限于停车收据、火车票、酒店账单、机场购物、膳食、药房收据、电子收据等。 增强的架构由 60 个常规字段和一个包含 6 个列的结构化表组成。
- 美国抵押贷款结算披露:此文档类型经过训练,可从标准美国抵押贷款结算披露表中提取关键数据点。 架构包括 20 个常规字段,用于捕获借款人详细信息、房产信息、贷款条款、交易摘要以及现金结算金额。
Release notes: June 23, 2025
此更新对我们的光学字符识别 (OCR) 引擎进行了一系列改进,旨在提高更广泛输入样式的准确性和可靠性:
-
增强了手写检测功能。
-
增强等宽字体中“O”和“0”的区分度。
-
改进了对点矩阵打印文本的识别。
这些改进提高了各种文档类型的可靠性。
Release notes: May 19, 2025
您现在可以通过 API、IntelligentOCR 以及 Document Understanding 活动使用日本收据 (Receipts Japan) 文档类型。这适用于日本地区的所有租户。
Release date: April 11, 2025
移除版本低于 2023.4 的开箱即用模型
随着新型替代方案和升级解决方案的发布,我们移除了对开箱即用模型的支持,包括 UiPath Document Understanding OCR 与 OCR_CPU、数据提取 ML 包以及文档分类器。
下表详细说明了移除计划。
| 特性或功能 | 移除公布日期 | 移除日期: | 注意 |
|---|---|---|---|
| 早于 2023.4 的开箱即用 ML 包 | 2025 年 4 月 | 2025 年 4 月 | 我们建议使用最新版本的开箱即用 ML 包。 |
有关弃用的更多信息,请查看概述指南中的弃用时间线。
发布日期:2025 年 3 月 19 日
改进
- 整体复选框、手写和打印文本检测得到改进。
- 手写识别准确性得到了提升。
- 针对日本印章的印章检测功能得到改进。
- 边界框的大小和定位准确性得到了改进。
发布日期:2024 年 11 月 28 日
新的文档类型
此版本引入了一种新的文档类型:日本收据 (Receipts Japan)。这个新的公共端点可以从各种文档类型中提取关键详细信息,例如常规收银机收据、餐厅收据、旅馆收据、火车收据、停车收据以及其他类型的日语收据等。
基于 UiPath DocPath 的中国发票和日本发票的公共端点
我们很高兴宣布发布改进的中国发票和日本发票端点。基于新的 UiPath LLM,即 UiPath DocPath 的新生成端点提高了准确性和性能。
日本发票改进
- 常规字段:
- 净减少额
- 已扣税额
- 未减少净额
- 未扣税额
- 预扣税额
- 存款
- 列字段:
- 项目税率
- 项目注册税
- 项目费用
发布日期:2024 年 10 月 29 日
在“日本发票”端点中发布
改进
我们对文档数字化流程进行了重大改进。现在,当使用 UiPath 扩展语言 OCR 或中文、韩语、日语 OCR 时,输出将是常规字词框,而不是单个字符。
发布日期:2024 年 10 月 15 日
在“日本发票”端点中发布
改进
- 提高了日本发票 ML 包的准确性。
- 当中文、日语或韩语字符在文档中与拉丁字符、标点符号和数字混合使用时,我们增强了间距和字词分析。
- 我们修复了一个问题,该问题导致 AI Center 训练管道不正确地为
ID Number和Phone Number字段类型报告高分。这可确保报告的分数与实际分数相符。
发布日期:2024 年 10 月 3 日
我们很高兴宣布,UiPath 最新的 OCR 引擎UiPath 扩展语言 OCR现已正式发布。新版 OCR 能够将 200 多个语言的文档数字化,与前身相比有显著改进,尤其是在中文、日语和韩语方面。此外,它可以处理泰语、越南语、印度的所有主要语言以及使用西里尔字母的语言和希腊语的文档。
UiPath 扩展语言 OCR 当前仅可用作公共端点。
发布日期:2024 年 9 月 17 日
UiPath DocPath 上改进的性能和加入的新模型端点
此版本提高了基于 UiPath DocPath(新的 UiPath LLM)的模型的准确性和性能。此外,以下模型现在也基于 UiPath DocPath:
- 709
- 941x
- 1040x
- 3949
- 3949a
模型端点重定向到旧一代
由于性能问题,系统已将财务报表模型端点重定向到旧一代。
预览模型已删除
已从公共端点和数据提取 ML 包中删除 990(预览版)模型。
发行日期:2024 年 7 月 8 日
自 2025 年 1 月起,我们将弃用 UiPath 中文、日语、韩语 OCR。我们建议改用 UiPath 扩展语言 OCR。
查看“弃用时间线”页面,详细了解即将弃用和删除的内容。
发布日期:2024 年 6 月 12 日
我们很高兴宣布发布改进的发票和收据端点。基于新的 UiPath LLM,即 UiPath DocPath 的新生成功能提高了准确性和性能。
- 709
- 941x
- 1040x
- 3949a
- 9465
- 中国发票
- 希伯来语发票
- 日本发票
查看发行说明,以了解未来的公告。
发行日期:2024 年 5 月 29 日
我们很高兴宣布将发布改进的端点,用于开箱即用的预训练 ML 包。基于新的 UiPath™ LLM,即 UiPath DocPath 的新生成功能提高了准确性和性能。
- 709
- 941x
- 1040x
- 3949a
- 9465
- 发票
- 中国发票
- 希伯来语发票
- 日本发票
- 收据
查看发行说明,以了解未来的公告。
发行日期:2024 年 3 月 28 日
我们很高兴宣布,UiPath 最新 OCR 引擎 UiPath 扩展语言 OCR 现已推出公开预览版。新版 OCR 能够将 200 多个语言的文档数字化,与前身相比有显著改进,尤其是在中文、日语和韩语方面。此外,它可以处理泰语、越南语、印度的所有主要语言以及使用西里尔字母的语言和希腊语的文档。
UiPath 扩展语言 OCR 当前仅可用作公共端点。
发行日期:2023 年 4 月 27 日
ML 包版本 v23.4 及更高版本现在拥有使用冻结主干进行训练的选项。对于 400 页以下的小型或低多样性训练集,这种新方法的训练速度更快,并且效果更好。您可以使用官方文档中记录的新训练管道环境变量覆盖此行为。
发布日期:2022 年 11 月 29 日
我们宣布即将弃用澳大利亚发票预训练 ML 包。我们建议改用发票 ML 包。您可以在此处找到更多相关详细信息。
- UiPath Document OCR public endpoint release
- 改进
- UiPath DocPath 公共端点改进
- 新增功能
- UiPath DocPath 公共端点改进
- 新增功能
- UiPath DocPath 公共端点改进
- 新增功能
- 新的文档类型
- 增强的字符识别功能
- 通过 API 和活动可用的日本收据文档类型
- 移除版本低于 2023.4 的开箱即用模型
- 移除版本低于 2023.4 的开箱即用模型
- UiPath Document OCR 公共端点发布版本
- 改进
- UiPath DocPath 公共端点 版本
- 新的文档类型
- 基于 UiPath DocPath 的中国发票和日本发票的公共 端点
- 日本发票改进
- 发布日本发票公共端点
- 改进
- 发布新的日本发票公共 端点
- 改进
- UiPath 扩展语言 OCR 正式发布
- 基于 UiPath™ DocPath 的新公共端点
- UiPath DocPath 上改进的性能和加入的新模型端点
- 模型端点重定向到旧一代
- 预览模型已删除
- 弃用 UiPath 中文、日语、韩语 OCR
- 基于 UiPath™ DocPath 的发票和收据公共端点
- 基于 DocPath 的公共端点
- UiPath 扩展语言 OCR(公共预览版)
- 冻结的主干训练
- 已弃用澳大利亚发票
- ML 分类端点公开预览
- UiPath 中文、日语、韩语 OCR 版本
- 端点
- 数据提取 ML 包