- Document Understanding 发行说明
- ML 包和公共端点发行说明
- 常规 ML 包和公共端点更新
- ML 包和公共端点版本历史记录

Document Understanding 发行说明
发布日期:2025 年 8 月 14 日
新增功能
我们很高兴宣布,基于欧洲地区 UiPath DocPath 的公共端点现已实现精度提升。
- 9465
- 中国发票
- 希伯来语发票
- 日本发票
- 日本收据
此次新增后,除财务报表外,所有模型现均已基于欧洲区域的 UiPath DocPath 运行。
新的文档类型
- 发票 2:此文档类型经过训练,可从各种发票类型中提取关键数据点,包括标准发票、贷方票据、印度发票和运输发票。 增强的架构由 55 个常规字段、两个结构化表(一个用于行项目(13 列),一个用于银行支付详情(9 列))以及一个货币分类器组成。
- 收据 2:此文档类型经过训练,可从各种收据类型中提取关键数据点,包括但不限于停车收据、火车票、酒店账单、机场购物、膳食、药房收据、电子收据等。 增强的架构由 60 个常规字段和一个包含 6 个列的结构化表组成。
- 美国抵押贷款结算披露:此文档类型经过训练,可从标准美国抵押贷款结算披露表中提取关键数据点。 架构包括 20 个常规字段,用于捕获借款人详细信息、房产信息、贷款条款、交易摘要以及现金结算金额。
发布说明:2025 年 6 月 23 日
此更新对我们的光学字符识别 (OCR) 引擎进行了一系列改进,旨在提高更广泛输入样式的准确性和可靠性:
-
增强了手写检测功能。
-
增强等宽字体中“O”和“0”的区分度。
-
改进了对点矩阵打印文本的识别。
这些改进提高了各种文档类型的可靠性。
发布说明:2025 年 5 月 19 日
您现在可以通过 API、IntelligentOCR 以及 Document Understanding 活动使用日本收据 (Receipts Japan) 文档类型。这适用于日本地区的所有租户。
发布日期:2025 年 4 月 11 日
移除版本低于 2023.4 的开箱即用模型
随着新型替代方案和升级解决方案的发布,我们移除了对开箱即用模型的支持,包括 UiPath Document Understanding OCR 与 OCR_CPU、数据提取 ML 包以及文档分类器。
下表详细说明了移除计划。
特性或功能 | 移除公布日期 | 移除日期: | 注意 |
---|---|---|---|
早于 2023.4 的开箱即用 ML 包 | 2025 年 4 月 | 2025 年 4 月 | 我们建议使用最新版本的开箱即用 ML 包。 |
有关弃用的更多信息,请查看概述指南中的弃用时间线。
发布日期:2025 年 3 月 19 日
改进
- 整体复选框、手写和打印文本检测得到改进。
- 手写识别准确性得到了提升。
- 针对日本印章的印章检测功能得到改进。
- 边界框的大小和定位准确性得到了改进。
发布日期:2024 年 11 月 28 日
新的文档类型
此版本引入了一种新的文档类型:日本收据 (Receipts Japan)。这个新的公共端点可以从各种文档类型中提取关键详细信息,例如常规收银机收据、餐厅收据、旅馆收据、火车收据、停车收据以及其他类型的日语收据等。
基于 UiPath DocPath 的中国发票和日本发票的公共端点
我们很高兴宣布发布改进的中国发票和日本发票端点。基于新的 UiPath LLM,即 UiPath DocPath 的新生成端点提高了准确性和性能。
日本发票改进
- 常规字段:
- 净减少额
- 已扣税额
- 未减少净额
- 未扣税额
- 预扣税额
- 存款
- 列字段:
- 项目税率
- 项目注册税
- 项目费用
发布日期:2024 年 10 月 29 日
在“日本发票”端点中发布
改进
我们对文档数字化流程进行了重大改进。现在,当使用 UiPath 扩展语言 OCR 或中文、韩语、日语 OCR 时,输出将是常规字词框,而不是单个字符。
发布日期:2024 年 10 月 15 日
在“日本发票”端点中发布
改进
- 提高了日本发票 ML 包的准确性。
- 当中文、日语或韩语字符在文档中与拉丁字符、标点符号和数字混合使用时,我们增强了间距和字词分析。
- 我们修复了一个问题,该问题导致 AI Center 训练管道不正确地为
ID Number
和Phone Number
字段类型报告高分。这可确保报告的分数与实际分数相符。
发布日期:2024 年 10 月 3 日
我们很高兴宣布,UiPath 最新的 OCR 引擎UiPath 扩展语言 OCR现已正式发布。新版 OCR 能够将 200 多个语言的文档数字化,与前身相比有显著改进,尤其是在中文、日语和韩语方面。此外,它可以处理泰语、越南语、印度的所有主要语言以及使用西里尔字母的语言和希腊语的文档。
UiPath 扩展语言 OCR 当前仅可用作公共端点。
发布日期:2024 年 9 月 17 日
UiPath DocPath 上改进的性能和加入的新模型端点
此版本提高了基于 UiPath DocPath(新的 UiPath LLM)的模型的准确性和性能。此外,以下模型现在也基于 UiPath DocPath:
- 709
- 941x
- 1040x
- 3949
- 3949a
模型端点重定向到旧一代
由于性能问题,系统已将财务报表模型端点重定向到旧一代。
预览模型已删除
已从公共端点和数据提取 ML 包中删除 990(预览版)模型。
发行日期:2024 年 7 月 8 日
自 2025 年 1 月起,我们将弃用 UiPath 中文、日语、韩语 OCR。我们建议改用 UiPath 扩展语言 OCR。
查看“弃用时间线”页面,详细了解即将弃用和删除的内容。
发布日期:2024 年 6 月 12 日
我们很高兴宣布发布改进的发票和收据端点。基于新的 UiPath LLM,即 UiPath DocPath 的新生成功能提高了准确性和性能。
- 709
- 941x
- 1040x
- 3949a
- 9465
- 中国发票
- 希伯来语发票
- 日本发票
查看发行说明,以了解未来的公告。
发行日期:2024 年 5 月 29 日
我们很高兴宣布将发布改进的端点,用于开箱即用的预训练 ML 包。基于新的 UiPath™ LLM,即 UiPath DocPath 的新生成功能提高了准确性和性能。
- 709
- 941x
- 1040x
- 3949a
- 9465
- 发票
- 中国发票
- 希伯来语发票
- 日本发票
- 收据
查看发行说明,以了解未来的公告。
发行日期:2024 年 3 月 28 日
我们很高兴宣布,UiPath 最新 OCR 引擎 UiPath 扩展语言 OCR 现已推出公开预览版。新版 OCR 能够将 200 多个语言的文档数字化,与前身相比有显著改进,尤其是在中文、日语和韩语方面。此外,它可以处理泰语、越南语、印度的所有主要语言以及使用西里尔字母的语言和希腊语的文档。
UiPath 扩展语言 OCR 当前仅可用作公共端点。
发行日期:2023 年 4 月 27 日
ML 包版本 v23.4 及更高版本现在拥有使用冻结主干进行训练的选项。对于 400 页以下的小型或低多样性训练集,这种新方法的训练速度更快,并且效果更好。您可以使用官方文档中记录的新训练管道环境变量覆盖此行为。
发布日期:2022 年 11 月 29 日
我们宣布即将弃用澳大利亚发票预训练 ML 包。我们建议改用发票 ML 包。您可以在此处找到更多相关详细信息。
- UiPath DocPath 公共端点改进
- 新增功能
- 新的文档类型
- 增强的字符识别功能
- 通过 API 和活动可用的日本收据文档类型
- 移除版本低于 2023.4 的开箱即用模型
- 移除版本低于 2023.4 的开箱即用模型
- UiPath Document OCR 公共端点发布版本
- 改进
- UiPath DocPath 公共端点 版本
- 新的文档类型
- 基于 UiPath DocPath 的中国发票和日本发票的公共 端点
- 日本发票改进
- 发布日本发票公共端点
- 改进
- 发布新的日本发票公共 端点
- 改进
- UiPath 扩展语言 OCR 正式发布
- 基于 UiPath™ DocPath 的新公共端点
- UiPath DocPath 上改进的性能和加入的新模型端点
- 模型端点重定向到旧一代
- 预览模型已删除
- 弃用 UiPath 中文、日语、韩语 OCR
- 基于 UiPath™ DocPath 的发票和收据公共端点
- 基于 DocPath 的公共端点
- UiPath 扩展语言 OCR(公共预览版)
- 冻结的主干训练
- 已弃用澳大利亚发票
- ML 分类端点公开预览
- UiPath 中文、日语、韩语 OCR 版本
- 端点
- 数据提取 ML 包