document-understanding
2023.4
false
重要 :
新发布内容的本地化可能需要 1-2 周的时间才能完成。
UiPath logo, featuring letters U and I in white

Document Understanding 用户指南

上次更新日期 2025年9月15日

部署 UiPath 文档 OCR

在 AI Center 中创建 UiPath 文档 OCR ML 包。

对于在线安装,“开箱即用包”部分已包含 "UiPathDocumentOCR" 模型。请转到“ML 包”>“开箱即用包”>“UiPath Document Understanding”> "UiPathDocumentOCR",然后选择“提交”。

对于离线安装,请从 AI Center 的左侧边栏中转到“ML 包”选项卡,然后创建一个新包。为包命名并上传您从此页面下载的包。选择 JSON 输入类型和相应的 Python 语言。创建包。

注意:在 AI Center 中创建 UiPath 文档 OCR ML 包时,其名称不能为 ocr 或 OCR。请务必选择其他名称。


转到“ML 技能”,并为您创建的 UiPath 文档 OCR 包创建新的 ML 技能。

请使用高级基础架构设置以更新部署来更新副本(理想情况下,副本数应等于节点数),并最大化 CPU(至少 4 个)和 RAM 请求(如果您未使用 GPU 计算机,或 UiPath 文档 OCR 处理速度较慢,并且可能会失败)。

OCR 引擎需要 GPU 上才能实现最佳性能,建议用于生产工作负载。但是,如果无可用 GPU,它仍可以在 CPU 上运行,但需要比默认设置更多的资源。高级基础架构设置应进行如下调整:

副本:如果并发使用 UiPath 文档 OCR,则增加副本数量。如果您一次使用 UiPath 文档 OCR 在单个数据标签会话中执行导入操作,并且 UiPath 文档 OCR 未在其他 UiPath™ 工作流中使用,则 1 个副本就足够了。否则,需要增加副本的数量。没有一个“确定无误”的数字,您需要反复进行试验。不要在单个节点安装上使用 2 个以上的副本。理想情况下,副本计数应等于集群中的节点数(1 个副本/节点)。如果需要更多并行度,增加 CPU 会有所帮助

CPU:至少应为 4 个(对于每个副本)。请确保您拥有适当的资源。没有一个“确定无误”的数字,但更多的 CPU 意味着更快的处理时间。您需要在特定场景下测试是否足够。

ML 技能可能需要长达 30 分钟才能准备就绪。您可能需要刷新 AI Center 页面才能更改状态。ML 技能可用后,请选择 ML 技能并转到“修改当前部署”。

打开开关,将 ML 技能设为公开。您可能需要等待几分钟才能刷新页面。

选择 ML 技能并复制 URL,即 UiPathDocumentOCR 的端点,以供以后使用。



此页面有帮助吗?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath Logo
信任与安全
© 2005-2025 UiPath。保留所有权利。