Document Understanding 新式项目用户指南

适用平台：

上次更新日期 2025年12月9日

部署 UiPath 文档 OCR

在 AI Center 中创建 UiPath 文档 OCR ML 包。

对于在线安装，“开箱即用包”部分已包含 "UiPathDocumentOCR" 模型。

对于离线安装，请按照“将模型上传至 AI Center”部分中包含的步骤操作。

请转到“ML 包”>“开箱即用包”>“UiPath Document Understanding”> "UiPathDocumentOCR"，然后选择“提交”。

转到“ML 技能”，并为您创建的 UiPath 文档 OCR 包创建新的 ML 技能。

请使用高级基础架构设置以更新部署来更新副本（理想情况下，副本数应等于节点数），并最大化 CPU（至少 4 个）和 RAM 请求（如果您未使用 GPU 计算机，或 UiPath 文档 OCR 处理速度较慢，并且可能会失败）。

OCR 引擎需要 GPU 上才能实现最佳性能，建议用于生产工作负载。但是，如果无可用 GPU，它仍可以在 CPU 上运行，但需要比默认设置更多的资源。高级基础架构设置应进行如下调整：

副本：如果并发使用 UiPath 文档 OCR，则增加副本数量。如果您一次使用 UiPath 文档 OCR 在单个数据标签会话中执行导入操作，并且 UiPath 文档 OCR 未在其他 UiPath™ 工作流中使用，则 1 个副本就足够了。否则，需要增加副本的数量。没有一个“确定无误”的数字，您需要反复进行试验。不要在单个节点安装上使用 2 个以上的副本。理想情况下，副本计数应等于集群中的节点数（1 个副本/节点）。如果需要更多并行度，增加 CPU 会有所帮助

CPU：至少应为 4 个（对于每个副本）。请确保您拥有适当的资源。没有一个“确定无误”的数字，但更多的 CPU 意味着更快的处理时间。您需要在特定场景下测试是否足够。

ML 技能可能需要长达 30 分钟才能准备就绪。您可能需要刷新 AI Center 页面才能更改状态。ML 技能可用后，请选择 ML 技能并转到“修改当前部署”。

打开开关，将 ML 技能设为公开。您可能需要等待几分钟才能刷新页面。

选择 ML 技能并复制 URL，即 UiPathDocumentOCR 的端点，以供以后使用。