- 概述
- 入门指南
- 构建模型
- 使用模型
- 模型详细信息
- 公共端点
- 1040 - 文档类型
- 1040 计划 C - 文档类型
- 1040 计划 D - 文档类型
- 1040 计划 E - 文档类型
- 1040x - 文档类型
- 3949a - 文档类型
- 4506T - 文档类型
- 709 - 文档类型
- 941x - 文档类型
- 9465 - 文档类型
- ACORD125 - 文档类型
- ACORD126 - 文档类型
- ACORD131 - 文档类型
- ACORD140 - 文档类型
- ACORD25 - 文档类型
- 银行对账单 - 文档类型
- 提单 - 文档类型
- 公司注册证书 - 文档类型
- 原产地证书 - 文档类型
- 支票 - 文档类型
- 儿童产品证书 - 文档类型
- CMS 1500 - 文档类型
- 欧盟符合性声明 - 文档类型
- 财务报表 - 文档类型
- FM1003 - 文档类型
- I9 - 文档类型
- 身份证 - 文档类型
- 发票 - 文档类型
- 发票 2 - 文档类型
- 澳大利亚发票 - 文档类型
- 发票中国 - 文档类型
- 希伯来语发票 - 文档类型
- 发票印度 - 文档类型
- 日本发票 - 文档类别
- 发票运输 - 文档类型
- 装箱单列表 - 文档类型
- 工资单 - 文档类型
- 护照 - 文档类型
- 采购订单 - 文档类型
- 收据 - 文档类型
- 收据 2 - 文档类型
- 日本收据 - 文档类型
- 汇款通知书 - 文档类型
- UB04 - 文档类型
- 美国抵押贷款平交披露 - 文档类型
- 公用事业账单 - 文档类型
- 车辆标题 - 文档类型
- W2 - 文档类型
- W9 - 文档类型
- 支持的语言
- Insights 仪表板
- 部署在 Automation Suite 中的 Document Understanding
- 数据与安全性
- 日志记录
- 许可
- 如何
- 故障排除

Document Understanding 新式项目用户指南
在 AI Center 中创建 UiPath 文档 OCR ML 包。
对于在线安装,“开箱即用包”部分已包含 "UiPathDocumentOCR" 模型。
对于离线安装,请按照“将模型上传至 AI Center”部分中包含的步骤操作。
请转到“ML 包”>“开箱即用包”>“UiPath Document Understanding”> "UiPathDocumentOCR",然后选择“提交”。
转到“ML 技能”,并为您创建的 UiPath 文档 OCR 包创建新的 ML 技能。
请使用高级基础架构设置以更新部署来更新副本(理想情况下,副本数应等于节点数),并最大化 CPU(至少 4 个)和 RAM 请求(如果您未使用 GPU 计算机,或 UiPath 文档 OCR 处理速度较慢,并且可能会失败)。
OCR 引擎需要 GPU 上才能实现最佳性能,建议用于生产工作负载。但是,如果无可用 GPU,它仍可以在 CPU 上运行,但需要比默认设置更多的资源。高级基础架构设置应进行如下调整:
副本:如果并发使用 UiPath 文档 OCR,则增加副本数量。如果您一次使用 UiPath 文档 OCR 在单个数据标签会话中执行导入操作,并且 UiPath 文档 OCR 未在其他 UiPath™ 工作流中使用,则 1 个副本就足够了。否则,需要增加副本的数量。没有一个“确定无误”的数字,您需要反复进行试验。不要在单个节点安装上使用 2 个以上的副本。理想情况下,副本计数应等于集群中的节点数(1 个副本/节点)。如果需要更多并行度,增加 CPU 会有所帮助
CPU:至少应为 4 个(对于每个副本)。请确保您拥有适当的资源。没有一个“确定无误”的数字,但更多的 CPU 意味着更快的处理时间。您需要在特定场景下测试是否足够。
ML 技能可能需要长达 30 分钟才能准备就绪。您可能需要刷新 AI Center 页面才能更改状态。ML 技能可用后,请选择 ML 技能并转到“修改当前部署”。
打开开关,将 ML 技能设为公开。您可能需要等待几分钟才能刷新页面。
选择 ML 技能并复制 URL,即 UiPathDocumentOCR 的端点,以供以后使用。