- 概述
- 入门指南
- 构建模型
- 使用模型
- 模型详细信息
- 公共端点
- 1040 - 文档类型
- 1040 计划 C - 文档类型
- 1040 计划 D - 文档类型
- 1040 计划 E - 文档类型
- 1040x - 文档类型
- 3949a - 文档类型
- 4506T - 文档类型
- 709 - 文档类型
- 941x - 文档类型
- 9465 - 文档类型
- ACORD125 - 文档类型
- ACORD126 - 文档类型
- ACORD131 - 文档类型
- ACORD140 - 文档类型
- ACORD25 - 文档类型
- 银行对账单 - 文档类型
- 提单 - 文档类型
- 公司注册证书 - 文档类型
- 原产地证书 - 文档类型
- 支票 - 文档类型
- 儿童产品证书 - 文档类型
- CMS 1500 - 文档类型
- 欧盟符合性声明 - 文档类型
- 财务报表 - 文档类型
- FM1003 - 文档类型
- I9 - 文档类型
- 身份证 - 文档类型
- 发票 - 文档类型
- 发票 2 - 文档类型
- 澳大利亚发票 - 文档类型
- 发票中国 - 文档类型
- 希伯来语发票 - 文档类型
- 发票印度 - 文档类型
- 日本发票 - 文档类别
- 发票运输 - 文档类型
- 装箱单列表 - 文档类型
- 工资单 - 文档类型
- 护照 - 文档类型
- 采购订单 - 文档类型
- 收据 - 文档类型
- 收据 2 - 文档类型
- 日本收据 - 文档类型
- 汇款通知书 - 文档类型
- UB04 - 文档类型
- 美国抵押贷款平交披露 - 文档类型
- 公用事业账单 - 文档类型
- 车辆标题 - 文档类型
- W2 - 文档类型
- W9 - 文档类型
- 支持的语言
- Insights 仪表板
- 部署在 Automation Suite 中的 Document Understanding
- 安装和使用
- 首次运行体验
- 部署 UiPath 文档 OCR
- 部署开箱即用的 ML 包
- 使用 Document Manager
- 使用框架
- 数据与安全性
- 日志记录
- 许可
- 如何
- 故障排除

Document Understanding 新式项目用户指南
本页介绍如何使用 Document Manager 为新的数据集添加标签并重新训练 ML 模型。
在“首次运行体验”中启动创建的数据标签会话,然后转到设置以配置 OCR。
在“OCR 方法”下拉菜单中选择要使用的 OCR。对于UiPath 文档 OCR ,粘贴Document Understanding TM许可证密钥(从“管理” > “许可证”页面检索 Document Understanding API 密钥),然后粘贴部署 UiPath 文档 OCR 时生成的 OCR URL。请查看部署 UiPath 文档 OCR 。
按照部署开箱即用 ML 包中描述的说明,使用已部署的模型配置预加标签。粘贴模型公共 ML 技能端点 和 Document Understanding 许可证密钥,然后选择“保存” 。
有关更多详细信息,请查看此处的文档:使用预定义架构。
选择 以创建要提取的字段。
您最多可以创建 40 个字段。
对于此验证练习,您可以创建一些常见的发票字段,例如日期、名称、发票编号和总计。请确保相应地更改内容类型 - 日期(日期)、名称(字符串)、发票编号(字符串)和总计(数字)。
现在,您可以开始为文档添加标签了。
选择顶部的“预测”按钮 ,使用基本发票模型预测已定义字段的标记,并在预测错误时更正。
要更改标记,请将鼠标拖动到字段上方,然后点击键盘快捷键为其添加标记。
使用顶部的箭头切换到下一个文档,直到完成所有已上传发票的标签验证。
- 确保在数据集筛选中选择正确的数据集,然后选择“导出”按钮
。
- 选择 “导出”。
- 转到同一 AI Center 项目下的“数据集”,您应该能够看到导出的训练数据集。
在 AI Center 上训练自定义模型
- 转到“管道”>“新建”。请选择评估运行类型,选择模型包和输入数据集。
- 选择“导出”下的子文件夹作为输入数据集。
- 选择“创建”以启动管道。可能需要 1 到 2 个小时的时间管道才能在 CPU 计算机上运行。