document-understanding
2021.10
false
- 入门指南
 - 框架组件
- 数据提取训练概述
 - 训练提取程序作用域的配置提取程序向导
 - 机器学习提取程序训练器
 - 数据提取训练相关活动
 
 - ML 包
 - 管道
 - Data Manager
 - OCR 服务
 - 部署在 Automation Suite 中的 Document Understanding
 - 在 AI Center 独立版中部署的 Document Understanding
 - 深度学习
 - 许可
 - 参考
- UiPath.Abbyy.Activities
 - UiPath.AbbyyEmbedded.Activities
 - UiPath.DocumentUnderstanding.ML.Activities
 - UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
 - UiPath.Intelligent OCR.Activities
 - UiPath.OCR.Activities
 - UiPath.OCR.Contracts
 - UiPath.DocumentProcessing.Contracts
 - UiPath.OmniPage.Activities
 - UiPath.PDF.Activities
 
 
重要 :
新发布内容的本地化可能需要 1-2 周的时间才能完成。

不在支持范围内
Document Understanding 用户指南
上次更新日期 2025年2月4日
机器学习提取程序训练器会在所选目录中为您收集人工反馈。收集数据后,如果要重新训练 ML 模型,您只需压缩目录的内容,然后将其上传到 Data Manager 中进行策划。
以下是使用“机器学习提取程序训练器”活动时需要遵循的步骤。
- 使用“分类管理器”向导定义文档类型和字段。
 - 在“训练提取程序作用域”活动中拖动机器学习提取程序训练器。
 - 在自动打开的“机器学习提取程序”向导中,添加端点信息。
 - 如果您还希望使用输入的值作为活动(更确切地说是端点)的输入参数,请选中“更新活动参数”复选框。
 - 单击“获取功能”按钮。完成此操作后,向导将关闭。
 - 输入输出文件夹的值。
 - 选择“训练提取程序作用域”的“配置提取程序”选项。系统将显示向导。
                     
 - 现在即可配置机器学习提取程序训练器。展开要应用的文档类型,然后单击相应字段旁边的复选框,开始选择要训练的字段。
 - 手动填写文本框,或从可用的下拉列表中选择要映射到每个字段的正确数据。下拉列表包含机器学习提取程序训练器(使用在机器学习提取程序向导中输入的端点)声明为提取功能的所有字段。
                     注意:如果您单击复选框但将文本框留空,则后者将自动使用本地分类中的文档类型 ID 填充。保存后即将应用更改。如果您想避免对字段 ID 使用长字符串,我们建议您手动输入一个值,以防您无权访问提取程序的内部分类。
 - 要检查您是否正在使用提取程序的最新功能,可以单击“获取或刷新提取程序功能”,这将打开“机器学习提取程序”向导。
 - 从下拉列表中选择一个选项会自动确认该字段。
                     
 - 要根据提取结果训练提取程序,您可以在先前用于提取程序的“框架别名”字段中设置确切的字母数字值。
 - 正确配置所有字段后,选择“保存”按钮。
                     重要提示:您不能为两个不同的字段选择相同的选项。