- 概述
- 文档处理合同
- 发行说明
- 关于文档处理合同
- Box 类
- IPersistedActivity 接口
- PrettyBoxConverter 类
- IClassifierActivity 接口
- IClassifierCapabilitiesProvider 接口
- 分类器文档类型类
- 分类器结果类
- 分类器代码活动类
- 分类器原生活动类
- 分类器异步代码活动类
- 分类器文档类型功能类
- ContentValidationData Class
- EvaluatedBusinessRulesForFieldValue Class
- EvaluatedBusinessRuleDetails Class
- 提取程序异步代码活动类
- 提取程序代码活动类
- 提取程序文档类型类
- 提取程序文档类型功能类
- 提取程序字段功能类
- 提取程序原生活动类
- 提取程序结果类
- FieldValue Class
- FieldValueResult Class
- ICapabilitiesProvider 接口
- IExtractorActivity 接口
- 提取程序有效负载类
- 文档操作优先级枚举
- 文档操作数据类
- 文档操作状态枚举
- 文档操作类型枚举
- 文档分类操作数据类
- 文档验证操作数据类
- 用户数据类
- 文档类
- 文档拆分结果类
- DomExtensions 类
- 页类
- 页面分区类
- 多边形类
- 多边形转换器类
- 元数据类
- 词组类
- 词类
- 处理源枚举
- 结果表格单元类
- 结果表值类
- 结果表列信息类
- 结果表类
- 旋转枚举
- Rule Class
- RuleResult Class
- RuleSet Class
- RuleSetResult Class
- 分区类型枚举
- 词组类型枚举
- IDocumentTextProjection 接口
- 分类结果类
- 提取结果类
- 结果文档类
- 结果文档范围类
- 结果数据点类
- 结果值类
- 结果内容引用类
- 结果值令牌类
- 结果派生字段类
- 结果数据源枚举
- 结果常量类
- 简单字段值类
- 表字段值类
- 文档组类
- 文档分类类
- 文档类型类
- 字段类
- 字段类型枚举
- FieldValueDetails Class
- 语言信息类
- 元数据输入类
- 文本类型枚举
- 类型字段类
- ITrackingActivity 接口
- ITrainableActivity 接口
- ITrainableClassifierActivity 接口
- ITrainableExtractorActivity 接口
- 可训练的分类器异步代码活动类
- 可训练的分类器代码活动类
- 可训练的分类器原生活动类
- 可训练的提取程序异步代码活动类
- 可训练的提取程序代码活动类
- 可训练的提取程序原生活动类
- 基本数据点类 - 预览
- 提取结果处理程序类 - 预览
- Document Understanding ML
- 发行说明
- Document Understanding OCR 本地服务器
- Document Understanding
- 智能 OCR
- 发行说明
- 关于“智能 OCR”活动包
- 项目兼容性
- 加载分类
- 将文档数字化
- 分类文档作用域
- 基于关键词的分类器
- Document Understanding 项目分类器
- 智能关键词分类器
- 创建文档分类操作
- 创建文档验证工件
- 检索文档验证工件
- 等待文档分类操作然后继续
- 训练分类器范围
- 基于关键词的分类训练器
- 智能关键词分类训练器
- 数据提取作用域
- Document Understanding 项目提取程序
- Document Understanding 项目提取程序训练器
- 基于正则表达式的提取程序
- 表单提取程序
- 智能表单提取程序
- 文档脱敏
- 创建文档验证操作
- 等待文档验证操作然后继续
- 训练提取程序范围
- 导出提取结果
- 机器学习提取程序
- 机器学习提取程序训练器
- 机器学习分类器
- 机器学习分类训练器
- 生成分类器
- 生成式提取程序
- 配置身份验证
- ML 服务
- OCR
- OCR 合同
- OmniPage
- PDF
- [未公开] Abbyy
- [未列出] Abbyy 嵌入式

Document Understanding 活动
发行说明
附录:添加于 2026 年 2 月 3 日
UiPath.DocumentUnderstanding.ML.Activities包会与UiPath.IntelligentOCR.Activities包一起自动安装,以执行基于 ML 的分类和提取。
从 2026 年开始,Document Understanding ML 活动包的发布说明将在“智能 OCR”活动部分中提供。
不要在自动化中将UiPath.DocumentUnderstanding.ML.Activities包安装为单独的包,因为在安装UiPath.IntelligentOCR.Activities包时,系统会自动安装正确的版本。
v1.36.3
发布日期:2026 年 3 月 16 日
改进
提高了 PDF 处理性能,减少了大型文件的数字化时间。
v1.36.2
发布日期:2025 年 12 月 16 日
新增功能
支持 Maestro 中基于名称的绑定和可重新映射的 IXP 项目资源
我们增加了对在 Maestro 中按名称引用 IXP 项目的支持,并引入了在部署期间将项目重新映射为资源的功能。
v1.33.0
发行日期:2025 年 4 月 16 日
新增功能
使用新的生成式提取程序增强提取功能
为了增强具有复杂布局的短文档和长文档的生成式提取功能,您现在可以在为文档字段配置提取程序时选择以下生成式提取程序:
- 短文档简单布局– 这是现有的生成式提取程序。
- 长文档复杂布局(预览)– 针对包含图像、手写内容、表单元素或其他复杂布局(例如浮动标注框)的长表单文档进行了优化。适用于此提取程序的文档示例包括:保险单或其他具有复杂布局的类似长文档。
- 短文档复杂布局(预览)– 针对包含图像、手写内容、表单元素或其他复杂布局(如浮动标注框)的短文档进行了优化。例如:身份证或布局复杂的医疗保健登记表。
改进
- 在数据提取作用域内使用生成式提取程序时,管理提示按钮已重命名为管理字段详细信息。此外,在生成式提取程序提示词向导中,提示值已重命名为字段详细信息。这些更改准确地描述了提供给特定字段的生成式提取程序的指令的目的。
- 在“分类文档范围”中使用生成式分类器时, “管理提示”按钮已重命名为“管理文档类型” 。此外,在生成式分类器提示词向导中,提示值已重命名为文档类型详细信息。这些更改准确描述了针对特定文档类型提供给生成式分类器的指令的目的。
v1.31.2
发布日期:2024 年 11 月 26 日
错误修复
在“配置提取程序”菜单中,在“训练提取程序作用域”活动下为提取程序训练器选择“获取或刷新提取程序功能”,系统未按预期打开。
v1.24.1
发布日期:2024 年 10 月 21 日
错误修复
此版本解决了“AI Unit 使用概述”仪表板中因数据缺失而显示“未知”部分的问题。
v1.28.8
发布日期:2024 年 10 月 14 日
错误修复
此版本解决了“AI Unit 使用概述”仪表板中因数据缺失而显示“未知”部分的问题。
v1.31.1
发布日期:2024 年 10 月 3 日
此包版本与 24.10.0 或更高版本的 UIAutomation.Activities 版本兼容。
新增功能
支持本地部署设置中的活动
我们已将“运行时租户 URL”和“运行时凭据资产”属性添加到生成式分类器和提取程序活动中。借助这些属性,您现在可以直接使用外部应用程序中存储在 Orchestrator 中的凭据,在运行时访问 Document Understanding 资源。为此,请确保所选租户启用了 Document Understanding 并分配了 AI Unit。
改进
提示大小从每个问题 500 个字符增加到 1000 个字符,以提高说明的清晰度。
错误修复
ML 提取程序返回了空值,从而导致验证任务由于 null 值属性而失败。
v1.28.7
发行日期:2024 年 8 月 13 日
我们升级了一些内部依赖项以提高性能。
v1.28.6
发行日期:2024 年 7 月 31 日
错误修复
使用生成分类器和生成提取程序活动时,输入以空格开头或结尾的提示会导致“KeyNotFoundException”错误,并显示“字典中没有给定的键”消息。
v1.28.5
发行日期:2024 年 7 月 12 日
错误修复
修复了导致文档分类失败并显示“提供了无效的请求 URI”错误的问题。
v1.28.4
发行日期:2024 年 6 月 20 日
我们一直在不断努力改善您的 UiPath Document Understanding 体验。 即使此发行版没有进行重大的主要更改,我们也要确保对产品进行次要改进和辅助功能修复。
v1.28.3
发行日期:2024 年 6 月 5 日
我们通过修改某些依赖项提高了产品稳定性。
v1.28.2
发行日期:2024 年 5 月 27 日
改进
提示大小从每个问题 500 个字符增加到 1000 个字符,以提高说明的清晰度。 此外,如果达到每个问题 1000 个字符的提示大小限制,您将收到“超出限制”错误。
错误修复
ML 提取程序返回了空值,从而导致验证任务由于 null 值属性而失败。
已知问题
如果生成式提取程序或分类器触发Content Filtered异常,则该活动不会生成任何结果,就像内容缺失一样。 机器人日志中将显示以下警告消息: GPT refused to handle the request because of content filtering policy. Returning empty result.从 Studio 启动自动化时,Studio 中也会显示此消息。
v1.28.1
发布日期:2024 年 4 月 29 日
新功能
机器学习提取程序现在可以提取垂直文本,从而显着增强提取功能。
v1.24.0
发布日期:2023 年 11 月 1 日
生成式功能正式发布
我们很高兴地宣布,UiPath.DocumentUnderstanding.ML.Activities 生成式功能现已正式发布。其中包括以下各项:
- 生成式分类器活动
- 生成式提取程序活动
您可以将新的生成式功能与UiPath.IntelligentOCR.Activities框架一起使用。
新特性和改进功能
- “机器学习分类训练器”活动可以使用新属性“输出文件夹”。您可通过此属性在本地保存文件。
- 现已提供对多页字段的支持。例如,当地址需要一页包含街道,而下一页包含州和邮政编码时,此功能非常有用。由于一个已知问题,表格行当前在此示例中无效。请关注我们的发行说明,以获取日后的更新。
v1.21.2
发行日期:2023 年 6 月 7 日
我们一直在不断努力改善您的 UiPath Document Understanding 体验。 即使此发行版没有进行重大的主要更改,我们也要确保对产品进行次要改进和辅助功能修复。
v1.21.1
发行日期:2023 年 4 月 26 日
弃用时间表
我们建议您定期查看弃用时间表,以获取有关针对即将弃用和删除功能的任何更新。
v1.17.1
发行日期:2023 年 3 月 27 日
新特性和改进功能
我们一直在不断努力改进 UiPath.DocumentUnderstanding.ML.Activities 包。 即使此补丁版本没有进行重大的主要更改,我们也要确保对产品进行次要改进和辅助功能修复。
v1.18.0
发行日期:2022 年 12 月 15 日
新特性和改进功能
- UiPath Studio 用户界面现已提供繁体中文版本。
- 现在,您可以获享为 UiPath.DocumentUnderstanding.ML.Activities 包中包含的以下活动预填充的“API 密钥”字段的优势:机器学习分类器和机器学习提取程序。
v1.17.0
发行日期:2022 年 10 月 24 日
新特性和改进功能
- “机器学习提取程序训练器”活动现在可以支持多值字段。
- “使用服务器端 OCR”选项计划于 2022 年 12 月弃用。我们建议使用默认行为。有关弃用该选项的更多详细信息,请参见此处。
- Document Understanding Process Studio 模板已升级到新版本。UiPath.DocumentUnderstanding.ML.Activities包是此模板的依赖项。
错误修复
- 通过升级 PDF 库并使用混合 OCR 功能,修复了在使用数字化器时导致提取错误的错误。
- 修复了一个错误,该错误会导致在同时需要图像和 DOM 时将不一致的输入发送到 ML 提取程序。
- 从机器学习提取程序收到的
GetCapabilities调用中未使用代理设置。此错误现已修复,代理设置可按预期使用。
v1.13.2
发行日期:2022 年 5 月 9 日
改进
- The UiPath.DocumentUnderstanding.ML.Activities package has been upgraded to .NET5 portable, allowing you to run them on Linux robots.
- The Machine Learning Extractor Trainer and the Machine Learning Classifier Trainer activities have received new parameters grouped under the name of Public Datasets, allowing you to use public datasets instead of private ones.
- The Machine Learning Extractor activity has been updated and now the extraction algorithm can also be used from Forms AI, not only from the ML Models list.
- 现在,可以在离线方案中将“机器学习提取程序”活动与公共端点一起使用。
错误修复
Fixed a bug occurring on the Machine Learning Extractor Trainer activity that was exporting values even if the field was not mapped in the Configure Trainer wizard. Now, everything works as expected.
v1.9.2
发布日期:2023 年 8 月 3 日
错误修复
在 Document Understanding ML 活动包中,部分必填字段未进行相应标记。现在,所有必填字段都按预期进行了可视标记。
v1.9.1
发布日期:2021 年 10 月 5 日
新特性和改进功能
- 此版本将遥测客户端更新到版本 1.5.3,作为改进。
- The UiPath.DocumentUnderstanding.ML.Activities package has been upgraded to .NET5. While both .NET versions continue to be supported, the .NET5 projects can only work on 64-bit architectures.
- Added the Dataset and Project parameters to the Machine Learning Extractor Trainer activity which allow you to select where to upload your training data in your AI Center tenant. As a result, the Endpoint and MLSkill parameters were removed from the activity.
- Added the Endpoint parameter to the Machine Learning Classifier activity which provides the ability to use the activity with public ML Skills.
- 机器学习提取程序现在可以与 Forms AI 集成。要实现此目的,唯一的要求是确保禁用“使用服务器端 OCR”选项。
v1.7.0
发布日期:2021 年 3 月 29 日
新特性和改进功能
- 发布了机器学习分类器和机器学习分类培训器活动,作为机器学习文档分类功能的一部分,该功能可帮助您使用经过训练的自定义 ML 模型对文档进行分类。机器学习分类器经证明是非常有用的,特别是在文档集具有高度多样性的场景中。要通过人工验证来训练分类器并及时改善其结果,您可以使用同类型活动机器学习分类训练器。
- 改进了对 PDF 文件的处理。
v1.5.2
发行日期:2020 年 11 月 11 日
错误修复
- 如果从 AI Fabric 请求“ML 技能”列表时出现故障响应,则现在也可以对 5XX HTTP 状态代码进行自动重试。
- 如果出现网络故障而不是阻止重试操作,机器学习提取程序现在将会重试以连接到 AI Fabric。
v1.5.1
发行日期:2020 年 10 月 20 日
改进
机器学习提取程序的更详细的错误记录。
错误修复
- 为“ML 技能”请求添加了重试机制。
- 修复了机器学习提取程序活动无法使用所有 ML 技能的问题。
v1.5.0
发行日期:2020 年 10 月 5 日
新特性和改进功能
- 发布了新的机器学习提取程序训练器活动,可以根据人工验证结果为重新训练 ML 模型准备数据。
- 在机器学习提取程序训练器中添加了“获取或刷新提取程序功能”功能,该功能可轻松将分类字段与可用的提取程序字段进行映射。
- 机器学习提取程序活动中包含一个名为“超时(毫秒)”的新参数。该参数可用于指定在引发错误之前等待服务器响应的时间。
- 更改了机器学习提取程序“使用服务器端 OCR”属性的工具提示文本,以表明它与机器学习提取程序训练器不兼容 。
v1.2.2
发行日期:2020 年 8 月 24 日
错误修复
- 修复了在某些情况下为 Kerberos 或 NTLM 身份验证请求返回
407ProxyAuthenticationRequired错误消息的问题。这适用于机器学习提取程序。 - 修复了提供某个端点导致机器学习提取程序的“获取功能”功能不起作用的问题。
- 修复了未连接机器人的情况下导致机器学习提取程序引发错误的问题。
v1.2.1
发行日期:2020 年 6 月 5 日
新特性和改进功能
此版本带来了适用于机器学习提取程序活动的新选项(名为“ML 技能”),可让您使用 AI Fabric 中存储的模型。
v1.1.0
发行日期:2020 年 5 月 4 日
新特性和改进功能
已向机器学习提取程序添加了名为 UseServerSideOCR 的新选项。此选项使您可以使用从数字化接收的 OCR 结果。
机器学习提取程序现在声明了内部分类法,使您可以在数据提取范围的“配置提取程序”向导中轻松地将其可以提取的字段映射到您在分类法中定义的字段。
v1.0.0
发行日期:2020 年 2 月 11 日
新特性和改进功能
UiPath.DocumentUnderstanding.ML.Activities 包可在使用 AI 方法时,实现从收据和发票中提取信息的自动化。
- 附录:添加于 2026 年 2 月 3 日
- v1.36.3
- 改进
- v1.36.2
- 新增功能
- v1.33.0
- 新增功能
- 使用新的生成式提取程序增强提取功能
- 改进
- v1.31.2
- 错误修复
- v1.24.1
- 错误修复
- v1.28.8
- 错误修复
- v1.31.1
- 新增功能
- 支持本地部署设置中的活动
- 改进
- 错误修复
- v1.28.7
- v1.28.6
- 错误修复
- v1.28.5
- 错误修复
- v1.28.4
- v1.28.3
- v1.28.2
- 改进
- 错误修复
- 已知问题
- v1.28.1
- 新功能
- v1.24.0
- 生成式功能正式发布
- 新特性和改进功能
- v1.21.2
- v1.21.1
- 弃用时间表
- v1.17.1
- 新特性和改进功能
- v1.18.0
- 新特性和改进功能
- v1.17.0
- 新特性和改进功能
- 错误修复
- v1.13.2
- 改进
- 错误修复
- v1.9.2
- 错误修复
- v1.9.1
- 新特性和改进功能
- v1.7.0
- 新特性和改进功能
- v1.5.2
- 错误修复
- v1.5.1
- 改进
- 错误修复
- v1.5.0
- 新特性和改进功能
- v1.2.2
- 错误修复
- v1.2.1
- 新特性和改进功能
- v1.1.0
- 新特性和改进功能
- v1.0.0
- 新特性和改进功能