- 概述
- 文档处理合同
- 发行说明
- 关于文档处理合同
- Box 类
- IPersistedActivity 接口
- PrettyBoxConverter 类
- IClassifierActivity 接口
- IClassifierCapabilitiesProvider 接口
- 分类器文档类型类
- 分类器结果类
- 分类器代码活动类
- 分类器原生活动类
- 分类器异步代码活动类
- 分类器文档类型功能类
- ContentValidationData Class
- EvaluatedBusinessRulesForFieldValue Class
- EvaluatedBusinessRuleDetails Class
- 提取程序异步代码活动类
- 提取程序代码活动类
- 提取程序文档类型类
- 提取程序文档类型功能类
- 提取程序字段功能类
- 提取程序原生活动类
- 提取程序结果类
- FieldValue Class
- FieldValueResult Class
- ICapabilitiesProvider 接口
- IExtractorActivity 接口
- 提取程序有效负载类
- 文档操作优先级枚举
- 文档操作数据类
- 文档操作状态枚举
- 文档操作类型枚举
- 文档分类操作数据类
- 文档验证操作数据类
- 用户数据类
- 文档类
- 文档拆分结果类
- DomExtensions 类
- 页类
- 页面分区类
- 多边形类
- 多边形转换器类
- 元数据类
- 词组类
- 词类
- 处理源枚举
- 结果表格单元类
- 结果表值类
- 结果表列信息类
- 结果表类
- 旋转枚举
- Rule Class
- RuleResult Class
- RuleSet Class
- RuleSetResult Class
- 分区类型枚举
- 词组类型枚举
- IDocumentTextProjection 接口
- 分类结果类
- 提取结果类
- 结果文档类
- 结果文档范围类
- 结果数据点类
- 结果值类
- 结果内容引用类
- 结果值令牌类
- 结果派生字段类
- 结果数据源枚举
- 结果常量类
- 简单字段值类
- 表字段值类
- 文档组类
- 文档分类类
- 文档类型类
- 字段类
- 字段类型枚举
- FieldValueDetails Class
- 语言信息类
- 元数据输入类
- 文本类型枚举
- 类型字段类
- ITrackingActivity 接口
- ITrainableActivity 接口
- ITrainableClassifierActivity 接口
- ITrainableExtractorActivity 接口
- 可训练的分类器异步代码活动类
- 可训练的分类器代码活动类
- 可训练的分类器原生活动类
- 可训练的提取程序异步代码活动类
- 可训练的提取程序代码活动类
- 可训练的提取程序原生活动类
- Document Understanding ML
- Document Understanding OCR 本地服务器
- Document Understanding
- 智能 OCR
- ML 服务
- OCR
- OCR 合同
- OmniPage
- PDF
- [未公开] Abbyy
- [未列出] Abbyy 嵌入式

Document Understanding 活动
发行日期:2025 年 4 月 16 日
新增功能
使用新的生成式提取程序增强提取功能
为了增强具有复杂布局的短文档和长文档的生成式提取功能,您现在可以在为文档字段配置提取程序时选择以下生成式提取程序:
- 短文档简单布局– 这是现有的生成式提取程序。
- 长文档复杂布局(预览版)– 针对包含图像、手写内容、表单元素或其他复杂布局(例如浮动标注框)的长文档进行了优化。适合此提取程序的文档示例: 保险单或其他类似的具有复杂布局的长格式文档。
- 短文档复杂布局(预览版)– 针对包含图像、手写内容、表单元素或其他复杂布局(如浮动标注框)的短文档进行了优化。例如:身份证或布局复杂的医疗保健登记表。
改进
- 在数据提取作用域内使用生成式提取程序时, “管理提示”按钮已重命名为“管理字段详细信息” 。此外,在生成式提取程序提示符向导中,提示值已重命名为字段详细信息。这些更改准确描述了提供给特定字段生成提取程序的指令的目的。
- 在“分类文档范围”中使用生成式分类器时, “管理提示”按钮已重命名为“管理文档类型” 。此外,在“生成式分类器提示”向导中, “提示”值已重命名为“文档类型详细信息” 。这些更改准确描述了针对特定文档类型提供给生成分类器的指令的目的。
发布日期:2024 年 10 月 3 日
新增功能
支持本地部署设置中的活动
我们已将“运行时租户 URL”和“运行时凭据资产”属性添加到生成式分类器和提取程序活动中。借助这些属性,您现在可以直接使用外部应用程序中存储在 Orchestrator 中的凭据,在运行时访问 Document Understanding 资源。为此,请确保所选租户启用了 Document Understanding 并分配了 AI Unit。
改进
提示大小从每个问题 500 个字符增加到 1000 个字符,以提高说明的清晰度。
错误修复
ML 提取程序返回了空值,从而导致验证任务由于 null 值属性而失败。
发行日期:2024 年 7 月 31 日
错误修复
使用生成分类器和生成提取程序活动时,输入以空格开头或结尾的提示会导致“KeyNotFoundException”错误,并显示“字典中没有给定的键”消息。
发行日期:2024 年 6 月 20 日
我们一直在不断努力改善您的 UiPath Document Understanding 体验。 即使此发行版没有进行重大的主要更改,我们也要确保对产品进行次要改进和辅助功能修复。
发行日期:2024 年 5 月 27 日
改进
提示大小从每个问题 500 个字符增加到 1000 个字符,以提高说明的清晰度。 此外,如果达到每个问题 1000 个字符的提示大小限制,您将收到“超出限制”错误。
错误修复
ML 提取程序返回了空值,从而导致验证任务由于 null 值属性而失败。已知问题
Content Filtered
异常,则该活动不会生成任何结果,就像内容缺失一样。 机器人日志中将显示以下警告消息: GPT refused to handle the request because of content filtering policy. Returning empty result.
从 Studio 启动自动化时,Studio 中也会显示此消息。
发布日期:2023 年 11 月 1 日
生成式功能正式发布
- 生成式分类器活动
- 生成式提取程序活动
新特性和改进功能
- “机器学习分类训练器”活动可以使用新属性“输出文件夹”。您可通过此属性在本地保存文件。
- 现已提供对多页字段的支持。例如,当地址需要一页包含街道,而下一页包含州和邮政编码时,此功能非常有用。由于一个已知问题,表格行当前在此示例中无效。请关注我们的发行说明,以获取日后的更新。
发行日期:2023 年 6 月 7 日
我们一直在不断努力改善您的 UiPath Document Understanding 体验。 即使此发行版没有进行重大的主要更改,我们也要确保对产品进行次要改进和辅助功能修复。
发行日期:2023 年 4 月 26 日
弃用时间表
我们建议您定期查看弃用时间表,以获取有关针对即将弃用和删除功能的任何更新。发行日期:2023 年 3 月 27 日
新特性和改进功能
我们一直在不断努力改进 UiPath.DocumentUnderstanding.ML.Activities 包。 即使此补丁版本没有进行重大的主要更改,我们也要确保对产品进行次要改进和辅助功能修复。
发行日期:2022 年 12 月 15 日
新特性和改进功能
- UiPath Studio 用户界面现已提供繁体中文版本。
- 现在,您可以获享为 UiPath.DocumentUnderstanding.ML.Activities 包中包含的以下活动预填充的“API 密钥”字段的优势:机器学习分类器和机器学习提取程序。
发行日期:2022 年 10 月 24 日
新特性和改进功能
- “机器学习提取程序训练器”活动现在可以支持多值字段。
- “使用 服务器端 OCR ” 选项计划于 2022 年 12 月弃用。 我们建议使用默认行为。 有关弃用的更多详细信息,请参见 此处。
- Document Understanding Process Studio 模板已升级到新版本。 UiPath.DocumentUnderstanding.ML.Activities包是此模板的依赖项。
错误修复
- 通过升级 PDF 库并使用混合 OCR 功能,修复了在使用数字化器时导致提取错误的错误。
- 修复了一个错误,该错误会导致在同时需要图像和 DOM 时将不一致的输入发送到 ML 提取程序。
- 从机器学习提取程序收到的
GetCapabilities
调用中未使用代理设置。此错误现已修复,代理设置可按预期使用。
发行日期:2022 年 5 月 9 日
改进
- UiPath.DocumentUnderstanding.ML.Activities 包已升级到 .NET5 可移植版,您可以在 Linux 机器人上运行它们。
- “ 机器学习提取程序训练器 ” 和“ 机器学习分类器训练 器” 活动收到了新参数,这些参数按“ 公共数据集” 的名称分组,使您可以使用公共数据集而不是私有数据集。
- “ 机器学习提取 程序”活动已更新,现在也可以从 Forms AI中使用提取算法,而不仅仅是从 ML 模型 列表中使用。
- 现在,可以在离线方案中将“机器学习提取程序”活动与公共端点一起使用。
错误修复
修复了“ 机器学习提取程序训练器 ”活动中发生的错误,该错误正在导出值,即使该字段未在“ 配置训练器 ”向导中映射也是如此。 现在,一切正常。
发布日期:2021 年 10 月 5 日
新特性和改进功能
- 此版本将遥测客户端更新到版本 1.5.3,作为改进。
- UiPath.DocumentUnderstanding.ML.Activities 包已升级到 .NET5。 虽然继续支持这两个 .NET 版本,但 .NET5 项目只能在 64 位体系结构上运行。
- 向“机器学习提取程序训练器”活动添加了“ 数据集 ”和 “项目” 参数,该活动允许您选择在 AI Center 租户中上传训练数据的位置。 因此,已从活动中删除“ 端点 ”和 “MLSkill” 参数。
- 向“ 机器学习分类器 ”活动添加了“端点”参数,该活动使您能够将活动与公共 ML 技能一起使用。
- 机器学习提取程序现在可以与 Forms AI 集成。要实现此目的,唯一的要求是确保禁用“使用服务器端 OCR”选项。
发行日期:2020 年 11 月 11 日
错误修复
- 如果从 AI Fabric 请求“ML 技能”列表时出现故障响应,则现在也可以对 5XX HTTP 状态代码进行自动重试。
- 如果出现网络故障而不是阻止重试操作,机器学习提取程序现在将会重试以连接到 AI Fabric。
发行日期:2020 年 10 月 20 日
改进
机器学习提取程序的更详细的错误记录。
错误修复
- 为“ML 技能”请求添加了重试机制。
- 修复了机器学习提取程序活动无法使用所有 ML 技能的问题。
发行日期:2020 年 10 月 5 日
新特性和改进功能
- 发布了新的机器学习提取程序训练器活动,可以根据人工验证结果为重新训练 ML 模型准备数据。
- 在机器学习提取程序训练器中添加了“获取或刷新提取程序功能”功能,该功能可轻松将分类字段与可用的提取程序字段进行映射。
- 机器学习提取程序活动中包含一个名为“超时(毫秒)”的新参数。该参数可用于指定在引发错误之前等待服务器响应的时间。
- 更改了机器学习提取程序“使用服务器端 OCR”属性的工具提示文本,以表明它与机器学习提取程序训练器不兼容。
发行日期:2020 年 8 月 24 日
错误修复
- 修复了在某些情况下为 Kerberos 或 NTLM 身份验证请求返回
407ProxyAuthenticationRequired
错误消息的问题。这适用于机器学习提取程序。 - 修复了提供某个端点导致机器学习提取程序的“获取功能”功能不起作用的问题。
- 修复了未连接机器人的情况下导致机器学习提取程序引发错误的问题。
发行日期:2020 年 5 月 4 日
新特性和改进功能
UseServerSideOCR
的新选项。此选项使您可以使用从数字化接收的 OCR 结果。
机器学习提取程序现在声明了内部分类法,使您可以在数据提取范围的“配置提取程序”向导中轻松地将其可以提取的字段映射到您在分类法中定义的字段。
- v1.33.0
- 新增功能
- 使用新的生成式提取程序增强提取功能
- 改进
- v1.31.2
- 错误修复
- v1.24.1
- 错误修复
- v1.28.8
- 错误修复
- v1.31.1
- 新增功能
- 支持本地部署设置中的活动
- 改进
- 错误修复
- v1.28.7
- v1.28.6
- 错误修复
- v1.28.5
- 错误修复
- v1.28.4
- v1.28.3
- v1.28.2
- 改进
- 错误修复
- 已知问题
- v1.28.1
- 新功能
- v1.24.0
- 生成式功能正式发布
- 新特性和改进功能
- v1.21.2
- v1.21.1
- 弃用时间表
- v1.17.1
- 新特性和改进功能
- v1.18.0
- 新特性和改进功能
- v1.17.0
- 新特性和改进功能
- 错误修复
- v1.13.2
- 改进
- 错误修复
- v1.9.2
- 错误修复
- v1.9.1
- 新特性和改进功能
- v1.7.0
- 新特性和改进功能
- v1.5.2
- 错误修复
- v1.5.1
- 改进
- 错误修复
- v1.5.0
- 新特性和改进功能
- v1.2.2
- 错误修复
- v1.2.1
- 新特性和改进功能
- v1.1.0
- 新特性和改进功能
- v1.0.0
- 新特性和改进功能