activities

latest

false

重要 :

请注意，此内容已使用机器翻译进行了部分本地化。新发布内容的本地化可能需要 1-2 周的时间才能完成。

Document Understanding 活动

上次更新日期 2026年5月19日

关于“智能 OCR”活动包

UiPath™.IntelligentOCR.Activities 包含使用完整、开放、可扩展的方法启用文档处理流程的基础架构。

备注：

安装UiPath.IntelligentOCR.Activities包时，将自动安装UiPath.DocumentUnderstanding.ML.Activities包，以执行基于 ML 的分类和提取。

已知限制

如果您使用的是暂停工作流的“等待”类型活动，并且您正在使用DataTable变量，则DataTable变量必须可序列化。例如，如果使用new System.Data.DataTable初始化DataTable变量，则它将变为不可序列化，这可能导致项目执行失败。为防止出现这种情况，您可以将DataTable变量的默认值留空，或为DataTable变量分配一个名称，例如： new System.Data.DataTable("MyTable") 。

替换已移除的版本

下表显示了已删除的包版本，以及建议使用的版本。

表格 1. 已删除的版本及其推荐的替换版本

	推荐版本
4.3.0 - 预览版	4.4.0 - 预览版
2.1.0（推荐）	2.2.0
1.4.0	1.5.0
1.2.0	1.2.1

重要

从v6.19.0版本开始，在项目中安装UiPath.IntelligentOCR.Activities包时，系统会自动安装UiPath.DocumentUnderstanding.ML.Activities包，您无需单独安装。
如果您使用的是 UiPath™ Studio 2023.4.4 或更早版本，请确保安装最新版本的 Windows .NET 6.0 Desktop Runtime。

版本兼容性

更新UiPath.IntelligentOCR.Activities时，还需要更新UiPath.UIAutomation.Activities包和UiPath.OCR.Activities包（如果项目中包含这些包）。

不应在同一项目中一起使用UiPath.IntelligentOCR.Activities和UiPath.DocumentUnderstanding.Activities 。UiPath.IntelligentOCR.Activities包应该用于 Windows（或旧版）工作流，而UiPath.DocumentUnderstanding.Activities包应该用于跨平台工作流。

备注：

在使用“监控”功能之前，请考虑以下事项：

只有 UiPath.DocumentUnderstanding.Activities 2.7.0 版或更高版本支持监控；
仅IntelligentOCR.Activities v6.20 或更高版本包含“ Document Understanding 项目提取程序”活动，该活动支持“监控

支持的格式

“智能 OCR”活动包可以支持以下任何文件类型：.png, .gif, .jpe, .jpg, .jpeg, .tiff, .tif, .bmp 和 .pdf。

支持 C# 项目语言

从版本 4.10.0 开始，此活动包已经过验证，可在 C# 项目中使用。

功能

本节显示 Intelligent.OCR 包的多种功能。

将文档数字化

您可以使用“数字化文档”活动来实现此目的。这将仅在必要时使用您选择的 OCR 引擎从任何 PDF 或图像中检索文本。

在逐个处理文档时，它们会经历数字化流程。非数字（扫描）文档的区别在于，您需要应用所选的 OCR 引擎。此步骤的输出是文档对象模型和包含所有文档文本的字符串变量，并将传递到后续步骤。

分类文档

您可以使用“分类文档”活动来实现此目的。这允许使用任何分类算法来识别文件的文档类型。

数字化后，文档将进行分类。如果您在同一个项目中使用多种文档类型，则要正确提取数据，您需要知道正在使用的文档类型。重要的是，您可以在同一作用域中使用多个分类器，可以配置分类器，并稍后在框架中训练它们。分类结果有助于在提取中应用正确的策略。

以下列表显示了可用的分类器：

“基于关键字的分类器”活动是第一个此类分类器，目标是对标题文档进行分类。
“智能关键词分类器”活动不仅可以分类，还可以“拆分”包含多种文档类型的文件。
“机器学习分类器”活动可以使用强大的 ML 模型对您的文件进行分类，您可以根据需要训练该模型。
“生成式分类器”活动允许您使用生成模型对文档进行分类。

验证自动分类

您可以使用“显示分类站点” Attended 活动来实现此目的，该活动会提供一个文档处理特定的用户界面，用于验证和更正自动分类输出。

特别是对于涉及文件拆分的用例，强烈建议使用人工分类验证步骤，以确保用于数据提取的下游处理正常工作。

有人值守的活动的替代方案是使用长时间运行的工作流，该工作流旨在以最佳方式实现人机协作。此场景与“创建文档分类操作”和“等待文档分类操作然后继续”活动相关联。

训练分类器

您可以使用“训练分类器范围”活动来实现此目的。这使得能够关闭任何具有学习能力的分类算法的反馈循环。将分类器训练器拖放到“作用域”活动中，并使用“配置分类器”向导启用它们，以确保分类器使用由人工通过“分类站点”或“验证站点”验证的信息来提高其自身的性能。

分类与所使用的分类器一样有效。如果文档未正确分类，则表示活动分类器未知该文档。该框架提供了训练分类器的机会，以提高对文档类的识别。

以下是可用的分类器训练器列表：

基于关键字的分类器训练器是与基于关键字的分类器配对的训练器活动。
智能关键词分类器训练器会启用智能关键词分类器的反馈循环。
机器学习分类训练器是与机器学习分类器配对的训练器活动。

从文档中提取数据

您可以使用“数据提取作用域”活动来实现此目的。这允许使用任何数据提取算法来识别分类文档中的不同字段。

提取只是从给定的文档类型中获取您感兴趣的数据。例如，如果要使用字符串操作来从 5 页文档中提取特定数据，则非常麻烦。在此框架中，您可以在同一数据提取作用域内针对不同的文档结构使用不同的提取程序。提取结果将进一步传递以进行验证。

以下是可用提取程序的列表：

基于正则表达式的提取程序是一个基本数据提取程序，可应用正则表达式匹配来识别特定字段的最佳候选对象。
表单提取程序使用预定义的模板来处理结构化的固定表单文档。
机器学习提取程序利用 AI 和机器学习的功能，通过使用 UiPath™ 的公共数据提取服务之一或调用可以在其中构建和托管的经过自定义训练的机器学习模型，识别结构化或半结构化文档中的信息。 AI Center 。
生成式提取程序允许您使用生成式模型提取文档。

验证自动数据提取结果

您可以使用“显示验证站点” Attended 活动来实现此目的，该活动提供一个特定于文档处理的用户界面，以便进行数据验证和更正。

The extracted data can be validated by a human user through the Validation Station. A best practice is to build logic around the decision of adding or not a human validation step, with rules depending on the specific use case to be implemented. Validation results can then be exported and used in further automation activities.
您还可以使用“创建文档验证操作”和“等待文档验证操作并继续”活动，通过长时间运行的工作流来启用人工验证，从而优化人机协作。

火车提取器

您可以使用“训练提取程序作用域”活动来实现此目的。这使得能够关闭任何具有学习能力的数据提取算法的反馈循环。将提取程序训练器拖放到此作用域活动中，并使用“配置提取程序”向导启用它们，以确保提取程序使用经人工通过验证站点验证的信息来提高其自身的性能。

与所使用的提取器一样，提取效率很高。如果未正确提取字段值，则表示活动的提取程序不知道这些字段值。该框架提供了培训提取程序的机会，以提高对字段值的识别。

机器学习提取程序训练器通过收集重新训练AI Center中托管的机器学习模型所需的数据，关闭了基于 ML 的数据提取的反馈循环。该活动是机器学习提取程序活动的配套活动。

导出提取的信息

您可以使用“导出提取结果”活动来实现此目的。这使您可以将复杂结构的已提取数据导出到简单的数据集（数据表集合）。

获得经过验证的信息后，您可以按原样使用它，也可以将其保存为数据表格式，该格式可以很容易地转换为 Excel 文件。

UiPath.IntelligentOCR.Activities包与基于公共UiPath.DocumentProcessing.Contracts包构建的任何自定义分类或数据提取活动兼容。它提供了完全的灵活性，可以根据您的用例构建自己的算法，也可以将其与任何第三方解决方案集成以进行文档分类和数据提取。

以下版本的包已从官方订阅源中删除。如果您有任何问题，请联系我们的支持团队。

此页面有帮助吗？

前一个发行说明

下一个项目兼容性

Document Understanding 活动

已知限制​

替换已移除的版本​

重要​

版本兼容性​

支持的格式​

支持 C# 项目语言​

功能​

将文档数字化​

分类文档​

验证自动分类​

训练分类器​

从文档中提取数据​

验证自动数据提取结果​

火车提取器​

导出提取的信息​