- 概述
- 文档处理合同
- 发行说明
- 关于文档处理合同
- Box 类
- IPersistedActivity 接口
- PrettyBoxConverter 类
- IClassifierActivity 接口
- IClassifierCapabilitiesProvider 接口
- 分类器文档类型类
- 分类器结果类
- 分类器代码活动类
- 分类器原生活动类
- 分类器异步代码活动类
- 分类器文档类型功能类
- ContentValidationData Class
- EvaluatedBusinessRulesForFieldValue Class
- EvaluatedBusinessRuleDetails Class
- 提取程序异步代码活动类
- 提取程序代码活动类
- 提取程序文档类型类
- 提取程序文档类型功能类
- 提取程序字段功能类
- 提取程序原生活动类
- 提取程序结果类
- FieldValue Class
- FieldValueResult Class
- ICapabilitiesProvider 接口
- IExtractorActivity 接口
- 提取程序有效负载类
- 文档操作优先级枚举
- 文档操作数据类
- 文档操作状态枚举
- 文档操作类型枚举
- 文档分类操作数据类
- 文档验证操作数据类
- 用户数据类
- 文档类
- 文档拆分结果类
- DomExtensions 类
- 页类
- 页面分区类
- 多边形类
- 多边形转换器类
- 元数据类
- 词组类
- 词类
- 处理源枚举
- 结果表格单元类
- 结果表值类
- 结果表列信息类
- 结果表类
- 旋转枚举
- Rule Class
- RuleResult Class
- RuleSet Class
- RuleSetResult Class
- 分区类型枚举
- 词组类型枚举
- IDocumentTextProjection 接口
- 分类结果类
- 提取结果类
- 结果文档类
- 结果文档范围类
- 结果数据点类
- 结果值类
- 结果内容引用类
- 结果值令牌类
- 结果派生字段类
- 结果数据源枚举
- 结果常量类
- 简单字段值类
- 表字段值类
- 文档组类
- 文档分类类
- 文档类型类
- 字段类
- 字段类型枚举
- FieldValueDetails Class
- 语言信息类
- 元数据输入类
- 文本类型枚举
- 类型字段类
- ITrackingActivity 接口
- ITrainableActivity 接口
- ITrainableClassifierActivity 接口
- ITrainableExtractorActivity 接口
- 可训练的分类器异步代码活动类
- 可训练的分类器代码活动类
- 可训练的分类器原生活动类
- 可训练的提取程序异步代码活动类
- 可训练的提取程序代码活动类
- 可训练的提取程序原生活动类
- 基本数据点类 - 预览
- 提取结果处理程序类 - 预览
- Document Understanding ML
- Document Understanding OCR 本地服务器
- Document Understanding
- 智能 OCR
- 发行说明
- 关于“智能 OCR”活动包
- 项目兼容性
- 加载分类
- 将文档数字化
- 分类文档作用域
- 基于关键词的分类器
- Document Understanding 项目分类器
- 智能关键词分类器
- 创建文档分类操作
- 创建文档验证工件
- 检索文档验证工件
- 等待文档分类操作然后继续
- 训练分类器范围
- 基于关键词的分类训练器
- 智能关键词分类训练器
- 数据提取作用域
- Document Understanding 项目提取程序
- Document Understanding 项目提取程序训练器
- 基于正则表达式的提取程序
- 表单提取程序
- 智能表单提取程序
- 文档脱敏
- 创建文档验证操作
- 等待文档验证操作然后继续
- 训练提取程序范围
- 导出提取结果
- 机器学习提取程序
- 机器学习提取程序训练器
- 机器学习分类器
- 机器学习分类训练器
- 生成分类器
- 生成式提取程序
- 配置身份验证
- ML 服务
- OCR
- OCR 合同
- OmniPage
- PDF
- [未公开] Abbyy
- [未列出] Abbyy 嵌入式

Document Understanding 活动
基于关键词的分类器
UiPath.IntelligentOCR.Activities.DocumentClassification.KeywordBasedClassifier
描述
此活动的功能如下:
- 包含基于关键字的文档分类算法,可针对具有重复标题的文件进行分类。
- Classifies a document based on a given training set, found in a specified file, if used inside the Classify Document Scope activity.
This activity can only be used together with the Classify Document Scope and Train Classifiers Scope activities.
项目兼容性
Windows - Legacy | Windows
配置
设计器面板
-
LearningFilePath - The full path to the file containing the classifier data. This field supports only strings and
Stringvariables.备注:Only one of the above parameters can be set at a time. You can use either the LearningData string or the LearningFilePath string.
The LearningFilePath specifies the locations from where to retrieve the classifier data.
The LearningData contains the actual information of that classifier.
属性面板
常见
- “显示名称”- 活动的显示名称。
输入
-
LearningData - The string containing the serialized classifier data. This field supports only strings and
Stringvariables. -
LearningFilePath - The full path to the file containing the classifier data. This field supports only strings and
Stringvariables.备注:Only one of the above parameters can be set at a time. You can use either the LearningData string or the LearningFilePath string.
The LearningFilePath specifies the locations from where to retrieve the classifier data.
The LearningData contains the actual information of that classifier.
-
“私有”- 选中后将不再以“Verbose”级别记录变量和参数的值。
备注:The best practice is to create an empty
.jsonfile at that location, then use its name in the LearningFilePath field.
使用“管理学习”向导
您只需访问活动的管理学习向导,即可在设计时配置“基于关键字的分类器”。通过使用具有更新后学习文件路径的同一向导,可以使用同一向导来审核在文档分类训练阶段收集的数据。
This wizard allows you to configure and manage the keywords used by this activity for identifying the document type. It was created to suit the need for editing a file path. If a Learning Data parameter with a variable is used instead, then you are asked if you either want to edit a specific file path or to abort this operation.
“管理基于关键字的分类器学习”向导只能用于编辑和配置文件路径。
-
Add a Keyword Based Classifier or Keyword Based Classifier Trainer activity to your workflow.
-
Configure your Keyword Based Classifier activity by adding the path of a
.jsonfile. Take the following information into consideration, when configuring the classifier:- If no path is provided and the Manage Learning option is selected, then a pop-up is displayed, asking for a Learning File Path input. Once the path is provided, the wizard opens.
- 可以添加变量而不是
.json文件,但是,由于向导无法将学习模式应用于学习数据变量,因此它会要求您提供可编辑的特定文件路径。
-
Select Manage Learning.
The Manage Keyword Based Classifier Learning wizard window opens.
Figure 1. The Manage Keyword Based Classifier Learning wizard overview

-
If no path is provided and the Manage Learning option is selected, then a pop-up is displayed, asking for a Learning File Path. Once the path is provided, the wizard opens.
Figure 2. The Warning pop-up displayed if no path is provided and the Manage Learning option is selected
备注:即使没有可用的
.json文件,您也可以直接将新的.json文件的名称添加到活动中,系统会在指定的文件夹中自动创建.json文件。
为文档类型添加关键字
该向导包含您在分类法中定义的尽可能多的文档类型类别。您可以为每种文档类型添加单个或多个关键字。该活动学习特定文档的关键字,然后能够根据这些规则对特定类型的文档进行识别和分类。
所有条目都应作为字符串输入,并在 ""(引号)之间输入,并且您可以添加单个或多个值。要添加或删除关键字,请在向导中执行以下步骤:
- Select Add new keyword set to add an extra field to that category.
- Select the
remove icon, to remove the field and its keywords. - Select Save to save your wizard configuration. You can find all the added values in the
.jsonfile of the project.备注:根据 Visual Basic 约定(双引号),在“管理关键字”向导中作为关键字的一部分输入的双引号始终会转义,即使在 C# 风格的项目中也是如此。
Document Understanding 集成
The Keyword Based Classifier activity is part of the Document Understanding Solutions. Visit the Document Understanding Guide for more information.