- 概述
- 文档处理合同
- 发行说明
- 关于文档处理合同
- Box 类
- IPersistedActivity 接口
- PrettyBoxConverter 类
- IClassifierActivity 接口
- IClassifierCapabilitiesProvider 接口
- 分类器文档类型类
- 分类器结果类
- 分类器代码活动类
- 分类器原生活动类
- 分类器异步代码活动类
- 分类器文档类型功能类
- ContentValidationData Class
- EvaluatedBusinessRulesForFieldValue Class
- EvaluatedBusinessRuleDetails Class
- 提取程序异步代码活动类
- 提取程序代码活动类
- 提取程序文档类型类
- 提取程序文档类型功能类
- 提取程序字段功能类
- 提取程序原生活动类
- 提取程序结果类
- FieldValue Class
- FieldValueResult Class
- ICapabilitiesProvider 接口
- IExtractorActivity 接口
- 提取程序有效负载类
- 文档操作优先级枚举
- 文档操作数据类
- 文档操作状态枚举
- 文档操作类型枚举
- 文档分类操作数据类
- 文档验证操作数据类
- 用户数据类
- 文档类
- 文档拆分结果类
- DomExtensions 类
- 页类
- 页面分区类
- 多边形类
- 多边形转换器类
- 元数据类
- 词组类
- 词类
- 处理源枚举
- 结果表格单元类
- 结果表值类
- 结果表列信息类
- 结果表类
- 旋转枚举
- Rule Class
- RuleResult Class
- RuleSet Class
- RuleSetResult Class
- 分区类型枚举
- 词组类型枚举
- IDocumentTextProjection 接口
- 分类结果类
- 提取结果类
- 结果文档类
- 结果文档范围类
- 结果数据点类
- 结果值类
- 结果内容引用类
- 结果值令牌类
- 结果派生字段类
- 结果数据源枚举
- 结果常量类
- 简单字段值类
- 表字段值类
- 文档组类
- 文档分类类
- 文档类型类
- 字段类
- 字段类型枚举
- FieldValueDetails Class
- 语言信息类
- 元数据输入类
- 文本类型枚举
- 类型字段类
- ITrackingActivity 接口
- ITrainableActivity 接口
- ITrainableClassifierActivity 接口
- ITrainableExtractorActivity 接口
- 可训练的分类器异步代码活动类
- 可训练的分类器代码活动类
- 可训练的分类器原生活动类
- 可训练的提取程序异步代码活动类
- 可训练的提取程序代码活动类
- 可训练的提取程序原生活动类
- 基本数据点类 - 预览
- 提取结果处理程序类 - 预览
- Document Understanding ML
- Document Understanding OCR 本地服务器
- Document Understanding
- 智能 OCR
- 发行说明
- 关于“智能 OCR”活动包
- 项目兼容性
- 加载分类
- 将文档数字化
- 分类文档作用域
- 基于关键词的分类器
- Document Understanding 项目分类器
- 智能关键词分类器
- 使用分类站点
- 创建文档分类操作
- 创建文档验证工件
- 检索文档验证工件
- 等待文档分类操作然后继续
- 训练分类器范围
- 基于关键词的分类训练器
- 智能关键词分类训练器
- 数据提取作用域
- Document Understanding 项目提取程序
- Document Understanding 项目提取程序训练器
- 基于正则表达式的提取程序
- 表单提取程序
- 智能表单提取程序
- 文档脱敏
- 创建文档验证操作
- 等待文档验证操作然后继续
- 训练提取程序范围
- 导出提取结果
- 机器学习提取程序
- 机器学习提取程序训练器
- 机器学习分类器
- 机器学习分类训练器
- 生成分类器
- 生成式提取程序
- 配置身份验证
- ML 服务
- OCR
- OCR 合同
- OmniPage
- PDF
- [未公开] Abbyy
- [未列出] Abbyy 嵌入式

Document Understanding 活动
使用分类站点
“分类站点”用于执行、审核和更正文档分类信息。打开后,它将显示所有分类信息以及正在处理的文件。分类站点充当人工验证工具,可用于将文档类型给要处理的任何文件,用于文件中的任何页面子集。
图 1. “分类站点”概览,示例文档在此进行分类

文档视图部分
分类站点的右侧区域包含原始文档的交互式版本,可以在其中选择文本或文档部分,并且可以根据数字化流程的输出单击文字。 此区域还包含用于“放大和缩小”、“选择和旋转”页面、“搜索文档”或“切换到文本视图”的选项。
图 2.“分类站点”交互式区域概览,您可以在其中选择文档的某些部分

下表显示了分类站点屏幕右侧区域的可用选项及其说明。该区域允许您与文档交互并选择文档的各个部分。
| 选项 | 描述 |
|---|---|
| 显示分类站点支持的所有可用键盘快捷方式,其中可能包括以下快捷方式:
|
| 在文档的文本视图和图像视图之间切换:
|
|
注意:仅在“仅文本视图”选项处于“活动”状态时才处于“活动”状态 | 在文本视图中设置选择模式,包括以下选项:
|
| 在图像视图中设置选择模式,包括以下选项:
|
|
| 顺时针旋转当前页面。 |
|
| 在分类站点使用的文档结果之间启动搜索。 |
|
| 重置文档的缩放级别。仅当存在先前已放大或缩小文档的情况,才启用此选项。 |
| 放大文档。 |
| 缩小文档。 备注: 要放大或缩小,您还可以按住 Ctrl 键并滚动鼠标滚轮:按住 Ctrl 键并向上滚动可查看文档的特定部分;按住 Ctrl 键并向下滚动可查看文档的较大部分。 |
文档分类部分
分类字段受分类的影响,它们为您提供三种可能的情况:
- 如果针对文档给定部分提供的分类信息正确无误,则无需对该字段执行任何操作。
- 如果提供了部分文档的分类信息,但这些分类信息有误,则可以更正与该页面范围相关联的文档类型。
- 如果没有针对文档给定部分提供分类信息,则可以将其保留为未分类,或为其选择正确的文档类型。
- 如果针对文档给定部分(已分类或未分类、正确或不正确)提供的页面范围不完全准确(缺少页面或有额外页面),您可以通过将页面移至上面或下面部分来加以更正。
On the left side of the screen you can see all document types within the file. You can select the desired document type (that has been previously defined in Taxonomy) for any given page range of the document, from the document type dropdown list. Hover over the page, select Options, and then select the document type from the dropdown list.
图 3. 从下拉列表中选择文档类型

选择选项
(可选)对于文档类型,查看包含以下可用选项的下拉菜单:
-
添加引用 - 可以添加引用,以支持用户执行的文档类型选择。
备注:引用是文档中的一个令牌或令牌集合,可用作关键字来标识文档的类别。用户选择的引用通过“训练分类器作用域”添加到“关键字学习”文件中。
图 4. 添加引用并高亮显示引用的操作

-
删除引用 - 删除先前为给定文档类型部分添加的引用。
图 5.删除引用的操作

-
更改引用- 将已有的引用更改为新引用。选择“更改引用” ,然后选择文档的其他部分。
图 6. 更改引用的操作

-
上移所有页面 - 将整个页面部分上移至先前定义的文档类型,除第一个部分以外,所有部分的“选项”均处于活动状态。使用此选项将删除您正在操作的部分,从而将该页面范围与上一个页面范围统一。
图 7. 上移所有页面的操作

-
下移所有页面 - 将整个页面部分下移至下一个定义的文档类型。除最后一个部分以外,所有部分中的“选项”均处于活动状态。使用此选项将删除您正在操作的部分,从而将该页面范围与下一个页面范围统一。
图 8. 下移所有页面的操作

其他分类选项
-
拆分文档 - 标记新文档类型的开头,在此完成选择后将其移动到新文档类型部分的下面。
图 9.拆分文档的操作

-
Drag and Drop - If the EnablePageReorder property is disabled, then this allows the rearrangement of pages between sections. Pages can be rearranged with the Drag and Drop option only if the order within a document is kept (page numbers should be consecutive). Drag and drop pages in the document to rearrange them.
图 10. 重新排列文档页面的操作

-
对页面重新排序- 拖放同一文档中的页面以重新排序。仅当在显示分类站点活动中将启用页面重新排序属性设置为 True 时,此选项才可用。
图 11.分类期间对同一文档内的页面重新排序

-
删除引用- 从特定页面中删除引用。在文档页面上选择“更多选项” ,然后选择“删除引用” 。
图 12. 删除引用的操作

-
高亮显示引用- 在特定页面中高亮显示引用。在文档页面上选择“更多选项” ,然后选择“高亮显示引用” 。
图 13. 高亮显示引用的操作

键盘快捷方式
有许多键盘快捷方式可用来优化与“分类站点”的人工交互。我们建议您尽量使用。您可以在“键盘快捷键”弹出窗口中查看这些快捷方式。
要开始使用键盘快捷方式,请转到“更多选项” ,选择“键盘快捷方式” ,然后选择“切换键盘快捷方式” 。
以下列表显示了可用的键盘快捷方式及其相应的说明:
- 分类
- n:移至下一个字段;
- p:移至上一个字段;
- s:在所选页面之后拆分;
- h:高亮显示组引用;
- a:添加/更改引用;
- DEL:删除引用;
- m + 向上键 ↑:上移所有页面;
- m + 向下键 ↓:下移所有页面;
- 左、右箭头键 ←→ + 上、下箭头键 ↑↓:浏览页面
- Document:
- d +:放大;
- d -:缩小;
- d 0:重置缩放比例;
- d r:顺时针旋转页面;
- dt:切换文本模式;
- d s:更改选择模式;
- d a:清除所选择的绘制锚点;
- /:启动搜索。
- 辅助功能:
- 左、右箭头键 → + 上、下箭头键 ↑↓:浏览字词,并创建或选择更多区域;
- Shift 和上、下、左、右箭头键:调整区域选择的大小;
- Enter:确认区域选择;
- Page Down Page Up:下一页或上一页;
- ESC:取消全选;
- Alt p:切换 PDF 查看器焦点。
- 常规:
- ?:此屏幕;
- /:将文档报告为异常;
- CTRL ENTER:保存分类;
- CTRL DEL:放弃所有当前更改。
与分类站点中的文档交互
如果您的用例需要高亮显示您正在审核分类的每个页组的选定文档类型,则您可以使用可用选项。
要使用图像视图中的“自定义区域”选项选择文档的一部分,请执行以下操作:
- 确保已选中“图像视图” 。
- Select Tokens and then select Custom area.
- 在文档中选择所需区域。
- 转到文档的“更多选项”(位于左侧),然后选择是否要“更改引用”或“删除引用” 。
图 14. 显示如何在图像视图中执行选择的动图

与在图像视图中使用“自定义区域”选项选择文档的一部分类似,您可以在文本视图中执行相同的操作。唯一的区别是,您需要确保选择“文本视图” 。
图 15. 显示如何在文本视图中执行选择的动图

数据确认和验证
“分类站点”底部有以下三个选项,用于确认或放弃更改:
- 放弃更改:放弃用户做的所有更改,并还原为验证任务的初始状态。
- 保存:保存已确认的更正数据。
- 异常
:将文档报告为异常。
Document Understanding 集成
显示分类站点活动是 Document Understanding 解决方案的一部分。如需了解详情,请访问Document Understanding 指南。
- 键盘快捷方式;
- 将面板侧从左侧切换到右侧。
- 纯文本视图。 
- 令牌。
- 自定义区域;
- 选中后选择。 

