activities
latest
false
重要 :
请注意,此内容已使用机器翻译进行了部分本地化。 新发布内容的本地化可能需要 1-2 周的时间才能完成。
UiPath logo, featuring letters U and I in white

Document Understanding 活动

上次更新日期 2025年10月2日

紧凑型验证站点

验证站点可让您查看和更正从文件中自动提取的数据,或手动处理文件以进行数据提取。打开验证站点后,系统会显示所有提取的信息以及正在处理的文件。

备注: 使用“紧凑” 显示模式时,将忽略 字段验证置信度 % 。
图 1.精简版“验证站点”概述

验证站点中显示的字段正是在工作流中所使用的分类中定义的字段。

文档视图

验证站点的右侧区域包含原始文档的交互式版本,可以在其中选择文本或文档部分,并且可以根据数字化流程的输出选择文字。此区域还包含用于缩放、选择和旋转页面、搜索文档或切换到文本视图的选项。

图 2. 交互式“验证站点”右侧区域概览

下表显示了“验证站点”屏幕交互式部分的选项,以及您可以使用这些选项执行的操作。

表 1.验证站点中的可用选项及其说明

选项

描述

更多选项

显示验证站点支持的所有可用键盘快捷方式。
  • 键盘快捷方式 - 键盘快捷方式
  • 隐藏 - 隐藏提取的令牌
  • 切换 - 从左到右切换面板侧

图像视图

注意:除 Communications Mining 验证操作外,均处于活动状态。
在文档的文本视图和图像视图之间切换。
  • 图像视图 - 图像视图
  • 文本视图 - 纯文本视图

text - 文本

注意:仅在以文本模式查看文档时处于活动状态。此设置不适用于 Communications Mining 验证操作。
在文本视图中设置选择模式:
  • text - 文本
  • 令牌 - 令牌

令牌

在图像视图中设置选择模式:
  • 令牌 - 令牌
  • 自定义区域 - 自定义区域
  • 选择 - 选中后选择

rotate

顺时针旋转当前页面。
注意:旋转 ”选项仅在“ 图像”视图中可用。

搜索

在验证站点使用的文档结果之间启动搜索。

重置

重置文档的缩放级别。仅当存在先前已放大或缩小文档的情况,才启用此选项。

放大

放大文档。

缩小

缩小文档。

备注:

要放大或缩小,您还可以按住 Ctrl 键并滚动鼠标滚轮:按住 Ctrl 键并向上滚动可查看文档的特定部分;按住 Ctrl 键并向下滚动可查看文档的较大部分。

与“验证站点”中的文档交互

本节介绍如何使用可用选项与“验证站点”中的文档进行交互。

要使用图像视图中的“自定义区域”选项选择文档的一部分,请执行以下操作:
  1. 确保已选中“图像视图”。
  2. 选择“选择模式” ,然后选择“自定义区域”
  3. 在文档中选择所需区域。
  4. 转到文档的“更多选项”,然后选择是否要“更改提取的值”还是“还原为上一个值”
    图 3. 显示如何在图像视图中执行选择的动图

与在图像视图中使用“自定义区域”选项选择文档的一部分类似,您可以在文本视图中执行相同的操作。唯一的区别是,您需要确保选择“文本视图”。

图 4. 显示如何在文本视图中使用自定义区域的动图

键盘快捷方式

您可以使用键盘快捷方式来优化与“验证站点”的交互。您可以在“键盘快捷键”弹出窗口中查看它们。

要开始使用键盘快捷方式,请转到“菜单” ,选择“显示可用的键盘快捷方式” ,然后选择“切换键盘快捷方式”

下表显示了所有可用的键盘快捷方式及其相应的说明。

表 2. 验证站点键盘快捷方式及其说明
 

描述

n

移至下一个字段

p

移至上一个字段

f v

将值标记为已验证

f c

更改提取的值

f z

还原为上一个值

f a

添加其他值

f s

在建议之间切换

Esc

Exits edit mode (for Fields and Tables)

  • Collapses the derived parts (for Fields)
  • 取消选择行(用于表格选择)
  • 退出表格选择模式(用于表格选择)
  • 请勿保存未确认的字段

Del

  • 删除选定的值(对于字段)
  • 删除选定的行(用于表格选择)

CTRL SHIFT ENTER

保存未确认的字段

CTRL SHIFT S

将数据另存为草稿

Alt p

切换 PDF 查看器焦点

d +

放大

d -

缩小

d 0

重置缩放比例

d r

顺时针旋转页面

d t

切换文本模式

/

启动搜索

d s

更改选择模式

d a

清除所选择的绘制锚点

d h

切换提取的令牌

s

右移所选行

s

左移所选行

s

上移所选行

s

下移所选行

s d

复制所选行

s v

垂直行

s f

水平行

s a

通过移动鼠标自动检测

s t

手形工具 - 移动并删除行

?

此屏幕

!

将文档记录为异常

CTRL ENTER

保存数据

CTRL DEL

放弃所有当前更改

向右箭头键

移至右侧单元格

向左箭头键

移至左侧单元格

向上箭头

移至顶部单元格

向下箭头

移至底部单元格

t v

将单元格标记为已验证

t c

更改提取的单元格

t z

还原为上一个单元格值

t d

放弃表格中的更改

t DEL

删除选定的单元格

t ESC

关闭表格编辑器

TE

提取新表格

1 2 3 4 5 6 7 8 9 q w e r y a g h j k l z x c v m @ # $ % ^ & *** ( ) [ ] {

  • 使用与每个字段关联的键为其分配值(字母不区分大小写)。
  • 如果未进行选择,请使用同一个键将焦点移至某个字段。
  • o 键经保留用于“文档类型”字段分配。

在“验证站点”的右侧区域中选择“菜单” ,然后选择“隐藏提取的令牌” ,以获得干净的视图面板并隐藏提取的令牌的高亮显示。

图 5.显示选择了“隐藏提取的令牌”选项的动画图像

数据提取部分

验证站点中显示文档类型及其相应字段的区域,可用于选择每个元素的状态,并将其链接到文档中的相应词语或区域。

系统将显示每个文档字段的所提取信息的置信度级别。将鼠标悬停在提取值旁边的圆圈上,以查看“提取置信度”“OCR 置信度”值:
  • OCR 置信 度级别由工作流中用于提取的 OCR 引擎提供。 如果使用的 OCR 未报告任何置信度级别,则显示 N/A 而不是百分比。
  • 提取可信度 ”级别由工作流中使用的提取程序指定。
置信度分数应仅用于指导目的。 您可以通过手动验证数据来提高置信度分数。
注意:如果您更改特定字段的提取值,则每个字段的 OCR 置信度级别将分别更改。

您可以使用字段快捷方式为字段分配值或在字段之间切换。将值分配给字段后,系统会根据所选字段的颜色高亮显示该字段。

对于分配的值,表格字段中会显示一个文档裁剪结果。这有助于更好地定位从中提取值的区域,还可以通过将其与文档裁剪结果进行比较来再次检查值。

备注:

“文档类型”字段是一个特殊字段,您可以在以下情况下对其执行操作:

  • 如果提取结果包含一个文档类型,并且该文档类型正确无误,则无需执行任何操作。
  • 如果提取结果中包含一个文档类型,并且该文档类型有误,则您必须选择正确的文档类型,并从文档中提供相关证据。
  • 如果未提供提取结果,并且分类中仅有一种文档类型,则预选该文档类型,但这需要证明。
  • 如果未提供提取结果,并且分类中存在多种文档类型,则您必须手动选择所需的文档类型,并为此提供证据。

自动提取的字段具有同样以颜色进行编码的置信度百分比,旨在帮助您检测需要帮助的字段。

置信度分为四个级别:

  • 低于 50%,颜色编码为红色。
  • 介于 50% 和 85% 之间,以黄色表示。
  • 介于 86% 和 99% 之间,以浅绿色表示。
  • 100%,以绿色表示。

    要提高置信度,您可以通过手动选择信息来验证信息。手动选择文档的一部分后,为提取的字段选择“选项”,然后选择“更改提取的值”。

所有包含信息的字段都有一个“选项”options下拉菜单,可通过选择来访问此菜单。下拉列表变为可见,显示多个编辑选项。

“选项”options菜单包含以下选项:

  • 更改提取的值 - 使用手动选择的值更改自动提取的值。仅当从文档中选择一个或多个与原始值不同的值时,此字段才处于活动状态。
  • 还原为上一个值 - 将字段的值重置为其上一个状态。仅当存在先前已更改或删除某个值的情况时,此选项才处于活动状态。
  • 标记为缺失 - 如果文档中没有信息,则将字段标记为缺失。
注意: “紧凑模式”会根据可用的屏幕空间以及字段与文档视图部分之间的分隔线的位置进行调整。如果可用空间足够,则系统会与字段信息内联显示值。但是,如果空间有限,则仅会显示字段信息。根据需要拖放分隔线,以调整字段区域的宽度。
选择模式

使用验证站点向导时,有几种选择文本的方法。使用这些方法,您可以快速浏览整个文档,并轻松选择所需的字词来验证字段。

以下是所有可用选择选项的列表:

  • 选择一个单词 - 选择所需的单词。
  • 选择连续的单词 - 选择第一个单词,然后按住 Shift 键并选择范围中的最后一个单词。
  • 选择多个不同的单词 - 选择第一个单词,然后按住 CTRL 键并选择其余所需的单词。
  • 合并多个选择 - 选择第一个单词,然后按住 Shift 键并选择范围中的最后一个单词作为第一个选择,然后按住 CTRL 键并选择以添加另一个范围,直到完成选择。
  • 区域选择 - 进行选择并选择选择类型:
    • 令牌令牌 - 选择所选区域中的所有单词。
    • 自定义区域自定义区域 - 仅捕获区域,而不捕获其中的文字。
    • 选中后选择选中后选择 - 使用单独的单词选择整个区域,由您决定选择的类型。
其他选项
  • 注释 - 仅当在“分类管理器”中启用了该特定字段的验证程序注释时,才会显示此字段。根据其配置方式,可以为以下内容:
    • 此为文本字段,您可以在其中添加与该字段相关的注释,例如选择某个值的原因或者是否应执行任何额外检查。
    • 无法编辑的文本。
    • 单选按钮形式的几个选项,您可以根据情况从中选择一个单选按钮。
    提示:查看“UiPath.DocumentProcessing.Contracts”部分的“提取结果类”页面,详细了解与验证程序注释相关的两种方法:GetFieldValidatorNotes(<fieldId>)SetFieldValidatorNotes(<fieldId>, <validatorNote>)
  • 编辑字段的值 - 选择字段,选择值,然后添加所需的输入,以更改字段的内容。
  • “撤消”docs image选项 - 将字段还原为先前状态。选择一次此选项,会后退一步,这意味着如果您对该字段进行了多次更改,则可能需要多次单击才能返回到某个值。仅当存在先前已修改或删除某个值的情况时,此字段才处于活动状态。
  • 此字段docs image添加值选项 - 使用自定义区域令牌选项向字段添加值。当在文档中进行选择并且与字段中的选择不同时,该选项才可用。始终可以对多值字段进行选择,并且仅当该字段没有值时才可以对单值字段进行选择。首先选择文档的该部分,然后选择“添加值”选项。
  • “验证”验证选项 - 确认字段中包含的信息。一旦确认,“已验证”标签将添加到字段中。

    手动验证字段后,您仍然可以通过选择“提取置信度”检查该字段的原始值。此功能仅适用于提取置信度。

    图 6.OCR 和提取的置信度级别

验证站点的界面是交互式的,这意味着在左侧选择字段时,右侧会高亮显示该字段,从而将焦点移至该字段上。

  • “添加额外”添加额外选项 - 用于选择文档中的其他值并将其添加到特定字段。
  • “添加”添加选项 - 使您能够向字段添加值,而无需从文档中引用。
表格字段 - 单元格级别处理

工作流中使用的 OCR 和提取程序的置信度级别可用于每个提取的单元格。

下表描述了表格字段的可用选项。

表 3. 可用于表格字段的选项及其描述
 

描述

menu

指示文档中表格的区域。

表格提取工具

创建新表格,打开表格提取工具。

options

打开包含以下选项的下拉列表:

  • “还原为上一个值”- 返回到上一个值。只有在先前修改过表格数据后,此选项才会处于活动状态。
  • “删除值”- 将表格字段标记为缺失。

复选框

选中后,确认数据准确性。

添加

缺少字段值时启用。

undo

更改或删除初始提取值后启用。选中后,它将恢复先前的值。

缺少

将字段标记为缺失。

所有表格字段都有一个下拉菜单,其中包含以下选项:

  • 更改提取的值 - 从文档中选择一个新值并替换初始值。仅当新选择的值与原始选择不同时,此字段才可用。
  • 还原为上一个值 - 将实际值替换为上一个值。此字段仅在更改初始值时才会处于活动状态。
  • 标记为缺失 - 如果文档中没有信息,则将字段标记为缺失。

下表显示了每行末尾的可用下拉菜单选项。

表 4. 下拉菜单选项及其描述
 

描述

页眉

转换表格标头中的选定行。该行不再显示在表格正文中,但只要选择了标头的字段,就可以将信息可视化。

select

高亮显示选定行。

自定义区域

提取新行并将其放置在选定行的下方。 它启用自定义选择工具,并为您提供手动选择新行的可能性。 选择新行的区域后,您必须定义每一列。 为此,请使用下表中提供的可用选项。

在上方添加行

在选定行上方插入一个新的空行。该行将自动添加到表格中,但所有字段都标记为未提取。您必须从文档中手动选择值,并使用添加提取的值

在下方插入行

应用与在上方插入行选项相同的原则,唯一的区别是将行插入实际选择的下方而不是上方。

删除

删除行。

编辑或审核表格中的字段后,确认框的外观会更改。 要确认数据,您必须选中该框。

注意: 表格的整体置信度是其中单元格的最低置信度。
表格字段 - 表格级别处理

可以直接从“验证站点”向导中手动选择和定义表格。如果未选择任何表格,或者您对自动选择不满意,则可以使用第一行末尾的下拉菜单中的可用选项。

备注:
  • 如果未提取表格单元格的值,则可以进入文档视图,手动将值添加到该表格单元格中。选择“自定义区域”选择模式,并标记未提取的单元格区域。然后在要从中提取此值的表格单元格中选择“添加提取的值”
  • 提取新表格从此处提取行选项使用相同的功能,并使您能够定义新值。

表格标头中几乎没有其他可用选项。您可以使用它们提取新表格,高亮显示现有表格或仅从中提取行,或删除整个表格。下表显示了可用选项及其说明:

表 5. 表格标头选项及其说明
 

描述

自定义区域

用新选择的表格替换现有表格。您需要标记所有行和列。请记住,第一行将成为表格的标头。

表格

高亮显示整个提取的表格区域。

select

高亮显示表格中的选定行。

删除全部

删除现有表格。

使用提取新表格选项时,您可以通过启用提取标头功能,来定义表格标头。从文档中选择信息,或将一个现有行转换为表格的标头,也可以定义标头。

下表显示了“提取新表格”选项的可用功能及其说明。

表 6.“提取新表格”选项及其说明
 

函数

删除行

删除所选内容中的所有可见行。

删除选择

从所选内容中仅删除选定的行。

水平行

在所选内容中启用水平行。

垂直行

在所选内容中启用垂直行。

自动检测

使您能够使用鼠标调整行的方向。

手动工具

启用行的选择、重新排列和删除。

您可以选择“保存新表格”以自动确认所有字段,也可以通过选择“关闭”拒绝该操作,返回到表格选择,然后手动确认每个字段。

注意:如果要保存提取字段为空或没有提取字段的表格,则这些字段会自动标记为缺失。
值格式和语言设置

使用“数字”、“日期”和“地址”字段,您可以查看并更正特定值的格式化(解析后)部分。将值分配给“数字”或“日期”字段时,系统会自动解析该字段,并在相应的提取值条目中显示生成的值。

当您提取或更正任何这些类型字段的值时,验证站点会尝试自动将该值解析为其格式化的组件。

语言设置显示在文档中检测到的流行语言,也就是在数字化过程中所识别的语言。这使验证站点能够根据文档的语言更准确地解析数字和日期。您可以使用下拉菜单来更改语言设置。

这样,当您手动提取或更改日期或数字值时,验证站点将首先尝试根据所选语言设置所选字符串的格式,如果解析不成功,则回退到英语(美国)。格式设置功能仅适用于值的已设置格式且可编辑的部分,不适用于原始字符串值。

为确保实现最佳的自动格式化值检测,请检查检测到的语言,并在必要时进行更正。

报告异常

您可以选择将文档报告为异常。如果发生这种情况,“呈现验证站点”将引发异常,RPA 工作流应捕获并单独处理该异常。异常消息显示由用户填写的异常原因。

选择“报告异常” ,然后填写“原因”字段,然后选择“确认”以保存异常。

数据确认和验证

您可以选择手动或自动确认所有字段。对于手动确认,您需要选中每个字段的复选框。如果未手动确认复选框,则单击“保存”按钮后会自动完成此过程,然后通过单击“继续并保存”按钮来确认操作。

下表显示了“验证站点”中可用于数据确认和验证的选项及其功能。

表 7.数据验证和确认选项
选项

函数

个无效单元格 <number> 个

跳至表格中的每个无效单元格。

有 <number> 个单元格未确认

跳至表格中每个未确认的单元格。

确认所有单元格确认表格中的所有单元格。
完成

保存您的表格验证。

如果表格并非只有有效和已确认的单元格,您可以选择“完成”以保存一部分表格。

报告异常

将文档报告为异常。

继续并保存

仅在并非文档中的所有值都手动确认时启用。选择后,系统将自动确认并保存所有数据和字段。

有关如何使用和自定义验证站点的更多信息,请访问验证站点

此页面有帮助吗?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath Logo
信任与安全
© 2005-2025 UiPath。保留所有权利。