document-understanding
2023.4
false
重要 :
新发布内容的本地化可能需要 1-2 周的时间才能完成。
UiPath logo, featuring letters U and I in white

Document Understanding 用户指南

上次更新日期 2025年9月15日

搜索文档

搜索选项

Three search capabilities are available in total, two are present in the management bar from the top of the page, and one is using the 搜索图标icon from the bottom-left side of the page.

管理栏搜索功能包括:

  1. 使用内置筛选器进行搜索:根据下拉菜单中提供的批次/类别选项筛选文档。
    注意:

    选择更多选项可进一步限制搜索范围。例如,如果选择“批量导入 1”和“已删除”,则只会返回在“批量导入 1”中导入且已删除的文档。

    记下将始终返回空列表的组合:如果选择“批量导入 1”和“批量导入 2”,则永远不会返回文档,因为选择内容具有限制性,没有文档可以同时属于两个批次。

  2. 使用关键字在文档中搜索:此搜索输入会根据文本输入筛选信息。您必须在搜索字段中以自由文本形式输入关键字。搜索将在文档内容或文档名称中查找关键字。当字词相邻时,多词搜索会返回结果,但不包括它们之间的任何标点符号。
  3. “在文档内搜索”:使您可以仅在当前文档中搜索文本的实例。搜索栏 docs image 位于屏幕左下方。

使用内置筛选器进行搜索

使用“类别”/“批次”下拉列表中提供的内置筛选器来搜索文档。可以选择以下任何筛选器:“训练集和验证集”(Training and validation set)、“训练集”(Training set)、“评估集”(Evaluation set)、“验证集”(Validation set)、“已删除”(Deleted)、“已标记”(Labelled) 和“未标记”(Unlabelled)。

每个筛选器都会在括号中显示符合条件的文档数量。

有七个预定义的关键字,即:

  • 训练集和验证集 (Training and validation set)
  • 训练集
  • 评估集
  • 验证集
  • 已删除
  • 已标记
  • 未标记
备注:

请注意,对于 Forms AI,只有以下内置筛选器可用:“已删除”、“已标记”和“未标记”。

除了这些预定义的关键字之外,您还可以根据导入到 Document Manager 的批次数量,基于指定批次进行筛选:

  • 批次 <批次名称 1>
  • 批次 <批次名称 2>
  • 批次 <批次名称 3>
  • 等等。

使用关键字进行搜索

您必须在搜索字段中以自由文本形式输入关键字。搜索将在文档内容或文档名称中查找关键字。

您可以使用文本中的多个词语进行搜索:仅显示包含这些特定词语的文档,并且逐个显示。

备注:

搜索不区分大小写。

您可以使用关键字进行筛选:例如,如果选择“已标记”,则仅显示已标记的文档

您可以使用多个关键字进行筛选:例如,如果您选择“已标记”和“训练集”,则仅显示标记为“已训练”的已标记文档。关键字的出现顺序无关紧要。

您还可以将文本与关键字结合使用:例如,如果您键入 payment 和 labelled,则仅显示包含此特定词语的已标记文档。

在文档中搜索

在当前文档中启动搜索,方法是选择屏幕左下方的 搜索图标 图标,输入要搜索的文本,然后按 Enter。

与搜索匹配的所有文本实例都将以黄色高亮显示,并且文档查看器会自动滚动到第一个位置。要从一个文本实例导航到另一个文本实例,请按 Enter 或 Page Down 和 Page Up。

启动搜索

搜索栏有一个下拉菜单,打开该下拉菜单时会显示以下筛选器:

  • “训练集”- 指示要用于训练模型的文档数。自动化操作
  • “验证集”- 指示在模型训练完成后要用于验证模型的文档数。训练集和验证集之间的拆分目标为 80%-20%。自动化操作
  • “训练集和验证集”(Training and validation set) - 指示在“训练集”(train-set) 和“验证集”(validate-set) 筛选器中找到的文档数。自动化操作
  • Evaluation set - Indicates the number of documents that had the evaluation set checkbox checked during import and are intended to be used to evaluate the model in the stage of the training pipeline. More information can be found here. Manual action.
  • Deleted - Specifies the number of deleted documents. More information can be found here.
  • 标签 - 指定带有标签的文档数。标签由每个文档至少一个标记/手动编辑的字段定义。
  • 未加标签 - 指定没有标签的文档数。
  • “批次名称”- 指定已包含在同一导入操作中的文档。

将文档分配到训练集或验证集是由应用程序在导入时完成的。

如果在导入期间选中了“评估集”复选框,则导入的文档最终会出现在评估集中。

  • 搜索选项
  • 使用内置筛选器进行搜索
  • 使用关键字进行搜索
  • 在文档中搜索
  • 启动搜索

此页面有帮助吗?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath Logo
信任与安全
© 2005-2025 UiPath。保留所有权利。