非结构化复杂文档用户指南

上次更新日期 2025年11月24日

模型配置

概述

您可以从“构建”选项卡的“模型配置”选项中配置底层 LLM 及其设置。

可用设置包括：

智能预处理：
- 无
- 表格模型 - 小型
- 表格模型
提取模型：
- GPT-4o
- Gemini
高级选项：
- 归因
- 温度
- Top P
- 种子
- 频率惩罚
- 覆盖提示词

调整这些设置，以提高模型预测的准确性并增强其性能。

智能预处理

在文档因格式复杂而难以解释时，智能预处理选项可提高预测性能。

其中包括以下选项：

无 - 此默认选项适用于大多数没有表格内容的文档。
表格模型 - mini - 针对表格内容和延迟进行了优化。此选项最适合包含简单表格或多个表格的文档。
表格模型 - 针对更复杂的表格内容进行了优化。此选项最适合包含复杂嵌套表格、包含合并单元格、项目符号或跨多个页面表格的文档。
备注：
- 虽然这在复杂表格上表现最佳，但会增加预测的延迟。
- 此功能依赖 Gemini 模型并通过 AI Trust Layer 实现。

智能预处理示例

下图显示了不使用“表格模型”模式查询 LLM 的提取示例，其中 this period 列的值会与 year to date 列的值混淆。

下图显示了使用“表格模型”模式的提取示例，其中 this period 和 year to date 列的值都已正确提取。

提取模型

“提取模型”选项表示用于提取的底层 LLM。

可用模型包括：

GPT-4o
Gemini

选择最合适的模型

不同模型对于不同用例的性能不同，但建议您尽可能使用 Gemini。其他几种有助于优化性能和用户体验的预处理和后处理功能也是基于 Gemini。

GPT-4o 的页面处理上限为 50 页，要处理更多页面，只能使用当前预览的迭代调用功能。

Gemini 在单次调用中最多可以处理 500 页的 IXP 文档，预览中支持更多页数。Gemini 限制可能会因文档中字段值的密度而略有不同。默认情况下，Gemini 模型的输入限制为 500 页，而 GPT-4o 的输入限制为 50 页。此外，Gemini 的输出上下文窗口更高，这使其可以处理更多字段值。

从一个模型切换到另一个模型

要从一个模型切换到另一个模型，请使用“提取模型”选项的下拉列表，然后选择“保存”。这将触发创建新的项目版本并自动生成新的预测。

重要：对于成熟项目，分类（尤其是指令）和确认的预测（尤其是推断字段）通常都针对一种模型类型进行了优化。切换后，性能分数很可能会下降，因为可能需要对指令进行一些迭代并重新查看预测，以撤消可能影响其他模型性能的模型专属优化。

如果您出于性能考虑需要切换模型，请先查看替代模型能否解决当前模型无法解决的核心问题。如果可以，请优化新模型，以改善“度量”中的性能指标。

高级选项

高级选项使您能够自定义模型的设置，选择要使用的归因方法，以及使用提示词覆盖。

注意：只有在特殊情况下才建议使用提示词覆盖。

展开设置以查看所有可用选项：

归因 - 用于将预测归因于文档中的相关部分或文本的方法。选择以下选项之一：
- 基于规则 - 使用大量的规则和启发式将页面上的正确跨度与模型中的预测值匹配。这是一个低延迟选项，但与基于模型的选项相比，它会在成功归因方面牺牲性能。
- 基于模型 - 使用额外的 LLM 调用，将预测值成功匹配到页面上的正确跨度，因为这些值通常可以在页面的不同部分重复。就成功归因而言，这是性能最高的选项，但确实会为预测增加一些延迟。此选项依赖于 Gemini 模型的使用。
温度 - 要使用的采样温度。选择一个介于 0.0 和 2.0 之间的数字。值越高，输出随机性越高。
Top P - 仅从概率质量达到 top_p 概率质量的令牌中进行采样。选择一个介于 0.0 和 1.0 之间的数字。
种子- 如果指定，重复使用相同种子和参数的请求应返回相同结果。
频率惩罚 - 选择一个介于 -2.0 和 2.0 之间的数字。正值将降低模型重复已出现在文本中的令牌的概率。
提示词覆盖 - 用新值覆盖默认系统提示词。此选项默认处于禁用状态。启用后，将启用“追加任务指令提示词”和“追加字段指令提示词”选项以供配置。