
非结构化复杂文档用户指南
在文档因格式复杂而难以解释时,智能预处理选项可提高预测性能。
- 无 - 此默认选项适用于大多数没有表格内容的文档。
- 表格模型 - mini - 针对表格内容和延迟进行了优化。此选项最适合包含简单表格或多个表格的文档。
- 表格模型 - 针对更复杂的表格内容进行了优化。此选项最适合包含复杂嵌套表格、包含合并单元格、项目符号或跨多个页面表格的文档。
备注:
- 虽然这在复杂表格上表现最佳,但会增加预测的延迟。
- 此功能依赖 Gemini 模型并通过 AI Trust Layer 实现。
智能预处理示例
this period 列的值会与 year to date 列的值混淆。this period 和 year to date 列的值都已正确提取。“提取模型”选项表示用于提取的底层 LLM。
- GPT-4o
- Gemini
选择最合适的模型
不同模型对于不同用例的性能不同,但建议您尽可能使用 Gemini。其他几种有助于优化性能和用户体验的预处理和后处理功能也是基于 Gemini。
GPT-4o 的页面处理上限为 50 页,要处理更多页面,只能使用当前预览的迭代调用功能。
Gemini can process documents in IXP up to 500 pages in a single call, with higher page counts supported in preview. The Gemini limit may vary slightly based on the density of field values within the document. The Gemini model has an input limit of 500 pages by default, compared to the 50-page input limit of GPT-4o. Moreover, Gemini has a higher output context window, which allows it to handle more field values.
从一个模型切换到另一个模型
要从一个模型切换到另一个模型,请使用“提取模型”选项的下拉列表,然后选择“保存”。这将触发创建新的项目版本并自动生成新的预测。
如果您出于性能考虑需要切换模型,请先查看替代模型能否解决当前模型无法解决的核心问题。如果可以,请优化新模型,以改善“度量”中的性能指标。
高级选项使您能够自定义模型的设置,选择要使用的归因方法,以及使用提示词覆盖。
展开设置以查看所有可用选项:
- 归因 - 用于将预测归因于文档中的相关部分或文本的方法。选择以下选项之一:
- 基于规则 - 使用大量的规则和启发式将页面上的正确跨度与模型中的预测值匹配。这是一个低延迟选项,但与基于模型的选项相比,它会在成功归因方面牺牲性能。
- 基于模型 - 使用额外的 LLM 调用,将预测值成功匹配到页面上的正确跨度,因为这些值通常可以在页面的不同部分重复。就成功归因而言,这是性能最高的选项,但确实会为预测增加一些延迟。此选项依赖于 Gemini 模型的使用。
- 温度 - 要使用的采样温度。选择一个介于 0.0 和 2.0 之间的数字。值越高,输出随机性越高。
- Top P - 仅从概率质量达到
top_p概率质量的令牌中进行采样。选择一个介于 0.0 和 1.0 之间的数字。 - 种子- 如果指定,重复使用相同种子和参数的请求应返回相同结果。
- 频率惩罚 - 选择一个介于 -2.0 和 2.0 之间的数字。正值将降低模型重复已出现在文本中的令牌的概率。
- 提示词覆盖 - 用新值覆盖默认系统提示词。此选项默认处于禁用状态。启用后,将启用“追加任务指令提示词”和“追加字段指令提示词”选项以供配置。