
非结构化文档和复杂文档用户指南
客户和合作伙伴如何访问智能提取处理 (IXP) 非结构化文档和复杂文档功能?
客户和合作伙伴可以在 Insider 门户表达了解意向,因为预览版计划目前提供非结构化与复杂文档功能。我们会定期审核注册,并通知选定的客户和合作伙伴加入预览版计划。务必提供尽可能多的用例详细信息。
该功能何时正式面向用户提供?
正式发布非结构化文档和复杂文档功能的目标日期为 2025 年 7 月下旬。在预览期的剩余时间内,选定的客户可以参加受控的正式发布。所有受控的正式可用用例都需经产品团队批准,并由其各自的帐户团队提供支持。
社区用户是否可使用此功能?
智能提取处理 (IXP) 提供哪些部署选项?此功能是否支持本地部署?
目前,IXP Communications Mining 以及非结构化与复杂文档功能仅支持在 UiPath™ Automation Cloud™ 中使用。
Document Understanding 可在 Automation Cloud、Automation Suite 和独立部署中使用。 有关 Document Understanding 部署选项的更多信息,请查看 “选择部署类型”。
该功能是否在所有区域都可用?
目前,非结构化文档和复杂文档功能已面向美国和欧洲租户发布了正式版,在加拿大、日本和澳大利亚地区发布了个人预览版。
该功能支持哪些语言?
用户可使用 IXP 中选定模型支持的任意语言上传文档并构建模型。
该功能支持哪些文件格式?
目前,该功能支持 PNG、JPG 或 JPEG、PDF 和 TIF 或 TIFF 文件格式。
智能提取处理 (IXP) 使用专用 AI 还是生成式 AI?
Communications Mining 使用专用的 AI 和生成式 AI 功能,如有需要,可以禁用所有生成式 AI 功能。
Document Understanding 使用专业的 AI 和生成式 AI 功能,如有需要,可以禁用所有生成式 AI 功能。
非结构化文档和复杂文档的生成式提取通过第三方 LLM 使用生成式 AI。没有生成式 AI,无法使用此功能。
CommPath 和 DocPath 在 IXP 中是否可用?
使用生成式提取功能时,CommPath 可在 Communications Mining 中使用。
DocPath 在 Document Understanding 中可用,但仅在新式体验中可用。它在 Document Understanding 传统体验中不可用。
在非结构化文档和复杂文档的生成式提取功能中,这两者都不可用。
智能提取处理 (IXP) 是否会通过 AI Trust Layer (AITL)?
是的,使用第三方 LLM 的所有智能提取处理 (IXP) 功能都必须通过 UiPath AITL。CommPath 和 DocPath 是 UiPath 的专有模型,不会通过 AITL。
该功能使用哪些 LLM?
The GPT-4o vision and Gemini models are available in the Unstructured and complex documents capability. The Gemini model is available as an intelligent pre-processing feature for tabular data.
该功能是否启用 BYO(自带)订阅?
目前不支持,但在未来的版本中将支持 BYO 订阅。
我是否可以将我的用例从 Document Understanding 经典版体验迁移到 IXP 非结构化与复杂文档功能?
目前还不能,但未来版本将支持导入和导出功能。
我是否可以将我的用例从 Document Understanding 新式体验迁移到 IXP 非结构化与复杂文档功能?
目前还不能,但未来版本将支持导入和导出功能。
我是否可以将我的用例从 Document Understanding 生成式提取程序活动迁移到 IXP 非结构化与复杂文档功能?
目前还不能,但未来版本将支持导入和导出功能。
该功能是否有任何设计时间限制?
设计时限制包括:
- 每个字段组的字段数量:最多 32 个字段。
- Number of characters per field name: up to 128 characters.
- 每个提示指令的字符数:最多 2048 个字符。这适用于所有提示,包括总体指令、字段组指令、字段指令和字段类型指令。
我可以在文档功能中创建通用字段吗?
不,IXP 中没有通用字段的概念。 所有字段都需要属于字段组。 每个字段组表示一个单独的表格,其中字段即为表格中的列。但是,您可以通过定义父级字段组来表示文档类型,并在此字段组下以表格的形式添加更多通用字段。
智能提取处理 (IXP) 非结构化与复杂文档模型能否通过加标签或批注的方式来提高性能?
不会,模型还无法直接从用户标注中学习。目前,提高模型性能的方法是修改您的提示指令或模型配置。 我们正在研究不同的解决方案,包括上下文学习、指令反馈改进和可微调的模型。
如果无法提高模型性能,我为什么需要对文档进行批注?
验证和批注文档仍然很重要,因为您需要为模型性能评估建立基础事实,通过“度量”页面内置的性能指标体现。
我需要上传多少个文档才能测试我的提示指令?
您应上传文档的代表性示例,以涵盖所有可能的变化。这应至少为 20-30 个不同的文档。 建议您先查看 2 到 3 个文档的初始预测,决定是否需要修改提示指令,随后再逐步将测试样本量增加至 10、20、30 乃至 X 份文档,这将是一个迭代的过程。
我需要批注多少个文档,才能获得可靠的性能指标?
建议您为每个字段至少验证 10 个文档或 10 个示例,或两者兼而有之,以便模型为您提供有意义的验证统计信息。这是标注的最低数量,将取决于特定用例要求。
非结构化文档和复杂文档功能是否有任何运行时限制?
运行时限制包括:
-
每个文档的页面数 - 文档最多 150 页。超过 50 页的文档需要循环功能,该功能目前处于个人预览阶段,可根据要求提供访问权限。
令牌上限 - 提取数据超过 200 条的数据密集型文档(例如冗长的表格)可能会达到令牌上限。此类文档需要循环功能,该功能目前处于个人预览阶段,可根据要求提供访问权限。
在正式发布之前的版本中,这些限制应大幅提高。文档增加的上限将是需要提取的页面数和字段值数量的乘积。如果这两者的组合足够高,则将达到最大上限,但预计会支持包含 100-200 页和需要提取的字段值数量多的文档。
对要提取的字段值没有硬性限制,因为这取决于文档。但是,如果达到令牌上限,则会在 API 响应中为任何运行时文档预测提供一个指示器,其中提取的提取置信度和发生置信度都将返回为零。
目前,如果发送的页面数超过 50,如果没有循环功能,该功能仅使用前 50 页。如果达到令牌上限,则会返回空白预测结果。
非结构化文档和复杂文档模型是否通过 Robot 或独立的 Document Understanding API 使用?
非结构化与复杂文档模型既可以通过机器人,也可以通过独立的 Document Understanding Automation Cloud API 使用。
如何使用非结构化文档和复杂文档输出?
模型输出可以通过 API、Document Understanding 活动或 IntelligentOCR 活动使用。 请务必:
- 安装 IOCR 包 v6.23.2 预览版或更高版本,然后选择“Document Understanding 项目提取程序”活动
- 安装 Document Understanding 包 v2.13.2 预览版或更高版本,然后选择“提取文档数据”活动
智能提取处理 (IXP) 非结构化与复杂文档功能是否提供置信度分数?它们是如何计算的?
是的,我们在模型响应和 Action Center(运行时)中提供置信度分数,但未在 IXP 用户界面(设计时)提供置信度分数。 我们使用 LLM 返回的令牌概率估计字段和提取级别的置信度。
混合部署(即本地 Orchestrator 或 Automation Suite 和 Cloud IXP 模型)中的非结构化与复杂文档模型输出是否可以使用?
是的,这可以通过外部应用程序支持。 有关更多详细信息,请查看 “OAuth 应用程序”。
智能提取处理 (IXP) 非结构化与复杂文档模型的输出是否可供其他生产、开发或 UAT 组织或租户使用?
是的,这可以通过外部应用程序支持。 有关更多详细信息,请查看 “OAuth 应用程序”。
验证站点是否与非结构化文档和复杂文档功能配合使用?
是的,它的工作方式与 Document Understanding 新式或经典项目相同。但是,全部提取数据均需以表格形式进行验证。
非结构化文档和复杂文档模型是否通过 Action Center 中的 HITL 验证获得?
没有,目前 Action Center 与非结构化文档模型和复杂文档模型之间没有反馈循环。 后续版本计划支持该功能,且将同时推出可微调模型。
该功能是否提供任何监控工具? 这些项目与 Document Understanding 新式项目不同吗? 是否对 Insights 有依赖项?
目前,“非结构化文档和复杂文档”功能无法提供任何监控功能,例如新式项目中的 “监控” 页面。有关监控功能的其他详细信息将在未来的版本中分享。
我们是否可以监控非结构化文档和复杂文档项目的 AI Unit 消耗量?
目前无法跟踪每个项目的消耗量。完全集成后,消耗量可能会显示在“AI Unit 消耗”仪表板以及单独的“非结构化文档和复杂文档”仪表板中。
我们能否自动检测性能下降,例如数据漂移、F1 分数降低等?
目前,我们不提供任何模型性能通知或警报。
用户需要更新模型或提示指令的频率?
这取决于具体用例,但您应在提取性能不符合预期时随时改进提示指令。