- 入门指南
- Studio Web 中的 UiPath 智能体
- UiPath 编码智能体

智能体用户指南
内置工具
UiPath Agents 附带内置工具、预定义的即用型组件,无需自定义开发或外部配置。
分析附件
“分析附件”工具使智能体可以使用 LLM 处理文件内容并对其进行推理。
目前支持以下文件类型:GIF、JPE、JPEG、PDF、PNG、WEBP。
要将此工具添加到您的智能体中,请执行以下步骤:
-
定义文件输入。在数据管理器面板中,向文件输入的智能体架构添加参数。这些类型应为
File。图 1. 创建文件输入参数

-
添加“分析附件”工具:a.在“工具”面板中选择“添加工具” 。B.从“内置工具”类别中,选择“分析附件” 。C. (可选)更新工具的名称和描述,以帮助智能体更好地推理何时使用工具。
-
了解工具的输入。此工具预配置了两个主要输入:
attachments(Array):一个或多个待分析文件的列表。analysisTask(String):描述任务的提示词或指令。如果您的用例仅涉及一个文件,您可以更新输入描述,以反映它是单个附件。
-
使用输入文件运行智能体。A.打开“调试配置”窗口:
- 导航到“项目参数”选项卡。
- 提供
analysisTask的值,例如“比较两张图像”。 - 将您的输入文件上传到与您的
attachments参数绑定的字段中。 b. 单击“保存”,然后运行调试会话。
-
运行智能体后,通过底部面板查看执行追踪记录。
图 2. 执行追踪记录中的分析

附件追踪
使用“分析附件”工具时,所有文件输入和输出都将在“执行追踪”面板的“历史记录”选项卡下捕获。追踪记录详细显示了智能体执行期间如何处理附件。
对于每个文件,追踪记录显示:
- ID:附件的唯一标识符。
- “名称” :原始文件名(例如
1.jpg)。 - MIME 类型: 检测到的文件类型(例如
image/jpeg)。 - 下载 URL : 用于下载文件以进行检查或重用的直接链接。追踪中显示的下载链接的生存期当前为 30 分钟。
图 3. 附件追踪

最佳实践和常见问题解答
通过“分析附件”工具,智能体可以使用 LLM 流程处理文档和图像。虽然功能强大,但在设计文件驱动的智能体时,需要注意一些重要的限制和行为。
大型文件可能超过令牌上限
智能体通过将内容嵌入到 LLM 提示词中来处理文件,而提示词会受到模型令牌上限的约束。大型 PDF 或扫描图像文档可能会静默失败,或返回“出错”等模糊错误,尤其是超出模型的令牌预算时。
要减轻:
- 使用令牌容量较高的模型。
- 使用上下文基础,而非完整文件嵌入,尤其适用于大型文件或多页面文件。
- 通过自定义工具,在智能体运行之前或期间对文档进行预索引,并对其进行同步。
LLM 调整图像大小
当图像文件(例如 .jpg、.png)作为 LLM 提示词的一部分发送时,大多数模型会自动调整它们的大小。这可能会导致纵横比失真或像素精确数据丢失。
避免依赖确切坐标、边界框或像素对齐比较的提示词(例如,需要特定 x/y 定位的图像差异)。有关更多信息,请参阅 OpenAI 的图像视觉指南,以了解模型专属的大小调整行为。
支持的文件类型
支持以下文件扩展名:GIF、JPE、JPEG、PDF、PNG、WEBP。
文件类型支持因 LLM 提供程序而异。例如,根据文件名称或编码,某些 Anthropic 模型可能无法提供 PDF 支持。
获得更好结果的提示
- 如果您正在处理长 PDF,请考虑在将其传递给智能体之前将其拆分成更小的块或页面。
- 文件名称必须整洁:特别是 Anthropic 模型会拒绝包含特殊字符或重复空格的文件名称。
- 保持图像数量少:GPT-4o 等某些模型每个请求最多支持 10–50 个图像。