- 入门指南
- Studio Web 中的 UiPath 智能体
- Agent Builder 中的 UiPath 智能体
- UiPath 编码智能体

智能体用户指南
智能体与工作流
link在设计智能自动化系统时,区分智能体和工作流非常重要,因为它们是两种截然不同但通常互补的范式。本节概述了每种范式的特点、它们之间的区别,以及如何针对您的用例选择最适合的模型。
通过本节更好地了解:
- 什么是智能体以及什么是工作流
- 决策标准和用例示例,以确定何时考虑采用其中一种模型。
什么是智能体?
link智能体是由大语言模型 (LLM) 驱动的软件系统,能够进行推理、采取行动并根据目标动态调整。与传统自动化逻辑不同,智能体不会遵循一组固定的指令。相反,智能体会根据当前上下文和记忆选择工具、解释结果并调整操作,从而做出实时决策。当结果路径无法硬编码或硬编码逻辑非常复杂时,智能体就会发挥作用。智能体会对动态且通常非结构化的输入进行推理、做出决策并采取行动。
智能体可以有不同的操作模式:
- 自主:由时间或程序化事件触发,通常是更广泛工作流的一部分。
- 对话:使用自然语言消息对话来解释用户输入,并根据上下文做出响应,以完成任务或提供信息。
- 环境:嵌入环境或设备,可持续感知上下文,并主动执行有用的操作或通知,无需明确的用户提示。
智能体特别适用于输入为非结构化且事先不知道最佳解决路径的模糊开放式任务。智能体还可以从之前的交互中学习,因此适用于适应性和推理能力极为重要的环境。
关键特征
- 自治:选择接下来调用工具或 API。
- 有状态的记忆:能记住上下文、之前的步骤和反馈。
- 动态控制流:即时进行分支、循环或提出澄清问题。
- 人机回圈挂钩:在置信度较低或违反规则时升级。
适合的典型场景
- 模糊任务(例如,诊断支持工单、研究市场)。
- 高度变化的输入/路径。
- 从每次运行中学习可以增加价值的情况。
什么是工作流?
link工作流是按固定顺序执行的步骤的结构化序列。它通常集成了 LLM、API 或人工输入,但缺乏智能体的自主规划能力。工作流中的每个步骤都是预定义的,各个步骤之间的转换遵循确定性逻辑。
工作流擅长处理大批量的可重复流程,具有明确的业务规则和可预测的结果。工作流具有透明度和监管能力,易于在成本、时间和合规性方面进行基准测试。
关键特征
- 确定性路径:在输入相同的情况下,每次运行都会遵循相同的分支。
- 运行之间无状态:每次执行都会从新开始(除非明确保留数据)。
- 透明的成本和时间:易于进行基准测试和制定预算。
- 符合监管要求:满足合规和审核需求。
适合的典型场景
- 大批量例行任务(例如,发票提取 → 验证 → ERP 输入)。
- 严格的服务级别协议或监管约束。
- 相同输入的输出必须相同的场景。
智能体工作流:混合方法
link智能体工作流将智能体的适应性与工作流的结构结合在一起。 使用此方法,智能体可以在定义的步骤内或步骤之间进行推理、采取行动和学习,从而实现传统工作流不擅长的动态决策。这种混合方法可以处理模糊性和可变性,同时保持编排和监管。 Maestro 中的智能体编排将两者融合:智能体处理动态决策,然后交给可预测的工作流来执行。
在智能体和工作流之间进行选择。
link使用以下考虑因素来指导您的决策:
- 输入类型:当输入是非结构化、多模式或需要上下文理解时,选择智能体;当输入是结构化且定义明确时,使用工作流。
- 控制流:智能体根据中间结果动态制定操作计划。工作流遵循在设计时确定的静态路径。
- 适应性:智能体可以根据需要学习或重新提示,即时适应。工作流如果有任何变更,都需要手动重新设计。
- 监管和可预测性:工作流提供强大的合规性、成本控制和一致性。智能体提供实验能力和灵活性,成本和结果的差异较大。
- runtime 推理:如果必须在运行时根据部分上下文或不断变化的上下文进行决策或分支,智能体则是正确的选择。
条件 | 代理 | 工作流 |
---|---|---|
重复性且基于规则的任务 |
|
|
非常模糊的任务 |
|
|
确定性结果 |
|
|
动态推理和适应 |
|
|
维度 | 代理 | Workflows |
---|---|---|
控制流程 | 动态规划与工具选择/生成 | 使用预定义工具的预定义序列 |
输入类型 | 非结构化、多模态 | 结构化记录/表单 |
适应性 | 即时学习或修改提示 | 需要在设计阶段进行更改 |
可靠性 | 可变;取决于护栏和评估 | 如果输入符合规范,则较高 |
监管负载 | 更高(智能体无序风险) | 存在成熟策略/工具 |
成本可预测性 | 中低(LLM/令牌差异) | 高 |
典型 ROI 时间周期 | 快速实验,不确定的扩展 | 编写脚本后,可稳定节省成本 |
技能障碍 | 低代码与代码类似 |
Use case | 代理 | 工作流 |
---|---|---|
支持工单分类 | ||
销售邮件生成 | ||
发票的处理 | ||
员工入职 |
多智能体系统
link多智能体系统由多个自主智能体组成,这些智能体在运行时进行交互和协调,以实现共同目标或协商目标。与遵循预定义路径的标准工作流或独立运行的单个智能体不同,多智能体设置支持突现行为、灵活的任务分配和动态协作。
多智能体系统最适合用于高度复杂的开放式目标,例如协作式 RAG 管道或动态供应链响应。
下表在几个关键维度上对经典工作流编排与真正的多智能体系统进行了比较:
维度 | 经典工作流(可以调用智能体) | 真正的多智能体系统 |
---|---|---|
控制逻辑 | 预先设计:“步骤 A → 步骤 B → 步骤 C”。分支由作者固定。 | 在运行时突现:智能体会规划自己的步骤,有可能将工作动态重新分配给对等智能体。 |
计划实体 | 工作流引擎决定顺序;各个智能体(如果有)只需执行各自的任务。 | 每个智能体都在本地制定计划;协调层(或对等协议)可以即时解决冲突。 |
适应性 | 仅限于人工建模的决策树。 | 可以形成新的子计划,拆分/合并角色,重新协商目标。多智能体群可以重新分配任务或生成辅助智能体,以进行故障处理。 |
状态和记忆 | 在运行之间通常无状态(除非将状态保留)。 | 每个智能体都可以保留自己的记忆;共享记忆(即黑板)可让它们为其他智能体写入/读取上下文。 |
监管和可观察性 | 简单:一个编排器,确定性追踪。 | 更难:许多自主循环需要全局追踪、策略实施和安全护栏。 |
适合的典型场景 | 明确交接步骤的重复性流程(例如“提取发票 → 验证 → 发布到 ERP”)。 | 从分工协作中受益的复杂开放式目标(例如,RAG 研究程序 → 规划程序 → 编码器协作完成微功能的发布)。 |