- 概述
- 要求
- 部署模板
- 手动:准备安装
- 手动:准备安装
- 步骤 2:为离线安装配置符合 OCI 的注册表
- 步骤 3:配置外部对象存储
- 步骤 4:配置 High Availability Add-on
- 步骤 5:配置 SQL 数据库
- 步骤 6:配置负载均衡器
- 步骤 7:配置 DNS
- 步骤 8:配置磁盘
- 步骤 9:配置内核和操作系统级别设置
- 步骤 10:配置节点端口
- 步骤 11:应用其他设置
- 步骤 12:验证并安装所需的 RPM 包
- 步骤 13:生成 cluster_config.json
- 证书配置
- 数据库配置
- 外部对象存储配置
- 预签名 URL 配置
- Kerberos 身份验证配置
- 符合 OCI 的外部注册表配置
- Disaster Recovery:主动/被动和主动/主动配置
- High Availability Add-on 配置
- 特定于 Orchestrator 的配置
- Insights 特定配置
- Process Mining 特定配置
- Document Understanding 特定配置
- Automation Suite Robot 特定配置
- 监控配置
- 可选:配置代理服务器
- 可选:在多节点 HA 就绪生产集群中启用区域故障恢复
- 可选:传递自定义 resolv.conf
- 可选:提高容错能力
- install-uipath.sh 参数
- 添加具有 GPU 支持的专用代理节点
- 为 Task Mining 添加专用代理节点
- 连接 Task Mining 应用程序
- 为 Automation Suite Robot 添加专用代理节点
- 步骤 15:为离线安装配置临时 Docker 注册表
- 步骤 16:验证安装的先决条件
- 手动:执行安装
- 安装后
- 集群管理
- 监控和警示
- 迁移和升级
- 特定于产品的配置
- 最佳实践和维护
- 故障排除
- 如何在安装过程中对服务进行故障排除
- 如何卸载集群
- 如何清理离线工件以改善磁盘空间
- 如何清除 Redis 数据
- 如何启用 Istio 日志记录
- 如何手动清理日志
- 如何清理存储在 sf-logs 存储桶中的旧日志
- 如何禁用 AI Center 的流日志
- 如何对失败的 Automation Suite 安装进行调试
- 如何在升级后从旧安装程序中删除映像
- 如何禁用 TX 校验和卸载
- 如何从 Automation Suite 2022.10.10 和 2022.4.11 升级到 2023.10.2
- 如何手动将 ArgoCD 日志级别设置为 Info
- 如何扩展 AI Center 存储
- 如何为外部注册表生成已编码的 pull_secret_value
- 如何解决 TLS 1.2 中的弱密码问题
- 如何使用证书
- 如何将应用程序日志转发到 Splunk
- 如何从注册表 Pod 中清理未使用的 Docker 映像
- 如何使用集群内对象存储 (Ceph) 收集 DU 使用情况数据
- 如何在离线环境中安装 RKE2 SELinux
- 升级 Automation Suite 后重新安装或升级 Insights 时丢失数据
- 单节点升级在结构阶段失败
- 从 2021.10 自动升级后,集群运行状况不佳
- 由于 Ceph 运行状况不佳,升级失败
- 由于空间问题,RKE2 未启动
- 卷无法装载,且仍处于附加/分离循环状态
- 由于 Orchestrator 数据库中的传统对象,升级失败
- 并行升级后,发现 Ceph 集群处于降级状态
- Insights 组件运行状况不佳导致迁移失败
- Apps 服务升级失败
- 就地升级超时
- Docker 注册表迁移卡在 PVC 删除阶段
- 升级到 2023.10 或更高版本后 AI Center 配置失败
- 在离线环境中升级失败
- 升级期间 SQL 验证失败
- 快照-控制器-crds Pod 在升级后处于 CrashLoopBackOff 状态
- Longhorn REST API 端点升级/重新安装错误
- 由于 Insights PVC 大小被覆盖,升级失败
- 使用 Process Mining 运行高可用性
- 使用 Kerberos 登录时 Process Mining 挖掘失败
- 在 Disaster Recovery 后,DAPR 无法正常用于 Process Mining
- 在集群模式下使用 Redis 配置 Dapr
- 无法使用 pyodbc 格式连接字符串连接到 AutomationSuite_ProcessMining_Warehouse 数据库
- Airflow 安装失败,并显示 sqlalchemy.exc.ArgumentError:无法从字符串“”中解析 rfc1738 URL
- 如何添加 IP 表格规则以使用 SQL Server 端口 1433
- 运行 CData Sync 的服务器不信任 Automation Suite 证书
- 运行诊断工具
- 使用 Automation Suite 支持捆绑包
- 探索日志
- 探索汇总遥测

Linux 版 Automation Suite 安装指南
有关 Automation Suite 部署中使用的核心概念的更多信息,请参阅词汇表。
Automation Suite 支持以下两种部署模式:
部署模式 |
描述 |
---|---|
单节点 — 评估 |
支持用于评估和演示。 |
多节点 — 生产(已启用 HA) |
支持用于生产。 您可以在部署后执行其他配置,以获得完整的 HA 功能。 |
Automation Suite 使用基于 Kubernetes 的云原生架构。它提供了 Kubernetes 在可扩展性、自动资源管理和可靠性方面的所有优势。
为了提供这些优势,Kubernetes 的设计基于以下基本方面:
- 在奇数台计算机(3、5、7 等)上运行;
- 使用法定人数原则处理独立节点故障和数据损坏。对于由 N 台计算机组成的集群,只要仍有许多 N/2 + 1 台计算机具有法定人数,集群就可以正常运行,并且可以正常恢复,而不会发生任何故障。
此页面提供对 Automation Suite 架构的深入了解,并描述捆绑到安装程序中的组件。
节点类型
服务器节点托管集群管理服务(控制平面),这些服务执行重要的集群操作,例如工作负载编排、集群状态管理、负载均衡传入请求等。Kubernetes 还可以根据基础资源可用性运行一些 UiPath™ 产品和共享组件。
代理节点仅负责运行 UiPath™ 产品和共享组件。
专用代理节点运行特殊工作负载,例如 Task Mining 分析、需要 GPU 功能的 Document Understanding 管道或 Automation Suite Robot。但是,核心 Task Mining、Document Understanding 或 Automation Suite 机器人服务仍会在服务器或代理节点上运行。专用代理节点不托管任何 UiPath™ 产品或共享组件。
单节点评估部署
此处的单节点评估部署是指单服务器节点。这并不意味着在单台计算机上部署整个 Automation Suite。如果单个服务器节点无法搭载整个产品套件,或您想运行 Task Mining 分析和 Document understanding 管道等需使用 GPU 能力特殊任务,则可添加额外代理或专门的代理节点。
多节点 HA 就绪生产部署
多节点 HA 就绪生产部署涉及负载均衡器后面的 3 个或更多服务器节点。这是为了确保在发生灾难时,如果任何服务器节点出现故障,自动化套件仍可用于执行关键业务工作流。代理节点的数量是可选的,具体视实际使用情况而定。
High Availability Add-On
在多节点设置中,默认情况下启用高可用性 (HA)。但是,集群服务使用的基于 Redis 的内存缓存在单个 Pod 上运行,并且表示单点故障。为了减轻缓存节点故障或重新启动的影响,您可以购买高可用性插件 (HAA),它可以实现缓存的冗余多节点部署。
有关如何在多节点设置中启用 HAA 的更多详细信息,请参阅为集群启用 High Availability Add-on。
在线部署
离线部署
离线部署(离线)是完全隔离的设置,无法访问互联网。这种设置需要安装额外的注册表来存储所有 UiPath™ 产品的容器映像和二进制文件,需以 tar 包的形式提供这些映像和二进制文件。
将二进制文件(已填充数值)上传到注册表会带来额外的硬件要求和安装复杂性,从而增加与在线部署相比,执行安装所需的时间。
离线安装不仅会增加安装过程的复杂性,还会增加集群管理操作,例如计算机维护、灾难恢复、升级到较新版本、应用安全补丁等。
不允许在安装后更改部署方法。这意味着如果在线完成安装,您将无法更改为离线模式,反之亦然。建议在仔细考虑后选择部署策略。
Automation Suite 架构
下表列出了 Automation Suite 附带的第三方组件:
组件 |
可选/必填 |
描述 |
---|---|---|
RKE2 |
必填 |
Rancher 提供的 Kubernetes 发行版。它是运行所有架构组件和服务的容器编排平台。 |
CEPH 对象存储 |
如果您有外部对象存储,则为可选项 |
公开了符合 Amazon S3 的对象/Blob 存储的开源存储提供程序。它使服务能够使用 Blob 存储等功能进行操作。 |
Argo CD |
必填 |
用于 Kubernetes 的开源声明性 CD 工具。它遵循 GitOps 模式,即使用 Git 存储库作为定义所需应用程序状态的事实来源。它为在 Kubernetes 集群中运行的 Automation Suite 组件和 UiPath™ 服务提供应用程序生命周期管理 (ALM) 功能。 |
Docker 注册表 |
如果您有外部注册表,则为可选项 |
用于推送和拉取本地安装时和运行时容器映像的开源 Docker 注册表。 |
Istio |
必填 |
开源服务网格,可为 Kubernetes 集群内运行的微服务提供入口、请求路由、流量监控等功能。 |
Prometheus |
必填 |
Kubernetes 的开源系统监控工具包。它可以从 Kubernetes 组件以及在集群中运行的工作负载抓取或接受指标,并将其存储在时间序列数据库中。 |
Grafana |
必填 |
用于查询和可视化 Prometheus 中存储的数据的开源可视化工具。您可以创建和发布各种用于监控集群和服务的仪表板。 |
警示管理器 |
必填 |
帮助处理客户端应用程序(如 Prometheus 服务器)发送的警示的开源工具。它负责对数据进行重复数据删除、分组并将其路由到正确的接收器集成,例如电子邮件、PagerDuty 或 OpsGenie。 |
Redis |
必填 |
一些 UiPath™ 服务使用 Redis 企业版非 HA(单个分片)来获取集中式缓存功能。 |
FluentD 和 Fluentbit |
必填 |
开源可靠的日志抓取解决方案。日志记录运算符在每个节点上部署并配置后台流程,以从节点文件系统收集容器和应用程序日志。 |
Gatekeeper |
必填 |
开源工具,可以帮助 Kubernetes 管理员实施策略以确保其集群中的合规性和最佳实践。 |
velero | 需要1 |
使您可以创建快照备份和还原的开源工具。 |
Thanos |
必填 | 用于将 Prometheus 矩阵推送到对象存储以进行持久存储的开源工具。 |
1仅在备份和还原期间安装。
外部组件
您还需要引入一些外部组件,例如外部负载均衡器、SQL Server、Blob/文件存储、密钥保管库、日志接收器和通知工具。请注意,该套件提供了一些扩展点。