- 概述
- 要求
- 部署模板
- 手动:准备安装
- 手动:准备安装
- 步骤 2:为离线安装配置符合 OCI 的注册表
- 步骤 3:配置外部对象存储
- 步骤 4:配置 High Availability Add-on
- 步骤 5:配置 SQL 数据库
- 步骤 7:配置 DNS
- 步骤 8:配置磁盘
- 步骤 9:配置内核和操作系统级别设置
- 步骤 10:配置节点端口
- 步骤 11:应用其他设置
- 步骤 12:验证并安装所需的 RPM 包
- Cluster_config.json 示例
- 常规配置
- 配置文件配置
- 证书配置
- 数据库配置
- 外部对象存储配置
- 预签名 URL 配置
- ArgoCD 配置
- Kerberos 身份验证配置
- 符合 OCI 的外部注册表配置
- Disaster Recovery:主动/被动和主动/主动配置
- High Availability Add-on 配置
- 特定于 Orchestrator 的配置
- Insights 特定配置
- Process Mining 特定配置
- Document Understanding 特定配置
- Automation Suite Robot 特定配置
- AI Center 特定配置
- 监控配置
- 可选:配置代理服务器
- 可选:在多节点 HA 就绪生产集群中启用区域故障恢复
- 可选:传递自定义 resolv.conf
- 可选:提高容错能力
- 添加具有 GPU 支持的专用代理节点
- 为 Automation Suite Robot 添加专用代理节点
- 步骤 15:为离线安装配置临时 Docker 注册表
- 步骤 16:验证安装的先决条件
- 手动:执行安装
- 安装后
- 集群管理
- 监控和警示
- 迁移和升级
- 特定于产品的配置
- 最佳实践和维护
- 故障排除
- 如何在安装过程中对服务进行故障排除
- 如何卸载集群
- 如何清理离线工件以改善磁盘空间
- 如何清除 Redis 数据
- 如何启用 Istio 日志记录
- 如何手动清理日志
- 如何清理存储在 sf-logs 存储桶中的旧日志
- 如何禁用 AI Center 的流日志
- 如何对失败的 Automation Suite 安装进行调试
- 如何在升级后从旧安装程序中删除映像
- 如何禁用 TX 校验和卸载
- 如何手动将 ArgoCD 日志级别设置为 Info
- 如何扩展 AI Center 存储
- 如何为外部注册表生成已编码的 pull_secret_value
- 如何解决 TLS 1.2 中的弱密码问题
- 如何查看 TLS 版本
- 如何使用证书
- 如何计划 Ceph 备份和还原数据
- 如何使用集群内对象存储 (Ceph) 收集 DU 使用情况数据
- 如何在离线环境中安装 RKE2 SELinux
- How to clean up old differential backups on an NFS server
- 运行诊断工具
- 使用 Automation Suite 支持捆绑包
- 探索日志
- 探索汇总遥测

Linux 版 Automation Suite 安装指南
有关 Automation Suite 部署中使用的核心概念的更多信息,请参阅词汇表。
Automation Suite 支持以下部署模式:
|
部署模式 |
描述 |
|---|---|
|
单节点— 默认模式 |
默认情况下,支持评估和演示场景。 A single-node deployment can also be used in production, but only if specific requirements are met. For details, refer to Single-node production deployment. |
|
多节点 — 生产(已启用 HA) |
支持用于生产。 您可以在两种多节点模式之间进行选择:
|
Automation Suite 使用基于 Kubernetes 的云原生架构。它提供了 Kubernetes 在可扩展性、自动资源管理和可靠性方面的所有优势。
为了提供这些优势,Kubernetes 的设计基于以下基本方面:
- 在奇数台计算机(3、5、7 等)上运行;
- 使用法定人数原则处理独立节点故障和数据损坏。对于由 N 台计算机组成的集群,只要仍有许多 N/2 + 1 台计算机具有法定人数,集群就可以正常运行,并且可以正常恢复,而不会发生任何故障。
此页面提供对 Automation Suite 架构的深入了解,并描述捆绑到安装程序中的组件。
节点类型
服务器节点托管集群管理服务(控制平面),这些服务执行重要的集群操作,例如工作负载编排、集群状态管理、负载均衡传入请求等。Kubernetes 还可以根据基础资源可用性运行一些 UiPath™ 产品和共享组件。
代理节点仅负责运行 UiPath™ 产品和共享组件。
A specialized agent node runs special workloads like Document Understanding pipelines that require GPU capability, or Automation Suite Robots. However, the core Document Understanding, or Automation Suite Robots services still run on the server or agent nodes. Specialized agent nodes do not host any of the UiPath® product or shared components.
单节点评估部署
A single-node evaluation deployment here means a single-server node. This does not imply the deployment of the entire Automation Suite on a single machine. You may have to add additional agent or specialized agent nodes if the entire product suite cannot fit in a single server node, or if you want to run special tasks like Document understanding pipelines, which require GPU capabilities.
Single-node production deployment
A single-node deployment is typically used for evaluation or demo scenarios. In limited cases, it can also be used for production, but only if all of the following conditions are met:
- You must use an external objectstore. For details, refer to Configure an external objectstore.
- You must enable backup. For details, refer to Backing up and restoring the cluster.
- You can later move to a multi-node deployment, by adding new server nodes to the cluster and convert the deployment to multi-node (HA) deployment. For detailed steps, refer to the Scaling a single-node (evaluation) deployment to a multi-node (HA) deployment page.
Lite 模式部署
精简模式是一种轻量级部署,对基础架构资源的需求较少。它的高度可配置性为需要高可用性的服务提供了灵活性。默认情况下,基础架构和共享组件均在 HA 模式下部署,并且所有服务均处于精简模式。可以将特定服务切换到 HA 模式。
多节点 HA 就绪生产部署
多节点 HA 就绪生产部署涉及负载均衡器后面的 3 个或更多服务器节点。这是为了确保在发生灾难时,如果任何服务器节点出现故障,自动化套件仍可用于执行关键业务工作流。代理节点的数量是可选的,具体视实际使用情况而定。
High Availability Add-On
在多节点设置中,默认情况下启用高可用性 (HA)。但是,集群服务使用的基于 Redis 的内存缓存在单个 Pod 上运行,并且表示单点故障。为了减轻缓存节点故障或重新启动的影响,您可以购买高可用性插件 (HAA),它可以实现缓存的冗余多节点部署。
有关如何在多节点设置中启用 HAA 的更多详细信息,请参阅为集群启用 High Availability Add-on。
在线部署
离线部署
离线部署(离线)是完全隔离的设置,无法访问互联网。这种设置需要安装额外的注册表来存储所有 UiPath™ 产品的容器映像和二进制文件,需以 tar 包的形式提供这些映像和二进制文件。
将二进制文件(已填充数值)上传到注册表会带来额外的硬件要求和安装复杂性,从而增加与在线部署相比,执行安装所需的时间。
离线安装不仅会增加安装过程的复杂性,还会增加集群管理操作,例如计算机维护、灾难恢复、升级到较新版本、应用安全补丁等。
不允许在安装后更改部署方法。这意味着如果在线完成安装,您将无法更改为离线模式,反之亦然。建议在仔细考虑后选择部署策略。
Automation Suite 架构
下表列出了 Automation Suite 附带的第三方组件:
|
组件 |
可选/必填 |
描述 |
|---|---|---|
|
RKE2 |
必填 |
Rancher 提供的 Kubernetes 发行版。它是运行所有架构组件和服务的容器编排平台。 |
|
CEPH 对象存储 |
如果您有外部对象存储,则为可选项 |
公开了符合 Amazon S3 的对象/Blob 存储的开源存储提供程序。它使服务能够使用 Blob 存储等功能进行操作。 |
|
Argo CD |
必填 |
用于 Kubernetes 的开源声明性 CD 工具。它遵循 GitOps 模式,即使用 Git 存储库作为定义所需应用程序状态的事实来源。它为在 Kubernetes 集群中运行的 Automation Suite 组件和 UiPath™ 服务提供应用程序生命周期管理 (ALM) 功能。 |
|
Docker 注册表 |
如果您有外部注册表,则为可选项 |
用于推送和拉取本地安装时和运行时容器映像的开源 Docker 注册表。 |
|
Istio |
必填 |
开源服务网格,可为 Kubernetes 集群内运行的微服务提供入口、请求路由、流量监控等功能。 |
|
Prometheus |
Optional (you can exclude built-in monitoring components) |
Kubernetes 的开源系统监控工具包。它可以从 Kubernetes 组件以及在集群中运行的工作负载抓取或接受指标,并将其存储在时间序列数据库中。 |
|
Grafana |
Optional (you can exclude built-in monitoring components) |
用于查询和可视化 Prometheus 中存储的数据的开源可视化工具。您可以创建和发布各种用于监控集群和服务的仪表板。 |
|
警示管理器 |
Optional (you can exclude built-in monitoring components) |
帮助处理客户端应用程序(如 Prometheus 服务器)发送的警示的开源工具。它负责对数据进行重复数据删除、分组并将其路由到正确的接收器集成,例如电子邮件、PagerDuty 或 OpsGenie。 |
|
Redis |
必填 |
一些 UiPath™ 服务使用 Redis 企业版非 HA(单个分片)来获取集中式缓存功能。 |
|
FluentD 和 Fluentbit |
必填 |
开源可靠的日志抓取解决方案。日志记录运算符在每个节点上部署并配置后台流程,以从节点文件系统收集容器和应用程序日志。 |
|
Gatekeeper |
必填 |
开源工具,可以帮助 Kubernetes 管理员实施策略以确保其集群中的合规性和最佳实践。 |
|
velero | 需要1 |
使您可以创建快照备份和还原的开源工具。 |
| Thanos |
必填 | 用于将 Prometheus 矩阵推送到对象存储以进行持久存储的开源工具。 |
1仅在备份和还原期间安装。
外部组件
您还需要引入一些外部组件,例如外部负载均衡器和 SQL Server。 请注意,该套件提供了一些扩展点。