Redis Cluster 官方设计是支持平滑、在线的扩容和缩容的,理论上不会导致业务停机(No Downtime)。 但是,“不停机”并不意味着“无感知”。在实际生产环境中,由于扩缩容的核心本质是槽位(Slot)和数据的迁移,线上业务不可避免地会受到一定程度的影响。 总体来说,影响主要集中在请求延迟增加、网络/CPU资源争抢以及特定场景下的报错。以下是具体的详细分析: --- 一、 核心影响机制:数据迁移(Slot Migration) 无论是扩容还是缩容,核心动作都是把一部分 Hash Slot(以及里面的所有 Key)从源节点迁移到目标节点。这个过程中: 1. 源节点会将该 Slot 标记为 状态。 2. 目标节点会将该 Slot 标记为 状态。 3. Redis 使用 命令,逐个或批量将 Key 从源节点传输到目标节点。 二、 线上业务具体会受到的影响 1. 业务请求延迟增加(最普遍的影响) ASK 重定向导致的网络开销:当客户端请求一个正在迁移的 Slot 中的 Key 时: 如果 Key 还在源节点,源节点直接处理。 如果 Key 已经迁移到目标节点,源节点会返回一个...