在 Hadoop YARN 的 ResourceManager (RM) 高可用(HA)架构中,ZooKeeper (ZK) 扮演着至关重要的“分布式协调者”角色。它的主要作用可以归结为以下四个核心方面: 1. 自动主备选举 (Leader Election) 在 HA 架构中,通常会有两个或多个 ResourceManager(一个 Active,其余 Standby)。但是同一时刻只能有一个 RM 处于 Active 状态对外提供服务。 实现机制:ResourceManager 内部内嵌了一个基于 ZooKeeper 的选举器()。当 RM 启动时,它们都会尝试在 ZooKeeper 中创建一个特定的临时节点 (Ephemeral Node)(例如 )。 ZooKeeper 保证只有一个 RM 能够创建成功。创建成功的 RM 成为 Active 节点,创建失败的 RM 成为 Standby 节点。 2. 故障检测与自动故障转移 (Failure Detection & Auto-Failover) ZooKeeper 负责实时监控 Active RM 的健康状态,并在其宕机时...