Driver 节点和 Executor 节点的主要职责分别是什么？

Question

Accepted Answer

在分布式计算框架（最典型的是 Apache Spark）中，Driver（驱动器） 和 Executor（执行器） 是两个核心组件。 简单来说：Driver 是“大脑”，负责指挥和调度；Executor 是“手脚”，负责干活和存储数据。 以下是它们的详细职责划分： --- 1. Driver 节点 (驱动器) Driver 是运行应用程序 函数并创建 的进程。它是整个应用的控制中心。 主要职责： 解析代码与构建逻辑： 运行用户编写的代码。 将用户代码中的转化操作（Transformations）和动作操作（Actions）转化为逻辑执行计划。 构建 DAG (有向无环图)： 将逻辑计划转化为物理执行计划，生成 DAG。 根据 Shuffle 依赖关系，将 DAG 划分为多个 Stage（阶段）。 任务调度 (Task Scheduling)： 将 Stage 进一步拆分为更小的 Task（任务）（Task 是最小的计算单元）。 决定将这些 Task 发送给哪个 Executor 去执行（基于数据本地性原则，即尽量把计算移动到数据所在的地方）。 资源申请与管理： 向 Cluster...

特性	Driver (大脑)	Executor (手脚)
核心功能	调度、协调、解析代码	计算、存储
数量	通常 1 个 (每个应用)	多个 (分布式并行)
资源消耗	主要消耗 CPU (用于调度) 和内存 (用于收集结果)	大量消耗 CPU (计算) 和内存 (存数据)
位置	可以运行在集群内 (Cluster Mode) 或客户端 (Client Mode)	始终运行在集群的工作节点 (Worker Nodes) 上
生命周期	与整个 Spark Application 绑定，应用结束则 Driver 退出	可能会因为故障重启，也可以动态伸缩

播面

Driver 节点和 Executor 节点的主要职责分别是什么？

1. Driver 节点 (驱动器)

2. Executor 节点 (执行器)

总结对比

形象的比喻

你好！我是 Bomian 助手