Flink SQL 的执行流程

知识点图片

Flink SQL 的执行流程是一个将声明式 SQL 语句转化为 Flink Runtime 可执行代码的过程。这个过程主要依赖于 Apache Calcite 框架以及 Flink 自研的优化规则（Blink Planner）。

整个流程可以概括为以下几个核心步骤：

SQL -> 解析 (Parser) -> 验证 (Validator) -> 优化 (Optimizer) -> 代码生成/转换 (CodeGen/Translation) -> 执行图 (JobGraph) -> 提交运行

下面是详细的流程图解和步骤解析：

1. 整体流程图 (High-Level)

plaintext

graph TD
    A[SQL String] -->|Parser| B(AST - SqlNode)
    B -->|Validator + Catalog| C(Logical Plan - RelNode)
    C -->|Optimizer (RBO + CBO)| D(Physical Plan)
    D -->|Code Generation| E(Transformations / DataStream Graph)
    E -->|StreamGraphGenerator| F(StreamGraph)
    F -->|JobGraphGenerator| G(JobGraph)
    G -->|Submit| H[Flink Cluster (JobManager)]

2. 详细步骤解析

第一步：SQL 解析 (Parser)

输入：用户编写的 SQL 字符串。
工具：Apache Calcite Parser。
动作：进行词法分析和语法分析。
- 检查 SQL 语法是否正确（例如关键字拼写、逗号位置等）。
输出：AST (抽象语法树)，在 Calcite 中表现为 SqlNode 树。此时 Flink 还不理解表名或列名的具体含义，只知道这是一个查询结构。

第二步：SQL 验证 (Validator)

输入：SqlNode (AST)。
工具：Apache Calcite Validator + Catalog (元数据管理器)。
动作：
- 元数据查找：去 Catalog 中查找表是否存在、列是否存在。
- 类型检查：检查数据类型是否匹配（例如不能将 String 和 Int 相加）。
- 语义检查：检查 SQL 语义是否合法（例如 GROUP BY 字段是否正确）。
输出：逻辑计划 (Logical Plan)，在 Calcite 中表现为 RelNode (Relational Node) 树。此时 SQL 已经被转化为关系代数操作。

第三步：优化 (Optimizer) —— 最核心步骤

输入：逻辑计划 (RelNode)。
工具：Calcite Volcano Planner + Flink 自定义规则 (Rules)。
动作：这是 Flink SQL 性能优化的关键。它包含两个阶段：
1. 逻辑优化 (Logical Optimization / RBO)：
  - 谓词下推 (Predicate Pushdown)：将 Filter 提前，减少数据处理量。
  - 列裁剪 (Column Pruning)：只读取需要的列。
  - 子查询解相关等。
2. 物理优化 (Physical Optimization / CBO)：
  - 基于成本的优化 (Cost-Based Optimizer)。Flink 会根据统计信息（如数据量大小）选择最优的物理执行路径。
  - Join 策略选择：决定是使用 Broadcast Join, Shuffle Hash Join 还是 Sort Merge Join。
  - 聚合策略：是否开启两阶段聚合 (Local-Global Aggregation) 以解决数据倾斜。
  - State Backend 优化：针对流处理的状态访问优化。
输出：物理计划 (Physical Plan)。这是一个具体的、可执行的计划，确定了具体的算子实现。

第四步：代码生成与转换 (Code Generation & Translation)

输入：物理计划。
工具：Flink Table Planner (基于 Janino 编译器)。
动作：
- 将物理计划节点翻译成 Flink 的底层 API (Transformations)。
- Code Generation：为了提高性能，Flink 不会直接调用通用的 Java 函数，而是动态生成针对该 SQL 的特定 Java 代码（例如生成一个专门处理该 SQL WHERE 条件的 ProcessFunction 类），并使用 Janino 编译成字节码。这避免了大量的装箱/拆箱操作和虚函数调用。
输出：Transformations (即 DataStream API 对应的算子 DAG)。

第五步：生成执行图 (JobGraph Generation)

输入：Transformations。
动作：
- 生成 StreamGraph：表示流处理的拓扑结构。
- 生成 JobGraph：这是客户端提交给 JobManager 的最终数据结构。在此阶段会进行 Operator Chain (算子链) 优化，将多个轻量级算子（如 Map, Filter）合并到一个线程中执行，减少线程切换和序列化开销。
输出：JobGraph。

第六步：提交与执行 (Execution)

动作：客户端将 JobGraph 提交给 Flink 集群的 JobManager。
运行时：
- JobManager 将 JobGraph 转化为 ExecutionGraph。
- 根据并行度将任务分发给 TaskManager 执行。

3. 关键组件总结

Catalog：
- 存储元数据（数据库、表、函数、视图）。可以是内存的 (GenericInMemoryCatalog)，也可以是持久化的 (HiveCatalog)。
Apache Calcite：
- Flink SQL 的大脑。负责 SQL 的解析、验证和大部分优化工作。
Planner (Blink Planner)：
- Flink 现在的默认 Planner。它深度定制了 Calcite，引入了更强大的 CBO (基于成本的优化) 和更高效的代码生成机制，统一了流批处理的架构。
Code Generator (Janino)：
- 动态编译技术，是 Flink SQL 高性能的重要原因之一。

4. 示例：一个简单的 SQL 经历了什么？

假设 SQL：SELECT id, count(*) FROM clicks WHERE user = 'A' GROUP BY id

Parser: 识别出 SELECT, WHERE, GROUP BY 关键字，构建语法树。
Validator: 确认 clicks 表存在，user 和 id 字段存在。
Optimizer:
- 谓词下推：先执行 WHERE user = 'A'，再做聚合，减少数据量。
- 列裁剪：只读取 id 和 user 字段，忽略其他字段。
- 物理选择：如果是流处理，选择 Hash Aggregation 算子；如果是批处理且数据量巨大，可能选择 Sort Aggregation。
CodeGen: 动态生成一个 Java 类，里面包含 if (user.equals("A")) 的逻辑。
Execution: 算子被链接，任务在 TaskManager 上启动，处理数据流。

播面