Paimon 中的“主键表（Primary Key Table）”与“仅追加表（Append-only Table）”在底层的存储结构、文件归并和读写行为上有何本质区别？

Question

Accepted Answer

基于 Apache Paimon 官方文档，主键表（Primary Key Table）与仅追加表（Append-only Table）在底层的存储结构、文件归并和读写行为上的本质区别如下： 一、 底层存储结构的区别 1. 主键表 (Primary Key Table) - LSM-Tree 物理组织：主键表以分区和 Bucket（桶）为最小读写单位，每个 Bucket 底层都对应一棵独立的 LSM-Tree。 - Sorted Runs（排序段）：数据先在内存缓冲（MemTable）中按主键进行排序，溢写到磁盘后形成多个 Sorted Runs。每个数据文件内部的数据行严格按主键排序，同一个 Sorted Run 内的文件主键范围互不重叠，但不同 Sorted Runs 之间主键范围允许重叠。 - 辅助文件：除了存储具体行数据的数据文件外，还包含用于记录删除标记的 Deletion Vector 文件，或用于流式下游消费的 Changelog 变更日志文件。 2. 仅追加表 (Append-only Table) - 顺序平面存储：不定义主键，不支持行级更新。数据直接以追加（+...

播面

Paimon 中的“主键表（Primary Key Table）”与“仅追加表（Append-only Table）”在底层的存储结构、文件归并和读写行为上有何本质区别？

一、底层存储结构的区别

二、文件归并 (Compaction) 的本质区别

三、读写行为的区别

你好！我是 Bomian 助手

Paimon 中的“主键表（Primary Key Table）”与“仅追加表（Append-only Table）”在底层的存储结构、文件归并和读写行为上有何本质区别？

一、 底层存储结构的区别

二、 文件归并 (Compaction) 的本质区别

三、 读写行为的区别

你好！我是 Bomian 助手

一、底层存储结构的区别

二、文件归并 (Compaction) 的本质区别

三、读写行为的区别