在 PostgreSQL 中，Database、Schema 和 Catalog 之间有什么区别和联系？

知识点图片

在 PostgreSQL 中，Database（数据库）、Schema（模式） 和 Catalog（目录） 是三个用于组织、管理和描述数据的核心概念。它们之间既有严格的层级关系，又在功能上有着明确的分工。

为了让你清晰地理解，我们可以从定义、区别、联系以及一个通俗的比喻来进行详细拆解。

1. 核心概念解析

① Database (数据库)

定义：Database 是 PostgreSQL 集群（Cluster / Instance）下的最高层级的逻辑隔离单位。
特点：
- 严格的隔离性：客户端每次只能连接到一个 Database。连接后，默认情况下无法直接跨数据库查询另一个 Database 中的数据（除非使用 dblink 或 postgres_fdw 等外部数据包装器）。
- 物理存储：在文件系统底层，每个 Database 都有与之对应独立的目录结构。
- 用途：通常用于隔离完全不同的项目、环境（如 dev、test、prod）或多租户架构中的不同客户。

② Schema (模式)

定义：Schema 是 Database 内部的命名空间（Namespace）。数据库中的所有对象（如表、视图、索引、函数等）都必须存放在某个 Schema 中。
特点：
- 逻辑分组：它没有严格的物理隔离，只是逻辑上的分类。
- 允许重名：在同一个 Database 下，不同的 Schema 可以有同名的表（例如 sales.users 和 hr.users 互不冲突）。
- 跨 Schema 查询极简：只要有权限，在同一个 Database 中可以轻松跨 Schema join 表（例如 SELECT * FROM schemaA.table1 JOIN schemaB.table2）。
- 默认存在：每个新建的 Database 都会默认带有一个名为 public 的 Schema。
- 用途：用于在同一个项目内对模块进行分类（如财务模块、HR模块），或进行更细粒度的权限控制。

③ Catalog (目录 / 系统目录)

注意：Catalog 在 SQL 标准和 PostgreSQL 具体实现中有双重含义，这是最容易混淆的地方。
含义一（SQL标准/客户端视角）：在 SQL 标准（以及 JDBC 等驱动）中，Catalog 基本上是 Database 的同义词。比如你调用 JDBC 的 connection.getCatalog()，返回的就是当前的 Database 名称。
含义二（PostgreSQL 内部视角 - System Catalog）：在 PostgreSQL 的官方文档和日常语境中，Catalog 通常指代 “系统目录（System Catalog）”。
- 本质：它是一系列系统内置表和视图的集合（它们存在于 pg_catalog 这个特殊的 Schema 中）。
- 作用：用来存储关于数据库的元数据（Metadata）。比如：数据库里有哪些表？哪些用户？每个表有哪些字段？字段是什么类型？
- 例子：pg_class（记录所有表和索引的信息）、pg_attribute（记录列信息）、pg_database（记录集群里有哪些数据库）。

2. 它们的区别总结

特性	Database (数据库)	Schema (模式)	Catalog (系统目录)
层级位置	处于集群（Instance）之下，Schema 之上。	处于 Database 之下，表/视图之上。	存在于 Database 内部（以特定的 Schema 形式存在）。
隔离级别	硬隔离。无法直接跨库查询，需要建立新的连接或使用 FDW。	软隔离。只需带上 Schema 前缀即可跨模式查询。	元数据层。用于描述数据的数据，用户一般只读。
物理 vs 逻辑	物理上对应独立的文件夹，逻辑上完全独立。	纯逻辑概念（命名空间）。	物理存在的系统表，存储在底层文件中。
主要解决的问题	项目/租户级别的彻底隔离。	同一项目内模块划分、解决表名冲突、细化权限。	数据库自身如何记录和管理内部所有对象的属性。

3. 它们的层级联系

它们构成了一个自上而下的包含与描述关系：

一个 PostgreSQL 集群（Cluster）包含多个 Database。
每个 Database 包含多个 Schema（包括默认的 public，以及用于存元数据的 pg_catalog）。
每个 Schema 包含具体的数据库对象（Table, View, Function 等）。
而 System Catalog（系统目录）默默记录着上述第 1、2、3 步中所有对象的创建信息、权限信息和物理位置信息。

标准命名路径（完全限定名）：
在 SQL 标准中，定位一张表的完整路径是：
CatalogName.SchemaName.TableName (在 PG 中即：DatabaseName.SchemaName.TableName)
注意：PG 的 SQL 语法不允许在查询中带上 DatabaseName 进行跨库查询，所以实际使用中最多写到 SchemaName.TableName。

4. 通俗的比喻（公司档案室）

如果你把 PostgreSQL 服务器想象成一家大公司的档案室总管（Cluster）：

Database（数据库） = 档案室里的独立文件柜。
- 比如有“中国区文件柜”、“北美区文件柜”。你不能同时打开两个柜子看里面的文件，必须关上一个，走到另一个前面重新打开（建立连接）。
Schema（模式） = 文件柜里的抽屉。
- 比如“中国区文件柜”里，有“财务部抽屉（Schema）”、“人事部抽屉（Schema）”。
- 抽屉只是为了把文件分门别类，财务部抽屉里可以有一份叫“10月报表”的文件（Table），人事部抽屉里也可以有一份叫“10月报表”的文件，名字一样但不会搞混。
- 你可以同时拉开这两个抽屉，把两份文件拿出来对比（跨 Schema 查询）。
Catalog（系统目录） = 挂在每个文件柜门后的一本《文件柜资产登记簿》。
- 这本登记簿详细记录了：这个柜子里有几个抽屉？每个抽屉是谁建的？抽屉里有哪些文件夹？每一页长什么样？这本登记簿本身也是存放在一个特殊的只读抽屉里（pg_catalog Schema）。

一句话总结：
Database 是物理隔离的容器，Schema 是容器内逻辑分组的命名空间，而 Catalog 是记录这些容器和命名空间长什么样子的系统元数据表。

右滑查看面试常问

播面