事实表的设计流程是怎样的？（声明粒度 - 确定维度 - 确定事实）

Question

事实表的设计流程是怎样的？（声明粒度 -> 确定维度 -> 确定事实）

Accepted Answer

根据数据仓库之父 Ralph Kimball 的经典理论，事实表设计的完整流程被称为 “维度设计四步法”。它决定了后续所有步骤的方向。 以下是完整、详细的事实表设计流程： --- 第一步：选择业务过程 (Select the Business Process) （这是你遗漏的一步，也是起点） 定义：业务过程是企业进行的实际操作活动，通常由源系统（如ERP、CRM）中的事件触发。 如何做： 寻找动词：如“下单”、“支付”、“退款”、“浏览”、“入库”。 不要把“业务部门”误当作“业务过程”。例如，“营销部”不是业务过程，但“发送营销邮件”是。 目的：明确我们要分析的具体业务事件是什么。 第二步：声明粒度 (Declare the Grain) （这是最关键的一步，决定了表的详细程度） 定义：精确定义事实表中一行数据代表什么。 原则：原子粒度（Atomic Grain）是首选。粒度越细，维度组合越丰富，分析的灵活性越高。 常见误区：不要在设计初期就为了性能而聚合数据（如“按天汇总”），这会丢失细节。 示例： 错误/模糊的粒度：每个订单一行。 正确的粒度：每个订单中的每个子项（SKU）...

播面

事实表的设计流程是怎样的？（声明粒度 -> 确定维度 -> 确定事实）

第一步：选择业务过程 (Select the Business Process)

第二步：声明粒度 (Declare the Grain)

第三步：确定维度 (Identify the Dimensions)

第二步：确定事实 (Identify the Facts)

实战案例演示：电商下单业务

进阶：第五步（冗余与优化）

总结

你好！我是 Bomian 助手