根据数据仓库之父 Ralph Kimball 的经典理论,事实表设计的完整流程被称为 “维度设计四步法”。它决定了后续所有步骤的方向。 以下是完整、详细的事实表设计流程: --- 第一步:选择业务过程 (Select the Business Process) (这是你遗漏的一步,也是起点) 定义:业务过程是企业进行的实际操作活动,通常由源系统(如ERP、CRM)中的事件触发。 如何做: 寻找动词:如“下单”、“支付”、“退款”、“浏览”、“入库”。 不要把“业务部门”误当作“业务过程”。例如,“营销部”不是业务过程,但“发送营销邮件”是。 目的:明确我们要分析的具体业务事件是什么。 第二步:声明粒度 (Declare the Grain) (这是最关键的一步,决定了表的详细程度) 定义:精确定义事实表中一行数据代表什么。 原则:原子粒度(Atomic Grain)是首选。粒度越细,维度组合越丰富,分析的灵活性越高。 常见误区:不要在设计初期就为了性能而聚合数据(如“按天汇总”),这会丢失细节。 示例: 错误/模糊的粒度:每个订单一行。 正确的粒度:每个订单中的每个子项(SKU)...