在数据仓库的建设中,DWD(Data Warehouse Detail,明细数据层) 和 DWS(Data Warehouse Service/Summary,汇总数据层/服务层) 是最核心的两个层次。它们承上启下,决定了数仓的稳定性、复用性和查询性能。 以下是这两层详细的设计原则对比: --- 一、 DWD 层(明细数据层)设计原则 定位:DWD 层是数仓的“地基”和“事实来源”。它基于 ODS(原始数据层)进行清洗、转换,以维度建模(Kimball 方法论)为核心,保存最细粒度的业务行为数据。 1. 保持最细粒度(Atomic Granularity) 原则:DWD 层的数据必须保持业务发生的原子级别,不可进行聚合操作。 原因:只有保留最细粒度,才能支持后续任意维度的上卷(Roll-up)和下钻(Drill-down)分析。 示例:如果是电商订单,DWD 层应存储“每一行商品”的下单记录,而不是“每个订单”的总金额,更不是“每天”的销售额。 2. 维度建模(Dimensional Modeling) 原则:采用星型模型(Star Schema)构建,将数据拆分为事实表(Fac...