https://www.modb.pro/db/241289

https://blog.csdn.net/weixin_45532984/article/details/124731837

维度的三种模型

星型模型

事实表被多个维表或一个或多个层次所包围 多维数据集的每一个维度都直接与事实表相连接,不存在渐变维度,所以数据有一定的冗余

雪花模型

在星型模型中,维度表包括了该维度的所有信息,因为没有分层,所以维度表里面可能会有冗余出现。 为了减少维度表的冗余,这时我们可以使用雪花模型。雪花模型在星型模型的基础上,把维度表中的一些字段进行进一步的拆分,减少冗余,使其更有层次。

我所实践的案例

  • 数仓: GreemPlum

使用一个库,不同的业务领域直接使用 schema 隔离,这样方便 比如 DM层的数据表的构建,避免数据跨库移动,提高建仓效率

  • 分层

DCM: 缓冲层(可以简单理解为业务系统的短期快照,dcm的意义在于避免系统故障导致对业务系统反复取数的问题) ODS: 贴源层(主流方案,表结构与业务系统保持一致,大表可以使用拉链表提供存储效率) FDM: 基础整合层 GDM:公告汇总层 DM: 集市层