金石为开Jin.wiki
往期整理
历史归档
标签分类
tacjin | Code, Cloud & Concepts
0
大数据
数据治理
数据模型
生产实践
🧑🏻🔧
数仓分层HW版实践总结
字数
0
阅读时长≈
1
分钟
2025-8-13
2025-8-17
文章已上锁,请输入访问密码
提交
目录
1 范围
2 规范性引用文件
3 术语和定义
3.1 数据湖
3.2 数据仓库
3.3 E-R模型
3.4 范式建模
3.5 维度建模
3.6 星型模型
3.7 雪花模型
3.8 汇聚表
3.9 宽表
4 管理职责与分工
5 湖仓分层原则
5.1 分层总体原则
5.1.1 标准化原则
5.1.2 扩展性原则
5.1.3 一致性原则
5.1.4 继承性原则
5.2 分层意义及目标
5.2.1 清晰数据结构
5.2.2 减少重复开发
5.2.3 复杂问题简单化
5.2.4 数据维护简易化
5.2.5 屏蔽业务变动的影响
5.2.6 数据质量提升
6 湖仓分层设计
6.1 贴源层(SDI,Source Data Integration)
6.2 整合层(DWI,Data Warehouse Integration)
6.3 报告层(DWR,Data Warehouse Report)
6.4 集市层(DM,Data Mart)
7 分层技术规范
7.1 贴源层(SDI)规范
7.1.1 数据模型
7.1.2 加工逻辑
7.2 整合层(DWI)规范
7.2.1 数据模型
7.2.2 加工逻辑
7.3 报告层(DWR)规范
7.3.1 数据模型
7.3.2 加工逻辑
7.4 集市层(DM)规范
7.4.1 数据模型
7.4.2 加工逻辑
7.5 数据流转关系
你好!我是tacjin,我是
tacjin
🎉 你好呀,感谢你的光临
了解更多
目录
1 范围
2 规范性引用文件
3 术语和定义
3.1 数据湖
3.2 数据仓库
3.3 E-R模型
3.4 范式建模
3.5 维度建模
3.6 星型模型
3.7 雪花模型
3.8 汇聚表
3.9 宽表
4 管理职责与分工
5 湖仓分层原则
5.1 分层总体原则
5.1.1 标准化原则
5.1.2 扩展性原则
5.1.3 一致性原则
5.1.4 继承性原则
5.2 分层意义及目标
5.2.1 清晰数据结构
5.2.2 减少重复开发
5.2.3 复杂问题简单化
5.2.4 数据维护简易化
5.2.5 屏蔽业务变动的影响
5.2.6 数据质量提升
6 湖仓分层设计
6.1 贴源层(SDI,Source Data Integration)
6.2 整合层(DWI,Data Warehouse Integration)
6.3 报告层(DWR,Data Warehouse Report)
6.4 集市层(DM,Data Mart)
7 分层技术规范
7.1 贴源层(SDI)规范
7.1.1 数据模型
7.1.2 加工逻辑
7.2 整合层(DWI)规范
7.2.1 数据模型
7.2.2 加工逻辑
7.3 报告层(DWR)规范
7.3.1 数据模型
7.3.2 加工逻辑
7.4 集市层(DM)规范
7.4.1 数据模型
7.4.2 加工逻辑
7.5 数据流转关系
最新发布
Hadoop基本概念(四):版本更迭
2025-9-2
Flink On Hudi生产开发最佳实践
2025-8-24
人与技术工具
2025-8-24
Hudi表设计及管理规范
2025-8-23
数据集成规范实践总结
2025-8-17
数仓分层HW版实践总结
2025-8-17
工具
23
java
22
生产实践
10
数据治理
9
推荐
5
Hadoop
5
必看精选
4
实用教程
3
数据模型
3
热门文章
2
数据采集
2
NoSQL
2
数据湖
2
Shell
1
文章数:
62
建站天数:
474 天
访问量:
访客数: