admin管理员组文章数量:1130349
目录
一、销售数仓介绍
二、数仓建设理论
2.1 数仓建设流程
2.2 数仓分层方式
2.3 数仓建模原则
2.3.1 高内聚低耦合
2.3.2 公共逻辑下沉
2.3.3 成本与性能平衡
2.3.4 一致性
2.3.5 数据可回滚
2.4 指标管理
三、销售数仓架构介绍
3.1 离线&实时的Lambda架构
3.2 实时数据流状态过期解决方案
3.3 引入离线流带来物流指标准确性问题
3.4 实时场景下物流指标准确性修正
3.5 基于Iceberg的存储批流一体方案
四、数仓能力建设
4.1 数据架构
4.2 数仓规范
4.3 数据安全
4.4 指标应用
五、 总结与展望
六、Q&A
原文大佬的这篇销售数仓建设方面的实践有借鉴意义,这里摘抄下来用作学习和知识沉淀。如有侵权请告知~
一、销售数仓介绍
首先介绍下小米销售数仓,包括发展历程、销售数仓定义、数据获取使用、销售数仓的内容和规模。在 2019年前小米数据团队在进行独立的数仓建设,这个时期是烟囱式的开发。随着业务飞速发展,开始建设统一的销售数仓。在 2020年完成了离线销售数仓的建设,并筹备实时数仓的建设。2021年实时数仓建设完毕,随着后续的业务和技术升级,进入了迭代优化和数据应用阶段。
小米的销售数仓整体上就是存放整个公司销售数据的仓库,包括了订单数据、物流数据、门店数据、用户行为数据及商品数据,并按照维度建模和规范进行建设的高效数据集合。
目录
一、销售数仓介绍
二、数仓建设理论
2.1 数仓建设流程
2.2 数仓分层方式
2.3 数仓建模原则
2.3.1 高内聚低耦合
2.3.2 公共逻辑下沉
2.3.3 成本与性能平衡
2.3.4 一致性
2.3.5 数据可回滚
2.4 指标管理
三、销售数仓架构介绍
3.1 离线&实时的Lambda架构
3.2 实时数据流状态过期解决方案
3.3 引入离线流带来物流指标准确性问题
3.4 实时场景下物流指标准确性修正
3.5 基于Iceberg的存储批流一体方案
四、数仓能力建设
4.1 数据架构
4.2 数仓规范
4.3 数据安全
4.4 指标应用
五、 总结与展望
六、Q&A
原文大佬的这篇销售数仓建设方面的实践有借鉴意义,这里摘抄下来用作学习和知识沉淀。如有侵权请告知~
一、销售数仓介绍
首先介绍下小米销售数仓,包括发展历程、销售数仓定义、数据获取使用、销售数仓的内容和规模。在 2019年前小米数据团队在进行独立的数仓建设,这个时期是烟囱式的开发。随着业务飞速发展,开始建设统一的销售数仓。在 2020年完成了离线销售数仓的建设,并筹备实时数仓的建设。2021年实时数仓建设完毕,随着后续的业务和技术升级,进入了迭代优化和数据应用阶段。
小米的销售数仓整体上就是存放整个公司销售数据的仓库,包括了订单数据、物流数据、门店数据、用户行为数据及商品数据,并按照维度建模和规范进行建设的高效数据集合。
版权声明:本文标题:数仓实践——小米数据中台部门在销售数仓建设方面的实践 内容由热心网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:https://it.en369.cn/jiaocheng/1758188562a2776371.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。


发表评论