数仓项目总结

1227-李同学

发表文章数:84

热门标签

首页 » 大数据 » 正文

技术框架

  • Linux
  • Flume 采集
  • Kafka缓存
  • Flume消费
  • HDFS存储
  • Hive数仓 自定义UDF、UDTF、日期处理函数
  • Sqoop数据导入
  • MySQL指标存储
  • Azkaban
  • Zookeeper
  • Kafka Manager
  • Flume监控器
  • Tez
  • Presto
  • Kylin
  • Hbase
  • Hue
  • Shell

业务

  • 用户行为业务表12张,每张表的字段记住4-5个

  • 分层结构图

  • 业务术语

  • 电商中最关心的指标:留转GMV复活

  • 需求一:用户活跃主题

  • 需求二:用户新增主题

  • 需求三:用户留存主题

  • 电商常识(SKU、SPU)

  • 表的分类

  • 同步策略

  • 范式理论

  • 雪花模型、星型模型和星座模型

  • DWS层之用户行为宽表

  • DWS层之用购买商品明细表(订单、用户表、商品)

  • 需求四:GMV成交总额

  • 需求五:转化率

  • 需求六:品牌复购率

  • 订单表拉链表

标签:

未经允许不得转载:作者:1227-李同学, 转载或复制请以 超链接形式 并注明出处 拜师资源博客
原文地址:《数仓项目总结》 发布于2020-11-27

分享到:
赞(0) 打赏

评论 抢沙发

评论前必须登录!

  注册



长按图片转发给朋友

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

Vieu3.3主题
专业打造轻量级个人企业风格博客主题!专注于前端开发,全站响应式布局自适应模板。

登录

忘记密码 ?

您也可以使用第三方帐号快捷登录

Q Q 登 录
微 博 登 录