DWD层总结

DWD层总结DWD层:4步建模作用:1)对用户行为数据进行解析2)对核心数据进行判空过滤3)对业务数据采用维度模型重新建模。一、DWD层数据分析首先DWD层数据都来源于ODS层。具体数据可分为两类1)用户行为数据(多为json)2)业务数据1、用户行为数据业务行为数据一般都是来源于前端页面的埋点日志信息分为启动日志和普通日志启动日志表中每行数据对应一个启动记录,一个启动记录应该包含日志中的公共信息和启动信息。先将所有包含start字段的日志过滤出来,然后使用get_json_object

大家好,又见面了,我是你们的朋友全栈君。

DWD层:4步建模
作用:
1)对用户行为数据进行解析
2)对核心数据进行判空过滤
3)对业务数据采用维度模型重新建模。
一、DWD层数据分析
首先DWD层数据都来源于ODS层。具体数据可分为两类
1)用户行为数据(多为json)
2) 业务数据
1、 用户行为数据
业务行为数据一般都是来源于前端页面的埋点日志信息
分为 启动日志 和普通日志
启动日志表中每行数据对应一个启动记录,一个启动记录应该包含日志中的公共信息和启动信息。先将所有包含start字段的日志过滤出来,然后使用get_json_object函数解析每个字段。
2、分析用户行为数据
主要通过 hive提供的 get_json_object(“json主题”,”$[i]”)进行提取分析;将获得的数据进行提取,存入表数据中

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/153206.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 第十一单元作业

    第十一单元作业

    2022年3月12日
    35
  • 面试逻辑题_经典的20道逻辑题

    面试逻辑题_经典的20道逻辑题第一题:10颗完全相同的糖果,分给三个小朋友,每个人至少一颗糖,有几种分法第二题:-2到2区间,xy两个数相加小于1的概率其实就是在平面坐标系中画出x+y=1的直线。求直线下面的面积就好了

    2022年8月1日
    3
  • IP地址的ABCDE类划分[通俗易懂]

    IP地址的ABCDE类划分[通俗易懂]1、0-—127。A类网络号码范围是0.0.0.0—127.0.0.0,用于128个网络。但网络不能近由0组成且127.0.0.0保留用于回路。剩下的126个网络,1到126,共有16777214个可能的主机地址(16777216减2)A类网络—主机——主机—主机0-1271270002、128—191。B

    2022年5月18日
    46
  • 项目管理办法_企业项目管理

    项目管理办法_企业项目管理本文档的目的是为公司各个项目的项目管理工作提供指导,帮助项目组其他成员了解项目管理的要素,明确项目管理活动中的角色职责、协作流程、作业表单格式要求。本文档将规定项目管理中各角色的职责和权利,在进行协作

    2022年8月2日
    5
  • oracle如何导出数据(oracle如何备份数据库)

    1、createnewPDM;2、selectdatabasemenu;3、clickReverseEngineerdatabase;4、thenchooseyourscriptfile;5、clickOK;6、success。还有一个版本1,打开Powerdesigner工具,创建一个PDM文件,选择与之匹配的数据库类型“ibmdb2udb8.xcommo…

    2022年4月12日
    232
  • pip换源 -pip更换国内镜像源「建议收藏」

    pip换源 -pip更换国内镜像源「建议收藏」更换pip源到国内镜像2017年02月16日15:06:53阅读数:70784pip国内的一些镜像  阿里云http://mirrors.aliyun.com/pypi/simple/  中国科技大学https://pypi.mirrors.ustc.edu.cn/simple/  豆瓣(douban)http://pypi.douban.com/simple/…

    2022年6月4日
    60

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号