大家好,又见面了,我是你们的朋友全栈君。
DWD层:4步建模
作用:
1)对用户行为数据进行解析
2)对核心数据进行判空过滤
3)对业务数据采用维度模型重新建模。
一、DWD层数据分析
首先DWD层数据都来源于ODS层。具体数据可分为两类
1)用户行为数据(多为json)
2) 业务数据
1、 用户行为数据
业务行为数据一般都是来源于前端页面的埋点日志信息
分为 启动日志 和普通日志
启动日志表中每行数据对应一个启动记录,一个启动记录应该包含日志中的公共信息和启动信息。先将所有包含start字段的日志过滤出来,然后使用get_json_object函数解析每个字段。
2、分析用户行为数据
主要通过 hive提供的 get_json_object(“json主题”,”$[i]”)进行提取分析;将获得的数据进行提取,存入表数据中
发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/153206.html原文链接:https://javaforall.net