大数据治理包括哪几个方面

大数据治理包括哪几个方面在数据治理中 涉及到了前端业务系统 后端业务数据库系统再到业务终端的数据分析 从源头到终端再回到源头 形成的一个闭环负反馈系统 同样地 在数据治理中 我们也需要一套标准化的规范来指导数据的采集 传输 储存以及应用 数据治理包括数据规划 数据采集 数据储存管理 数据应用四个方面 根据每一个方面的特点 我们可以将数据治理总结为四个字 即 理 采 存 用 01 理 梳理业务流程 规划数据资源 对于企业来说 每天的实时数据都会超过 TB 级别 需要采集用户的哪些数据 这么多的数据放

  在数据治理中,涉及到了前端业务系统,后端业务数据库系统再到业务终端的数据分析,从源头到终端再回到源头,形成的一个闭环负反馈系统。同样地,在数据治理中,我们也需要一套标准化的规范来指导数据的采集、传输、储存以及应用。

  数据治理包括数据规划、数据采集、数据储存管理、数据应用四个方面。根据每一个方面的特点,我们可以将数据治理总结为四个字,即“理”、“采”、“存”、“用”。

  01理:梳理业务流程,规划数据资源

  对于企业来说,每天的实时数据都会超过TB级别,需要采集用户的哪些数据,这么多的数据放在哪里,如何放,以什么样的方式放?这些问题都是需要事先进行规划的,需要有一套从无序变为有序的流程,这个过程需要跨部门的协作,包括了前端、后端、数据工程师、数据分析师、项目经理等角色的参与。

  02采:ETL采集、去重、脱敏、转换、关联、去除异常值

  前后端将采集到的数据给到数据部门,数据部门通过ETL工具将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程,目的是将散落和零乱的数据集中存储起来。

  03存:大数据高性能存储及管理

  这么多的业务数据存在哪里?这需要有一高性能的大数据存储系统,在这套系统里面将数据进行分门别类放到其对应的库里面,为后续的管理及使用提供最大的便利。

  04用:即时查询、报表监控、智能分析、模型预测

  数据治理的最终目的就是辅助业务进行决策,前面的三个方面都是为最终的查询、分析、监控做铺垫。这个阶段就是数据分析师的主场,分析师们运用这些标准化的数据可以进行即时的查询、指标体系和报表体系的建立、业务问题的分析,甚至是模型的预测。

  数据治理是指将零散的用户数据通过采集、传输、储存等一系列标准化的流程变成格式规范、结构统一的数据,并有严格和规范的综合数据管控;对这些标准化的数据进行进一步加工分析成为具有指导意义的业务监控报表、业务监控模型以帮助业务进行辅助决策。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/234025.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • java实现国密SM4加密「建议收藏」

    java实现国密SM4加密「建议收藏」前言最近世界政治影响,我国也开始要求算法的使用,以避免来自外国的黑客入侵。我们在使用加密算法时,有必要选择使用国密算法进行加密一、国密SM4是什么? 国密即国家密码局认定的国产密码算法。 主要有SM1,SM2,SM3,SM4。密钥长度和分组长度均为128位。 SM1为对称加密。其加密强度与AES相当。该算法不公开,调用该算法时,需要通过加密芯片的接口进行调用。 SM2为非对称加密,基于ECC。该算法已公开。由于该算法基于ECC,故其签名速度与秘钥生成速度都快于RSA ECC2.

    2022年10月5日
    0
  • Django 教程[通俗易懂]

    Django 教程[通俗易懂]Django 实战网址:http://study.163.com/course/courseMain.htm?courseId=1004369003菜鸟教程网址:http://www.runoob.com/django/django-tutorial.html

    2022年9月8日
    0
  • 列一些Hbase面试题「建议收藏」

    列一些Hbase面试题「建议收藏」HbaseHbase是怎么写数据的?HDFS和HBase各自使用场景Hbase的存储结构热点现象(数据倾斜)怎么产生的,以及解决方法有哪些HBase的rowkey设计原则…

    2022年5月31日
    22
  • 操作系统概念第六章部分作业题答案

    操作系统概念第六章部分作业题答案题目一:如果将peterson算法中的flag[i]=true与turn=j两条语句交换顺序,会导致求解临界区问题所需三个要求(互斥、有空让进、有限等待)中的哪些要求得不到满足?请举例并分析说明得不到满足的情况解答:假设两个进程i和j:进程i的进入区代码是这样的flag[i]=TRUE;turn=j;while(flag[j]==TRUE&&…

    2022年7月14日
    12
  • http请求有哪些方式_java.lang.reflect.undeclared

    http请求有哪些方式_java.lang.reflect.undeclared移除ASP.NETMVC项目中,HTTP请求的ResponseHeader中的X-AspNetMvc-Version,Server,X-AspNet-Version,X-Powered-ByX-AspNetMvc-VersionServerX-AspNet-VersionX-Powered-By查看原文:移除ASP.NETMVC项目中,HTTP请求的Response…

    2022年9月29日
    0
  • autoconf 英文手册

    autoconf 英文手册1IntroductionAphysicist,anengineer,andacomputerscientistwerediscussingthenatureofGod.“SurelyaPhysicist,”saidthephysicist,“becauseearlyintheCreation,GodmadeLight;and…

    2022年6月4日
    31

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号