大数据平台建设路径

大数据平台建设路径数字化转型这几年成为了集团公司或大型企业寻求业务突破的重要手段,而且各行各业都不乏成功案例,例如金融行业的建设银行、招商银行、平安保险等,还有一些生动的例子,例如百丽鞋业。而国外的经典案例就是亚马逊和特斯拉。集团客户动静都很大,首先要做咨询规划,必须跟上投入和管理配套,然后可以开始平台建设,最终开始应用,赋能各业务线和产品线。从技术的角度,一个完整的大数据平台通常会三期建设。先看下图:蓝色部分是第一期内容,绿色部分是第二期内容,橙色部分是第三期内容。第一步,先建设大数据基础平台。首要满足的是数据汇聚

大家好,又见面了,我是你们的朋友全栈君。

数字化转型这几年成为了集团公司或大型企业寻求业务突破的重要手段,而且各行各业都不乏成功案例,例如金融行业的建设银行、招商银行、平安保险等,还有一些生动的例子,例如百丽鞋业。而国外的经典案例就是亚马逊和特斯拉。

集团客户动静都很大,首先要做咨询规划,必须跟上投入和管理配套,然后可以开始平台建设,最终开始应用,赋能各业务线和产品线。

从技术的角度,一个完整的大数据平台通常会三期建设。先看下图:蓝色部分是第一期内容,绿色部分是第二期内容,橙色部分是第三期内容。
在这里插入图片描述

第一步,先建设大数据基础平台。首要满足的是数据汇聚、数据存储、数据计算三大块功能,也是最内核的功能。主要内容有数据仓库组建、数据抽取(ETL)、作业调度、数据服务、以及应对大规模节点和集群的监控运维管理功能等。当然还应包含用户、权限、数量统计等基础功能。根据目标数据量和SQL复杂度(例如多表JOIN)来规划采购内容,功能全、系统稳定、性能高、价格合理是技术产品选型的核心考量。这两年和长远看还要考虑国产化和信创。

第二步,基于大数据基础平台建设数据治理等功能。目标是把汇聚进来的海量数据,往往又是异构的数据经过预处理,再进一步进行数据治理和数据管理(二者区别参看CMMI的DMM)。主要内容有元数据管理、数据资产管理、数据质量管理、数据标准管理,以及数据全生命周期管理和必不可少的数据安全等。这里值得探讨的是,做平台的公司往往具备很强的抽象归纳能力,做的是下层的通用能力部分;但这部分内容往往还需要结合行业应用,有些行业侧的供应商也具备上层的行业侧定制化能力,并已经或初步形成了自己的产品。但若论通用能力设计和保障,特别是到十亿条(TB级别)以上数据量的分布式计算(JOIN等),还是需要硬核产品,这就自然而然来到了双方合作的契合点。

第三步,扩建大数据平台创新应用。主要内容是人工智能(包含机器学习和深度学习)、知识谱图(图数据库)、流计算和消息队列等。当然人工智能和图数据库本身也是硬核技术,也可以是平台,这要看所在公司的产品定位和赛道。而从数据智能这个角度看,数据仓库是底座,人工智能和知识图谱都算是一个应用,基于数据仓库优秀的算力,来挖掘数据间隐藏的数据关系,例如金融里的不带标签的反洗钱场景,公安行业的犯罪团伙多层关系网络挖掘。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/131672.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 计算机病毒相关参考文献,计算机病毒参考文献[通俗易懂]

    计算机病毒相关参考文献,计算机病毒参考文献[通俗易懂]此栏目涵盖与参考文献和计算机和病毒相关的例文,免费为你研究计算机病毒文献综述提供有关参考资料。关键词:网络参考文献;选择;引用;规范化摘要:随着网络环境及网络信息资源的不断建设和发展,学术研究中以网络文献作为引文已成为一种势不可挡的发展。摘要:当今社会,随着互联网技术的高速发展,人们的物质文化生活也随之取得了较大的丰富。然而,在面对互联网高速发展今天,整个互联网也面临着各种病毒的。摘要:如今科学技…

    2022年5月3日
    44
  • Git创建远程分支并提交代码到远程分支

    Git创建远程分支并提交代码到远程分支1、可以通过gitbranch-r命令查看远端库的分支情况如图所示,远程仓库只有一个master分支2、从已有的分支创建新的分支(如从master分支),创建一个dev分支但此时并没有在远程仓库上创建分支如图所示还是只有一个master分支3、建立本地到远端仓库的链接–这样代码才能提交上去使用命令行gitpush–set-…

    2022年6月30日
    39
  • cad注释比例和打印比例不一样_CAD中的打印比例,绘图比例和注释全局比例详解…

    cad注释比例和打印比例不一样_CAD中的打印比例,绘图比例和注释全局比例详解…如上图同一条线段,在不同的标准格式如下(线宽设置相同,字高度都是3.5):第一个尺寸是测量因子为1,标注全局因子为2;第二个尺寸测量因子为2,标注全局因子为2;第三个尺寸测量因子为1,标注全局因子为1可见:1、测量因子影响的是标准尺寸的大小,2、标注全局因子影响的是字体和箭头的大小,3、他们的变化对线宽是没有影响的。关于他们对字体的大小的影响:打印比例和标注全局因子对打印出来的蓝图的字体会有影响。…

    2022年5月14日
    120
  • tikv 安装_tia v16安装步骤

    tikv 安装_tia v16安装步骤exportHostIP=”127.0.0.1″dockerrun-d-p2379:2379-p2380:2380–namepdpingcap/pd\–name=”pd”\–data-dir=”pd”\–client-urls=”http://0.0.0.0:2379″\-…

    2022年9月23日
    6
  • Spring使用JPA进行Dao层的数据访问以及事务管理

    Spring使用JPA进行Dao层的数据访问以及事务管理

    2021年9月26日
    60
  • a标签,下划线的操作

    a标签,下划线的操作a标签当如下时,不显示下划线<a>没链接的a标签</a>这种情况如何添加下划线呢值 描述none 默认。定义标准的文本。underline 定义文本下的一条线。overline 定义文本上的一条线。line-through 定义穿过文本下的一条线。blink 定义闪烁的文本。inherit 规定应该从父元素继承text-decoration属性的值。text-decoration:underline;a标签如下,会正常显示<ahref=”ht

    2022年5月12日
    79

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号