大数据管理平台(一)概述「建议收藏」

大数据管理平台(一)概述「建议收藏」系列文章目录文章目录系列文章目录前言一、功能概述二、使用步骤2.1安装2.2监控2.3管理2.4用户管理2.5应用市场2.6操作系统三、总结前言做大数据有几年了,这些年耳濡目染了一些大数据管理平台的使用,但是或多或少使用起来,都不怎么方便,所以决定自己来实现一个简单的大数据平台一、功能概述大数据应用组件往往很多,可能几百台服务器组成一个Hadoop集群,当部署这些节点时,需要一个节点一个节点的操作,简直不敢想象。同时在这些服务器上可能还部署着Spark、Flink、Hive

大家好,又见面了,我是你们的朋友全栈君。

系列文章目录



前言

大数据有几年了,这些年耳濡目染了一些大数据管理平台的使用,但是或多或少使用起来,都不怎么方便,所以决定自己来实现一个简单的大数据平台


一、功能概述

大数据应用组件往往很多,可能几百台服务器组成一个Hadoop集群,当部署这些节点时,需要一个节点一个节点的操作,简直不敢想象。同时在这些服务器上可能还部署着Spark、Flink、Hive、Hbase、ES等很多很多的组件,有时一个节点出问题,如果不即使发现处理/可能会引起一系列问题,而如果想关闭一些节点,或迁移某些节点,则需要运维人员手动去操作,当需要操作的节点很多的时候,就很耗费人力资源。为解决此类问题,大数据管理平台就出现了。

一个比较完善的大数据平台,应该包含有如下功能:

具体包括:

  • 能一键安装大数据产品
  • 能管理/监控多台服务器
  • 能监控到各个大数据产品的运行状况
  • 能在主页面上管理各个产品,并对其操作
  • 有个shell,可以远程操作服务器
  • 能安全管理各个用户/用户组/权限/角色等

前4个是基本的功能,第五个待后续更新

二、使用步骤

2.1 安装

已目前业内比较通用的大数据产品,包括zk,hdfs,yarn,hive,hbase,es等,各个产品的部署方式不同,需要的配置文件操作步骤都不相同,所以必须抽象出一个通用的组件来达到可以满足任何新组件的要求。

  • 环境的配置
    linux环境必须统一,因此在部署前必须做环境检查
    • 首先是系统版本
      第一阶段,我们要求系统版本为CentOS7.x
    • CPU/内存
      要求X86架构和最低8G的内存
    • 硬盘
      不做硬性要求,但至少要有足够大的根分区
    • 网卡
      百兆网卡及以上
    • 分区
      不做硬要求
    • 密码
      每个服务器最好都统一
    • 数量
      为组成集群,要求服务器数量至少三台
  • 架构
    我们以master/slave方式部署,为高可用,我们使得每个服务器,既是master,又是slave,即使又宕机,也可以迅速切换。

2.2 监控

  • 我们需要实时的监控各个组件的运行状况,分别用绿/黄/红代表组件的可用度
  • 当组件出现问题时能及时的发出通知
  • 实时展示组件运行中出现的异常日志,并提供搜索功能

2.3 管理

大数据平台,应当可以对组件进行如下操作:

  • 组件整体关闭
  • 组件整体启动
  • 组件某个角色的关闭/启动
  • 组件某个角色更换节点
  • 组件的删除
  • 组件的升级
  • 组件配置文件/参数的修改

2.4 用户管理

应当提供基础的用户登录/权限控制

2.5 应用市场

需提供组件安装包的上传/版本控制/hotfix修复/镜像包构建

2.6 操作系统

如果使用传统的安装方式,不方便应用的隔离,所以我们采用kubernetes + docker的方式,构建一个简单的操作系统,组件的安装/迁移等,都通过k8s的接口来实现

三、总结

本篇文章主要介绍了大数据平台的基本作用和一个必要的功能,通过此概述,我们大概可以了解到一个比较完善的大数据平台,会在工作、学习中大大提高效率

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/132787.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 如何解决虚拟机连不上网「建议收藏」

    如何解决虚拟机连不上网「建议收藏」通常情况下,电脑关机或重启后需要重新连网,但是,虚拟机下的乌班图通常需要重新连网,很多时候找不到之前连接的网络,如果是宽带连接,首先查看虚拟机的设置,将网络适配器改成Net模式(必要时需要重置,然后重启虚拟机),如果还没有出现要连接的以太网,那么就要查看一下主机的服务中的虚拟机是否已经全部开启,如果没有开启,就要将所有和虚拟机有关的服务启动。…

    2022年6月26日
    32
  • 李林峰 netty_逆向工程权威指南

    李林峰 netty_逆向工程权威指南第1章Java的I/O演进之路第2章NIO入门2.3NIO编程第4章TCP粘包/拆包问题的解决之道4.1TCP粘包/拆包4.1.1TCP粘包/拆包问题说明4.1.2TCP粘包/拆包发生的原因 应用程序write写入的字节大小大于套接口发送缓冲区的大小 进行MSS大小的TCP分段 以太网的帧playload大小MTU进行IP分片…

    2022年9月27日
    5
  • C语言中函数的基本知识

    C语言中函数的基本知识接着上次的数组,这次我们来简单的讲讲C语言里面的函数。函数和指针这两大块,在C语言中占据着重要的位置,是C语言中的主体和核心,所以它们的重要性也就不言而喻了。那什么是函数呢?1:函数是C语言的模块,一块块的,有较强的独立性,可以相互调用,也就是说,你可以在函数A中调用函数B,又可在函数B中调用函数C,不仅如此,你还可以调用函数自身(递归)。2:函数是完成一个个特定任务的语句集合,它能完…

    2022年6月26日
    29
  • 2021年社工必备查询网址汇总[通俗易懂]

    2021年社工必备查询网址汇总[通俗易懂]社工查询网站手机号注册网站查询信用查询国内企业信息政府信息查询身份信息查询驾驶员及车辆信息查询物品资产查询物流查询发票查询金融查询手机信息查询个人信息查询搜索引擎手机号注册网站查询牛查查http://www.newx007.com比REG007更好用的查询手机注册网站的神器信用查询1、信用中国查询内容:工商注册企业和个人、行政许可和处罚网址:http://www.creditchina.gov.cn/2、全国企业信用信息公示查询内容:全国企业工商登记注册信息http://g

    2022年6月1日
    96
  • phpstorm2021.10永久激活码【2021最新】

    (phpstorm2021.10永久激活码)JetBrains旗下有多款编译器工具(如:IntelliJ、WebStorm、PyCharm等)在各编程领域几乎都占据了垄断地位。建立在开源IntelliJ平台之上,过去15年以来,JetBrains一直在不断发展和完善这个平台。这个平台可以针对您的开发工作流进行微调并且能够提供…

    2022年3月27日
    108
  • Python做一个简单的在线编辑器[通俗易懂]

    Python做一个简单的在线编辑器[通俗易懂]Python做一个简单的在线编辑器

    2022年8月14日
    2

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号