Hadoop生态系统组件最全介绍

Hadoop生态系统组件最全介绍开源改变世界,拥抱开源,拥抱未来Hadoop生态系统组件介绍,掌握吹x大法,走到哪里都不怕图片来自bing,跟视觉中国没关系,嗯,很严肃的声明 功能模块 产品名称 产品简述 关键技术 HDFS 分布式文件系统 MapReduce 数据处理编程:map(数据拆分),shuffle(数据排序分发),reduce(数据合并) YAR…

大家好,又见面了,我是你们的朋友全栈君。

开源改变世界,拥抱开源,拥抱未来

Hadoop生态系统组件介绍,掌握吹x大法,走到哪里都不怕

 

æ¥çæºå¾å
图片来自bing,跟视觉中国没关系,嗯,很严肃的声明

 

 
功能模块 产品名称 产品简述
关键技术 HDFS 分布式文件系统
MapReduce 数据处理编程:map(数据拆分),shuffle(数据排序分发),reduce(数据合并)
YARN 资源管理系统
Spark 基于内存计算,完全不同与MapReduce的编程方式,常用SQL形式实现

数据库及

数据管理

Cassandra 键值存储Nosql数据库
Hbase 键值存储Nosql数据库,通常不直接用mapreduce来写而是通过pig等找接口调用
Memcached 完全基于内存的数据库
MongoDB 文档型数据库
Hive 不是每个人都会写MR,所以需要写SQL来转换调用MR,即HiveSQL
Spark SQL 用类Hive的语言来写Spark
Graph 图表数据库
序列化 Avro 数据序列化,并且有上传分享链接
JSON 一种数据结构,描述数据和传输数据
管理与监控 Zookeeper 分布式协调系统
Chef     节点管理
Puppet 节点管理
Nagios 基础设施监控
Ambari 配置,监控和管理hadoop的平台
HCatalog 数据抽象层
Oozie 工作流调度管理
Ganglia 监控系统
分析辅助 MR接口 早期调整的方案,现在几乎不用
分析库 自行搭建的分析平台,如算法
Pig MR是汇编,Pig就是Python,让代码更加简便,类SQL语言。与HIve的区别是Hive适合静态数仓,Pig更加轻量适合开发者和应用调用
Hadoop Streaming 使用Java外的语言来编写MR
Mahout 机器学习和数据分析
MLLib Spark的专属机器学习工具
HIPI 图像处理接口
数据传输 Sqoop 在HDFS与RDBMS之间传递数据
Flume 数据收集,尤其是日志数据
DistCp Hadoop集群之间移动数据
Storm 流数据摄取

云计算与

虚拟化

Serengeti Hadoop虚拟化,即部署在公有云,好处是加快配置集群的速度,无需再购买配置硬件;快速增加或减少集群大小来应对实际业务需求;可提高容错性,从错误中快速恢复。缺点是MR和YARN在虚拟化环境中无法完全控制计算机资源;数据布局很关键,三副本,一致性等等都需要考虑
Docker 运行应用程序的容器,也包括Hadoop节点
Whirr 集群快速配置

安全访问与

控制

Sentry 基础身份验证服务和权限控制
Kerberos 安全认证
Knox 安全网关

 

Hadoop生态系统组件最全介绍
图片来自本人,跟视觉中国没关系,嗯,很严肃的声明

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/144581.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 安防监控必备的基础知识「建议收藏」

    安防监控必备的基础知识「建议收藏」安防监控必备的基础知识 什么是云镜控制解码器?答:解码器是将前端发出的控制信号转换为电压信号从而控制云台、镜头的的装置。什么是同轴电缆?答:同轴电缆(COARIALCABLE)的得名与它的结构相关。同轴电缆也是监控中最常见的传输介质之一。它用来传递信息的一对导体是按照一层圆筒式的外导体套在内导体(一根细芯)外面,两个导体间用绝缘材料互相隔离的结构制选的,外层导体和中心轴芯线的…

    2022年4月19日
    48
  • java运行环境_如何搭建Java运行环境?

    java运行环境_如何搭建Java运行环境?前言对于运行一个Java程序,我们首先需要有一个运行Java程序的平台程序,这个平台程序就是Java虚拟机。本篇文章将介绍如何在Windows系统上搭建一个Java程序的运行环境,主要分为两个步骤:安装JDK,配置环境变量。Windows系统Java运行环境配置下载JDK并安装首先我们需要下载java开发工具包JDK,JDK中包含了JRE(Java运行环境)和一些官方提供给我们的工具,在oracl…

    2022年7月7日
    21
  • python怎么换行输出的数字对齐_python中如何使输出换行「建议收藏」

    Python的print()函数输出时,通常输出结果是整行显示出来的,这时候我们需要考虑一下,我们输出的结果需不需要换行?不需要换行的方法也是嗯容易的的,这里就不多赘述了,来说说如何做到输出换行:常用的转义符方式:\n#-*-coding:utf-8-*-A=”来看看能不能\n换行。”print(A)输出结果来看看能不能换行。使用三引号进行换行:”””value1;value2;value3…

    2022年4月9日
    116
  • RxJava(三) flatMap 操作符用法详解

    RxJava(三) flatMap 操作符用法详解RxJava系列文章目录导读:一、RxJavacreate操作符的用法和源码分析二、RxJavamap操作符用法详解三、RxJavaflatMap操作符用法详解四、RxJavaconcatMap操作符用法详解五、RxJavaonErrorResumeNext操作符实现app与服务器间token机制六、RxJavaretryWhen操作符…

    2022年6月4日
    101
  • phpstorm 2021.4.14激活码_通用破解码

    phpstorm 2021.4.14激活码_通用破解码,https://javaforall.net/100143.html。详细ieda激活码不妨到全栈程序员必看教程网一起来了解一下吧!

    2022年3月17日
    45
  • OleDbCommand更新数据的一些问题

    OleDbCommand更新数据的一些问题using(OleDbConnectionconnection1=newOleDbConnection(connectionString)){OleDbCommandcommand1=newOleDbCommand();command1.Connection=connection1;

    2022年5月12日
    40

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号