Hadoop 简介

Hadoop 简介Hadoop是什么Hadoop是一个提供分布式存储和计算的开源软件框架,它具有无共享、高可用(HA)、弹性可扩展的特点,非常适合处理海量数量。Hadoop是一个开源软件框架Hadoop适

大家好,又见面了,我是你们的朋友全栈君。

Hadoop 是什么

<span role="heading" aria-level="2">Hadoop 简介

Hadoop 是一个提供分布式存储和计算的开源软件框架,它具有无共享、高可用(HA)、弹性可扩展的特点,非常适合处理海量数量。

  • Hadoop 是一个开源软件框架
  • Hadoop 适合处理大规模数据
  • Hadoop 被部署在一个可扩展的集群服务器上

Hadoop 三大核心组件

  • HDFS(分布式文件系统) -—— 实现将文件分布式存储在集群服务器上
  • MAPREDUCE(分布式运算编程框架) —— 实现在集群服务器上分布式并行运算
  • YARN(分布式资源调度系统) —— 帮用户调度大量的 MapReduce 程序,并合理分配运算资源(CPU和内存)

Hadoop 优点

  • 高可靠性

    Hadoop 维护存储多个数据副本,增加数据冗余,避免数据丢失

  • 高扩展性

    Hadoop 集群可以方便地扩展更多的集群节点

  • 高效性

    Hadoop 能够在集群节点之间动态地移动数据,并保证各个节点数据的动态平衡,以并行的方式工作,处理速度非常快

  • 高容错性

    Hadoop 维护存储多个数据副本,并且能够自动将失败的任务重新分配

  • 低成本

    Hadoop 是开源框架,项目的软件成本会大大降低。 Hadoop 使用 Java 语言编写,可以跨平台运行

Hadoop 生态圈

Hadoop 生态圈是指围绕 Hadoop 软件框架为核心而出现的越来越多的相关软件框架,这些软件框架和 Hadoop 框架一起构成了一个生机勃勃的 Hadoop 生态圈。在特定场景下,Hadoop 有时也指代 Hadoop 生态圈。

Hadoop 生态圈的架构图

<span role="heading" aria-level="2">Hadoop 简介

  • Hadoop Common:Hadoop 体系最底层的一个模块,是其他模块的基础设施
  • HDFS:Hadoop 分布式文件系统,是 Hadoop 的基石
  • YARN:另一种资源协调器,是统一资源管理和调度平台
  • MapReduce:是一种编程模型,非常适合进行分布式计算
  • Spark:新一代计算框架,和 MapReduce 相比性能大幅度提升
  • HBase:是一个分布式的、面向列族的数据库(底层依赖 HDFS)
  • Hive:是一个基于 Hadoop 的数据仓库工具(SQL 语句)
  • Pig:与Hive 类似,也是对大型数据集进行分析和评估的工具
  • Impala:与 Hive 类似,可以对存储在 HDFS、HBase的海量数据提交交互式 SQL 查询的工具
  • Mahout:是一个机器学习和数据挖掘库,可以实现经典的机器学习算法
  • Flume:是一个高可用、高可靠、分布式的海量日志采集框架
  • Sqoop:是一个关系型数据库与 Hadoop 之间进行数据相互转换的工具
  • Kafka:是一种高吞吐量的分布式发布/订阅消息系统

大数据处理平台及核心技术

<span role="heading" aria-level="2">Hadoop 简介

Hadoop 与云计算

什么是云计算

云计算是一种可以通过网络方便地接入共享资源池、按需获取计算资源(如网络、服务器、存储、应用、服务等)的服务模型。

之所以称之为”云“,是因为云计算在某些地方和现实中的云非常符合,云的规模可以动态伸缩,边界模糊,飘忽不定,无法确定具体位置,但它确实存在于某处。

云计算的特点
  • 按需提供服务(如租用云服务器,用户可以按需申请配置,如CPU 核数、内存大小等)
  • 宽带网络访问(用户可以利用各种终端设备随时随地通过互联网访问云计算服务)
  • 资源池化(资源以共享资源池的方式统一管理,利用虚拟化技术将资源分享给不同用户)
  • 高可伸缩性(服务的规模可快速伸缩,如云盘扩容)
  • 可量化的服务(可以通过监控软件监控用户的使用情况,根据资源的使用情况对服务计费,如云盘的流量)
  • 大规模(如 google 云计算中心具有 100 多万台服务器)
云计算的类型

云计算按照服务类型大致分为3类

  • 基础设施即服务(IaaS):提供用户硬件设备(云服务器)

  • 平台即服务(PaaS):提供用户应用程序的应用环境(不需要维护服务器,只需上传应用程序即可)

  • 软件即服务(SaaS):提供用户应用程序(云盘、云笔记)

<span role="heading" aria-level="2">Hadoop 简介

国内云计算技术走在前列的有华为公司、阿里巴巴集团、百度等,主要以互联网企业巨头和系统集成提供商为主

Hadoop 仅是云计算技术的一种实现,但云计算的概念则更为广阔,并不局限于某种技术。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/155441.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 单片机声源定位_基于stm32交通灯源代码

    单片机声源定位_基于stm32交通灯源代码stm32声源定位本科毕业设计(论文)基于STM32单片机声源方向识别器设计与实现摘要近年来,基于麦克风阵列的声源定位系统被广泛地应用于电话会议、视频会议、语音增强、助听器等系统中,因此受到了越来越多的关注,已经成为一大研究热点。在各种声源定位方法中,基于到达时延估计的双步定位法原理简单,运算量小,精度相对较高,有利于实时实现,因此它的应用也最为广泛,本文着重研究了该方法。本文首先给出了麦克风阵列…

    2022年9月22日
    6
  • ios屏幕旋转设置_旋转平移和缩放

    ios屏幕旋转设置_旋转平移和缩放目录(?)[-]一如何设置AnchorPoint二如何获得AnchorPoint经常会遇到需求,要求手势的缩放或者旋转操作,要求动作变化围绕某一个特定点,或者是两指的中心点,或者是某一个点。这个问题首先要清晰的知道,iOS各个view的层次关系。特别是,要清楚的知道,当前view的frame与superView的bounds是一个坐标

    2022年10月8日
    3
  • Windows 环境下载 Android 源码「建议收藏」

    Windows 环境下载 Android 源码「建议收藏」Windows环境下载Android源码前言Android官网(该方式不适合Windows平台):https://source.android.com/source/downloading.html可是我就想在Windows中使用SourceInsight看看源代码,当然可以!准备环境安装git安装Python自备梯子硬盘剩余容量最好大…

    2022年7月15日
    17
  • pytorch visdom安装启动问题

    pytorch visdom安装启动问题visdom经过pip安装之后,启动时一直提醒:Checkingforscripts.Downloadingscripts,thismaytakealittlewhile然后即使挂了vpn也下载不下来。。。。网上搜了一堆教程,比较杂乱,记录以下自己简单粗暴的解决方案:C:\Users\zj1996\Anaconda3\envs\pytorch\Lib\site-p…

    2022年6月29日
    46
  • 能源预测:回顾与展望(IEEE论文)

    能源预测:回顾与展望(IEEE论文)EnergyForecasting:AReviewandOutlook—阅读笔记。

    2022年5月3日
    66
  • 微机原理与接口技术课件_微型计算机原理与接口技术课后答案

    微机原理与接口技术课件_微型计算机原理与接口技术课后答案原标题:微机原理与接口技术课程教与学(教学大纲)《微机原理与接口技术》教学大纲文/牟琦英文名称:MicrocomputerPrincipleandInterfaceTechnology适用专业:计算机类专业、自动化类专业、电子信息类专业教材:牟琦.微机原理与接口技术(第3版).[M].北京:清华大学出版社,2018一、课程的性质“微机原理与接口技术”是计算机类、电子信息类、自动化类等相关专业…

    2022年10月2日
    2

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号