hadoop系列-hadoop版本选择

hadoop系列-hadoop版本选择众多版本应该如何选择综上所述 ApacheHadoop 原生版本以及 ClouderaCDH 版本无论在开源或者社区活跃度 学习资料等方面都位列前茅 如果是用来研究学习建议选择这两个版本 基于目前两者更新的版本已经较多的情况 建议直接选择 Hadoop2 0 之后的版本或者 CDH4 之后的版本进行学习 如果是用于生产环境部署 则可根据情况选择稳定的版本 或者选择 Hortonworks 可以使用 ambari 等管理工具较为方便地进行部署

引言

Hadoop自从出现到现在被广泛应用,经理了很多个版本的衍化,甚至各个公司都在原生apache hadoop的基础上进行了一些改造以及特性优化,有些是完善了一整套的集群部署工具,在这衍化的过程中出现了Apache hadoop官方版本,还有很多第三方版本,例如Cloudera,Hortonworks,IBM,华为等提供的版本。那么这么多的版本,我们在进行学习开发或者生产环境部署的时候应该如何选择呢?

一、Apache Hadoop

二、CDH(Cloudera Distribution Hadoop)

  • CDH3:http://archive.cloudera.com/cdh/3/
  • CDH4: http://archive.cloudera.com/cdh4/cdh/4/
  • CDH5:http://archive.cloudera.com/cdh5/cdh/5/
  • CDH6:https://archive.cloudera.com/cdh6/

Hortonworks

IBM

IBM不提供只针对Hadoop的发行版,而是在原生hadoop的基础上进行了增强,例如增强了安全认证、作业调度等,采用Pig,Hive,HBase等技术开发了IBM的InfoSphere BigInsights大数据平台,一般面向IBM企业用户。

华为

华为在国内大数据领域也是走在前列的,其在Apache Hadoop的基础上利用本身的硬件能力进行了一些增强,例如故障自动Failover,增强HA功能等,其发布的版本为FusionInsight Hadoop。

总结

众多版本应该如何选择综上所述,Apache Hadoop原生版本以及Cloudera CDH版本无论在开源或者社区活跃度,学习资料等方面都位列前茅,如果是用来研究学习建议选择这两个版本,基于目前两者更新的版本已经较多的情况,建议直接选择Hadoop2.0之后的版本或者CDH4之后的版本进行学习。如果是用于生产环境部署,则可根据情况选择稳定的版本,或者选择Hortonworks可以使用ambari等管理工具较为方便地进行部署。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/214848.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月18日 下午3:18
下一篇 2026年3月18日 下午3:18


相关推荐

  • 栈溢出攻击

    栈溢出攻击什么是栈溢出攻击向缓冲器填入过多的数据 超出边界 导致数据外溢 同时利用缓冲器溢出改写数据 改变程序执行流程 执行 shellcode 之所以会有缓冲区溢出的可能 主要是因为栈空间内保存了函数的返回地址 该地址保存了函数调用结束后后续执行的指令的位置 对于计算机安全来说 该信息是很敏感的 如果有人恶意修改了这个返回地址 并使该返回地址指向了一个新的代码位置 程序便能从其它位置继续执行

    2026年3月18日
    2
  • 字节面试:如何用Redis实现一个分布式锁?

    字节面试:如何用Redis实现一个分布式锁?我当场手写了一个 面试官说我大学没白读

    2026年3月16日
    3
  • 几种常见的内存溢出与解决办法

    几种常见的内存溢出与解决办法解決辦法:

    2022年7月1日
    23
  • clion 2021.3激活码破解方法

    clion 2021.3激活码破解方法,https://javaforall.net/100143.html。详细ieda激活码不妨到全栈程序员必看教程网一起来了解一下吧!

    2022年3月15日
    290
  • Python连接MySQL数据库方法介绍(超详细!手把手项目案例操作)

    Python连接MySQL数据库方法介绍(超详细!手把手项目案例操作)作者 CDA 数据分析师来源 CDA 数据分析研究院本文涉及到的开发环境 操作系统 Windows10 数据库 MySQL8 0Python3 7 2pip19 0 3 两种方法进行数据库的连接分别是 PyMySQL 和 mysql connector 步骤 连接数据库生成游标对象执行 SQL 语句关闭游标关闭连接 PyMySQLPyMyS 是封装了 M

    2026年3月19日
    1
  • lea 指令_lea指令的功能

    lea 指令_lea指令的功能leaw#2个字节leal#4个字节leaq#8个字节leabase_address(offset_address,index,size),%rax根据括号里的源操作数来计算地址,然后把地址加载到目标寄存器中。计算地址base_address+offset_address+index*size,然后把最终地址载到寄存器rax中。lea不引用源操作数里的寄存器,只是单…

    2025年6月30日
    4

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号