Ambari HDP集群搭建全攻略「建议收藏」

Ambari HDP集群搭建全攻略「建议收藏」世界上最快的捷径,就是脚踏实地,本文已收录【架构技术专栏】关注这个喜欢分享的地方。最近因为工作上需要重新用Ambari搭了一套Hadoop集群,就把搭建的过程记录了下来,也希望给有同样需求的小伙伴们

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

世界上最快的捷径,就是脚踏实地,本文已收录【架构技术专栏】关注这个喜欢分享的地方。

最近因为工作上需要重新用Ambari搭了一套Hadoop集群,就把搭建的过程记录了下来,也希望给有同样需求的小伙伴们一个参考,

作者:图头数据

Ambari Ubuntu14.04 最新版本 2.2.1

HDP Ubuntu14.04 最新版本 2.4.3.0

Ambari是什么

Apache Ambari是一种基于Web的工具,支持Apache Hadoop集群的供应、管理和监控。

Ambari已支持大多数Hadoop组件,包括HDFS、MapReduce、Hive、Pig、 Hbase、Zookeeper、Sqoop和Hcatalog等。

Apache Ambari 支持HDFS、MapReduce、Hive、Pig、Hbase、Zookeepr、Sqoop和Hcatalog等的集中管理。也是5个顶级hadoop管理工具之一。(就是一个开源的hadoop一键式安装服务)

我们能用他干什么?我们为什么要用它呢?

我们可以使用ambari快速的搭建和管理hadoop和经常使用的服务组件。

比如hdfs、yarn、hive、hbase、oozie、sqoop、flume、zookeeper、kafka等等。(说白了就是可以偷好多懒)

再说说我们为什么要用它

  • 第一是ambari还算是一个早期的Hadoop管理集群工具
  • 第二主要是现在Hadoop官网也在推荐使用Ambari。
  • 通过一步一步的安装向导简化了集群供应。
  • 预先配置好关键的运维指标(metrics),可以直接查看Hadoop Core(HDFS和MapReduce)及相关项目(如HBase、Hive和HCatalog)是否健康。
  • 支持作业与任务执行的可视化与分析,能够更好地查看依赖和性能。
  • 通过一个完整的RESTful API把监控信息暴露出来,集成了现有的运维工具。
  • 用户界面非常直观,用户可以轻松有效地查看信息并控制集群。

Ambari使用Ganglia收集度量指标,用Nagios支持系统报警,当需要引起管理员的关注时(比如,节点停机或磁盘剩余空间不足等问题),系统将向其发送邮件。

此外,Ambari能够安装安全的(基于Kerberos)Hadoop集群,以此实现了对Hadoop 安全的支持,提供了基于角色的用户认证、授权和审计功能,并为用户管理集成了LDAP和Active Directory。

集群搭建

1、让我们先做一些安装前的准备工作

## 先告诉服务器们他们都是谁,小名都叫啥(修改配置hosts文件)
vim /etc/hosts
10.1.10.1 master
10.1.10.2 slave1
10.1.10.3 slave2

## 然后让我们拿着门禁卡自由的出入他们家 哔咔进站(配置免密登录)
ssh-keygen -t rsa ##在所有的机器上执行
cat ~/.ssh/id_rsa.pub ## 查看公钥
cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys ## 将公钥写入authorized_keys文件中
### 首先把所有的公钥都写入master服务器
### 其次把master的公钥别写入slave1,slave2
### 最后使用scp命令把口令告诉别人 (我不会告诉你我的口令是“老狼老狼几点了”)
scp ~/.ssh/authorized_keys slave1:~/.ssh/authorized_keys
scp ~/.ssh/authorized_keys slave2:~/.ssh/authorized_keys

##更新时区和系统本地化的配置
apt-get install localepurge ## 一顿enter不要管 (卸载那些不被使用的local翻译文档)
dpkg-reconfigure localepurge && locale-gen zh_CN.UTF-8 en_US.UTF-8 ## 一顿enter不要管
apt-get update && apt-get install -y tzdata 
echo "Asia/Shanghai" > /etc/timezone  ## 修改时区为上海
rm /etc/localtime
dpkg-reconfigure -f noninteractive tzdata
vi  /etc/ntp.conf
server 10.1.10.1

2、然后在做一些Ubuntu系统的优化

###1.1 关闭交换分区
swapoff -a
vim /etc/fstab ## 删除注释swap那一行 类似下面
# swap was on /dev/sda2 during installation
#UUID=8aba5009-d557-4a4a-8fd6-8e6e8c687714 none swap  sw   0   0

### 1.2 修改文件描述符打开数 在最后添加 ulimit
vi /etc/profile
ulimit -SHn 512000
vim /etc/security/limits.conf ## 调整大小都增大10倍
* soft nofile 600000
* hard nofile 655350
* soft nproc 600000
* hard nproc 655350
### 1.2 使用命令是修改生效
source /etc/profile

###1.3 修改内核配置
vi /etc/sysctl.conf
### 贴上去就行
fs.file-max = 65535000
net.core.somaxconn = 30000
vm.swappiness = 0
net.core.rmem_max = 16777216
net.core.wmem_max = 16777216
net.ipv4.tcp_rmem = 4096 87380 16777216
net.ipv4.tcp_wmem = 4096 16384 16777216
net.core.netdev_max_backlog = 16384
net.ipv4.tcp_max_syn_backlog = 8192
net.ipv4.tcp_syncookies = 1
net.ipv4.tcp_tw_reuse = 1
net.ipv4.tcp_tw_recycle = 1
net.ipv4.ip_local_port_range = 1024 65000
net.ipv6.conf.all.disable_ipv6=1
net.ipv6.conf.default.disable_ipv6=1
net.ipv6.conf.lo.disable_ipv6=1
### 执行命令让配置生效
sysctl -p

###1.4 配置内核关闭THP功能
echo never > /sys/kernel/mm/transparent_hugepage/enabled
##永久关闭。
vi /etc/rc.local   
if test -f /sys/kernel/mm/transparent_hugepage/enabled; then  
   echo never > /sys/kernel/mm/transparent_hugepage/enabled  
fi  
if test -f /sys/kernel/mm/transparent_hugepage/defrag; then  
   echo never > /sys/kernel/mm/transparent_hugepage/defrag  
fi  

3、安装部署ambari-server (环境:Ubuntu 14.04 + Ambari 2.2.1)

## 更新下载源
wget -O /etc/apt/sources.list.d/ambari.list http://public-repo-1.hortonworks.com/ambari/ubuntu14/2.x/updates/2.2.1.0/ambari.list
apt-key adv --recv-keys --keyserver keyserver.ubuntu.com B9733A7A07513CAD
apt-get update
## 在master节点安装ambari-server 
apt-get install ambari-server -y
## 在所有节点安装 ambari-agent 
apt-get install ambari-agent -y

4、修改ambari-agent配置指向ambari-server

vi /etc/ambari-agent/conf/ambari-agent.ini
## 修改hostname
[server] 
hostname=master
url_port=8440
secured_url_port=8441

## 初始化ambari-server配置ambari 服务 Database, JDK(默认1.7), LDAP 一般选默认  
ambari-server setup  ## 狂点enter

## 启动ambari
ambari-server start
ambari-agent start

5、经过头痛的Shell命令,开始连点人间的东西了。

使用你的浏览器访问 http://10.1.10.1:8080/ 账号密码默认为amdin/admin 点击LAUNCH INSTALL WIZARD让我们愉快的开始吧

Ambari HDP集群搭建全攻略「建议收藏」

6、给集群起一个名字

Ambari HDP集群搭建全攻略「建议收藏」

7、这个里要注意一点确定你的hdp版本不然后面会有麻烦

Ambari HDP集群搭建全攻略「建议收藏」

**8、我在这里面配置的是HDP2.4.3 **

例子: http://public-repo-1.hortonworks.com/HDP/debian7/2.x/updates/2.4.3.0

点击next 会检查数据源是否正常,如果这里报错可以点击 “Skip Repository Base URL validation (Advanced) ” 进行跳过检查

Ambari HDP集群搭建全攻略「建议收藏」

9、填入hostname master slave1 slave2 因为在slave安装ambari-agent 所以直接选择不使用ssh

Ambari HDP集群搭建全攻略「建议收藏」

10、检查服务器状态–这里需要等待一下 如果等待时间过长可以重启ambari-server

Ambari HDP集群搭建全攻略「建议收藏」

11、选择我们需要的服务 HDFS YARN ZK

Ambari HDP集群搭建全攻略「建议收藏」

12、直接使用Ambari默认分配方式 点击下一步开始安装

Ambari HDP集群搭建全攻略「建议收藏」

13、下面就是考虑网速的时候了

Ambari HDP集群搭建全攻略「建议收藏」

14、安装完成之后一路Next刷新主页面就看到了我们的Hadoop集群这里默认都是启动的

Ambari HDP集群搭建全攻略「建议收藏」

15、进入HDFS下 点击restart ALL 可以重启所有组件

Ambari HDP集群搭建全攻略「建议收藏」

16、验证一下是否安装成功 点击NameNodeUI

Ambari HDP集群搭建全攻略「建议收藏」

17、基础信息页

Ambari HDP集群搭建全攻略「建议收藏」

Ambari HDP集群搭建全攻略「建议收藏」

Ambari HDP集群搭建全攻略「建议收藏」

Ambari HDP集群搭建全攻略「建议收藏」

18、Hadoop已经搭建完成完成了不想跑一个任务试试吗?

## 进入服务器执行
### 创建hdfs目录 可以再http://master:50070/explorer.html#/界面
hdfs dfs -mkdir -p /data/input 
### 从服务器上传文件到hdfs上
hdfs dfs -put 文件  /data/input/
### 使用官网提供的例子进行测试
hadoop jar hdfs://tesla-cluster/data/hadoop-mapreduce-examples-2.7.1.2.4.0.0-169.jar wordcount /data/input /data/output1

Ambari HDP集群搭建全攻略「建议收藏」

Ambari HDP集群搭建全攻略「建议收藏」

19、结果如下 生成_SUCCESS 和文件

Ambari HDP集群搭建全攻略「建议收藏」

下面是不正经叙述

终于,通过上面的步骤我们搭建了一套hadoop集群,但随之而来的还有一些问题,NameNode 和ResouceManage 都是单点的模式,ambari支持HA(高可用) 因为篇幅有限,图头后面会单开一张来讲。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/168122.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 深入理解Java注解类型(@Annotation)[通俗易懂]

    深入理解Java注解类型(@Annotation)[通俗易懂]【版权申明】未经博主同意,谢绝转载!(请尊重原创,博主保留追究权)http://blog.csdn.net/javazejian/article/details/71860633出自【zejian的博客】关联文章:深入理解Java类型信息(Class对象)与反射机制深入理解Java枚举类型(enum)深入理解Java注解类型(@Annotation)深入理解

    2022年7月8日
    26
  • 注册机request填什么_注册register

    注册机request填什么_注册register  广播的注册分为动态注册和静态注册,静态注册主要在开机后PackageManagerService利用 AndroidManifest扫描安装的apk获取AndroidManifest内注册的广播所以忽略静态注册。今天主要介绍动态广播的注册。   1. 简单举例 IntentFilterfilter=newIntentFilter();…

    2025年10月29日
    3
  • win11安装node并且配置环境变量

    win11安装node并且配置环境变量npm使用过程中的一些错误解决办法及npm常用命令和技巧-世有因果知因求果-博客园用户名是自己的C:\Users\KenKen\AppData\Roaming\npmNODE_PATHC:\ProgramFiles\nodejs\node_modules

    2022年5月31日
    158
  • pycharm中查看某个函数定义_pycharm无法调用模块函数

    pycharm中查看某个函数定义_pycharm无法调用模块函数参考文章:pycharm查看函数信息

    2022年8月28日
    3
  • 热部署JRebel的使用

    热部署JRebel的使用JRebel是一套JavaEE开发工具。JRebel允许开发团队在有限的时间内完成更多的任务修正更多的问题,发布更高质量的软件产品。JRebel是收费软件,用户可以在JRebel官方站点下载30天的评估版本。Jrebel可快速实现热部署,节省了大量重启时间,提高了个人开发效率。JRebel是一款JAVA虚拟机插件,它使得JAVA程序员能在不进行重部署的情况下,即时看到代码的改变对一个应…

    2022年5月11日
    50
  • 倒立摆:Simulink建模[通俗易懂]

    倒立摆:Simulink建模[通俗易懂]倒立摆:Simulink建模内容在此页面中,我们概述了如何建立倒立摆系统的模型,刹车使用Simulink及其附件进行仿真。然后可以使用非线性仿真来测试模型的线性化版本的有效性。仿真模型还可以用于评估基于线性化模型设计的控制方案的性能。物理设置和系统方程式在此示例中,我们将考虑带有手推车的倒立摆系统的二维版本,其中放置被约束为在下图所示的垂直平面中移动。对于该系统,控制输入是使推车水平移动的力,输出是摆的角位置和推车的水平位置。对于此示例…

    2022年8月18日
    23

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号