Hadoop-2.2.0中国文献——MapReduce 下一代 —配置单节点集群

Hadoop-2.2.0中国文献——MapReduce 下一代 —配置单节点集群

大家好,又见面了,我是全栈君,今天给大家准备了Idea注册码。

Mapreduce 包

你需从公布页面获得MapReduce tar包。若不能。你要将源代码打成tar包。

      
$ mvn clean install -DskipTests$ cd hadoop-mapreduce-project$ mvn clean install assembly:assembly -Pnative

注意:你须要安装有protoc 2.5.0。

忽略本地建立mapreduce。你能够在maven中省略-Pnative參数。

tar包应该在target/directory。

配置环境

如果你已经安装hadoop-common/hadoop-hdfs,而且输出了$HADOOP_COMMON_HOME/$HADOOP_HDFS_HOME,解压hadoop mapreduce 包,配置环境变量$HADOOP_MAPRED_HOME到要安装的文件夹。$HADOOP_YARN_HOME的配置和 $HADOOP_MAPRED_HOME一样.

注意:以下的操作如果你已经执行了hdfs。

设置配置信息

要启动ResourceManager and NodeManager, 你必须升级配置。如果你的 $HADOOP_CONF_DIR是配置文件夹。而且已经安装了HDFS和core-site.xml。还有2个配置文件你必须设置 mapred-site.xml 和yarn-site.xml.

设置 mapred-site.xml

加入以下的配置到你的mapred-site.xml.

<property>
    <name>mapreduce.cluster.temp.dir</name>
    <value></value>
    <description>No description</description>
    <final>true</final>
  </property>

  <property>
    <name>mapreduce.cluster.local.dir</name>
    <value></value>
    <description>No description</description>
    <final>true</final>
  </property>

设置 yarn-site.xml

加入以下的配置到你的yarn-site.xml.

<property>
    <name>yarn.resourcemanager.resource-tracker.address</name>
    <value>host:port</value>
    <description>host is the hostname of the resource manager and 
    port is the port on which the NodeManagers contact the Resource Manager.
    </description>
  </property>

  <property>
    <name>yarn.resourcemanager.scheduler.address</name>
    <value>host:port</value>
    <description>host is the hostname of the resourcemanager and port is the port
    on which the Applications in the cluster talk to the Resource Manager.
    </description>
  </property>

  <property>
    <name>yarn.resourcemanager.scheduler.class</name>
    <value>org.apache.hadoop.yarn.server.resourcemanager.scheduler.capacity.CapacityScheduler</value>
    <description>In case you do not want to use the default scheduler</description>
  </property>

  <property>
    <name>yarn.resourcemanager.address</name>
    <value>host:port</value>
    <description>the host is the hostname of the ResourceManager and the port is the port on
    which the clients can talk to the Resource Manager. </description>
  </property>

  <property>
    <name>yarn.nodemanager.local-dirs</name>
    <value></value>
    <description>the local directories used by the nodemanager</description>
  </property>

  <property>
    <name>yarn.nodemanager.address</name>
    <value>0.0.0.0:port</value>
    <description>the nodemanagers bind to this port</description>
  </property>  

  <property>
    <name>yarn.nodemanager.resource.memory-mb</name>
    <value>10240</value>
    <description>the amount of memory on the NodeManager in GB</description>
  </property>
 
  <property>
    <name>yarn.nodemanager.remote-app-log-dir</name>
    <value>/app-logs</value>
    <description>directory on hdfs where the application logs are moved to </description>
  </property>

   <property>
    <name>yarn.nodemanager.log-dirs</name>
    <value></value>
    <description>the directories used by Nodemanagers as log directories</description>
  </property>

  <property>
    <name>yarn.nodemanager.aux-services</name>
    <value>mapreduce_shuffle</value>
    <description>shuffle service that needs to be set for Map Reduce to run </description>
  </property>


设置 capacity-scheduler.xml

确保你放置根队列到capacity-scheduler.xml.

 <property>
    <name>yarn.scheduler.capacity.root.queues</name>
    <value>unfunded,default</value>
  </property>
  
  <property>
    <name>yarn.scheduler.capacity.root.capacity</name>
    <value>100</value>
  </property>
  
  <property>
    <name>yarn.scheduler.capacity.root.unfunded.capacity</name>
    <value>50</value>
  </property>
  
  <property>
    <name>yarn.scheduler.capacity.root.default.capacity</name>
    <value>50</value>
  </property>

执行守护进程

如果环境变量 $HADOOP_COMMON_HOME$HADOOP_HDFS_HOME$HADOO_MAPRED_HOME$HADOOP_YARN_HOME,$JAVA_HOME 和 $HADOOP_CONF_DIR 已经设置正确。$$YARN_CONF_DIR 的设置同 $HADOOP_CONF_DIR。

执行ResourceManager 和 NodeManager 例如以下:

$ cd $HADOOP_MAPRED_HOME
$ sbin/yarn-daemon.sh start resourcemanager
$ sbin/yarn-daemon.sh start nodemanager

你应该启动和执行。你能够执行randomwriter例如以下:

$ $HADOOP_COMMON_HOME/bin/hadoop jar hadoop-examples.jar randomwriter out

祝你好运。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/116713.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • pycharm选择解释器_python高级编程

    pycharm选择解释器_python高级编程一、IDE配置解释器二、配置pip镜像按照【配置永久生效】全局配置文件Window系统下,文件夹路径中输入%APPDATA%,若没有pip目录创建,并在里面创建文件pip.ini,内容如下[global]timeout=6000index-url=https://pypi.mirrors.ustc.edu.cn/simple/tr…

    2022年8月27日
    6
  • ALV中动态内表+行转化为列–老白

    ALV中动态内表+行转化为列–老白

    2021年8月13日
    51
  • java编写一个学生类和教师类_JAVA:1、编写一个学生类,类名为Student,包含如下成员:…

    java编写一个学生类和教师类_JAVA:1、编写一个学生类,类名为Student,包含如下成员:…1、编写一个学生类,类名为Student,包含如下成员:成员变量:1)变量名:name;类型:String;访问权限:private2)变量名:ID;类型:String;访问权限:private3)变量名:…1、编写一个学生类,类名为Student,包含如下成员:成员变量:1)变量名:name;类型:String;访问权限:private2)变量名:ID;类型:String;访问权限:pr…

    2022年7月8日
    162
  • CreatePipe()函数「建议收藏」

    CreatePipe()函数「建议收藏」CreatePipe()函数原型BOOLCreatePipe(PHANDLEhReadPipe;//指向管道读句柄PHANDLEhWritePipe;//指向管道写句柄LPSECURITY_ATTRIBUTESlpPipeAttributes;//指向管道安全属性DWORDnSize;//管道大小SECURITY_ATTRIBUTES结构体typedefstruct_SECURITY_ATTRIBUTES{ DWORDnLength;//结构体大小,可用siz

    2022年7月26日
    7
  • x201换风扇_笔记本怎么换风扇 ThinkPad X201i换风扇图文教程

    x201换风扇_笔记本怎么换风扇 ThinkPad X201i换风扇图文教程ThinkPadX201i换电扇图文教程:拆机之前,我们需求先对X201i的散热电扇在停止了开端的理解,得知价钱从10元左右的单电扇,到上百的散热全体都有,而且还分东芝产和松下产等不同产地的,小编选择了松下产的整套散热(包括散热片和电扇),价钱为150,电扇固定办法为小螺丝。假定拿到电脑修理店去换的话,小编猜测我们所需求的费用至少在200-300元之间。一:拆机前的准备螺丝刀,小毛刷和安排螺丝的…

    2022年6月27日
    48
  • 【路由】静态路由「建议收藏」

    【路由】静态路由「建议收藏」静态路由1、静态路由的概念1.1、概念1.2、注意事项1.3、弊端2、静态路由的配置须知2.1、出接口为BMA类型2.2、出接口为P2P类型2.3、出接口为NBMA类型3、默认路由3.1、概念3.2、实验场景3.3、适用场景3.4、注意事项4、浮动静态路由4.1、静态路由负载均衡的实验场景4.2、静态路由负载均衡讲解4.3、静态路由负载分担的优点4.4、浮动静态路由的原理4.5、浮动静态路由的应用场景1、静态路由的概念1.1、概念1.2、注意事项1.3、弊端2、静态路由的配置须知2.1、出接口为

    2025年11月25日
    5

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号