Hadoop基础_hadoop教程

Hadoop基础_hadoop教程Hadoop基础

大家好,又见面了,我是你们的朋友全栈君。

1、安装与配置

cd /opt

wget http://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/hadoop-2.7.7/hadoop-2.7.7.tar.gz

tar -zxvf hadoop-2.7.7.tar.gz

设置hadoop环境变量

export HADOOP_HOME=/opt//hadoop-2.7.7

export PATH=$PATH:$HADOOP_HOME/bin

export PATH=$PATH:$HADOOP_HOME/sbin

可以找到位置“$HADOOP_HOME/etc/hadoop”下找到所有Hadoop配置文件。为了使用Java开发Hadoop程序,必须重新设置hadoop-env.sh文件的java环境变量。

可以通过echo $JAVA_HOME获取Java位置,然后在hadoop-env.sh中修改

以下是必须编辑配置Hadoop的文件列表。

core-site.xml

core-site.xml文件中包含如读/写缓冲器用于Hadoop的实例的端口号的信息,分配给文件系统存储,用于存储所述数据存储器的限制和大小。

打开core-site.xml 并在<configuration>,</configuration>标记之间添加以下属性。

<configuration> 
  <property> 
   <name>fs.default.name </name>
   <value> hdfs://localhost:9000 </value>
  </property> 

 <property>
  <name>hadoop.tmp.dir</name>
  <value>/hadoop</value>
 </property>

  <property>
  <name>dfs.name.dir</name>
  <value>/hadoop/name</value>
 </property>
</configuration>

hdfs-site.xml

hdfs-site.xml 文件中包含如复制数据的值,NameNode路径的信息,本地文件系统的数据节点的路径。这意味着是存储Hadoop基础工具的地方。

打开这个文件,并在这个文件中的<configuration></configuration>标签之间添加以下属性。

<configuration>

   <property>
      <name>dfs.data.dir</name> 
      <value>/home/hadoop/data</value> 
   </property>
       
</configuration>

注:在上面的文件,所有的属性值是用户定义的,可以根据自己的Hadoop基础架构进行更改。

yarn-site.xml

此文件用于配置成yarn在Hadoop中。打开 yarn-site.xml文件,并在文件中的<configuration></configuration>标签之间添加以下属性。

<configuration>
 
   <property>
      <name>yarn.nodemanager.aux-services</name>
      <value>mapreduce_shuffle</value> 
   </property>
  
</configuration>

mapred-site.xml

此文件用于指定正在使用MapReduce框架。缺省情况下,包含Hadoop的模板yarn-site.xml。首先,它需要从mapred-site.xml复制。获得mapred-site.xml模板文件使用以下命令。

$ cp mapred-site.xml.template mapred-site.xml

打开mapred-site.xml文件,并在此文件中的<configuration></configuration>标签之间添加以下属性。

<configuration>
 
   <property> 
      <name>mapreduce.framework.name</name>
      <value>yarn</value>
   </property>
   
</configuration>

转载于:https://my.oschina.net/lin546/blog/3016365

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/106962.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 碰撞圆周率_我让你背一遍圆周率

    碰撞圆周率_我让你背一遍圆周率#include”stdafx.h”#include<iostream>//碰撞后速度voidtxpz(doublem1,doublem2,double&v1,double&v2){ doublev1_=((m1-m2)*v1+2*m2*v2)/(m1+m2); doublev2_=((m2…

    2025年8月29日
    6
  • linux 挂载raid_linux挂载磁盘阵列

    linux 挂载raid_linux挂载磁盘阵列在许多项目中,都会把数据存放于磁盘阵列,以确保数据安全或者实现负载均衡。在初始安装数据库系统和数据恢复时,都需要先挂载磁盘阵列到系统中。本文记录一次在linux系统中挂载磁盘的操作步骤,以及注意事项。此处所用操作系统为Asianux,磁盘阵列设备名为emcpowera,使用的分区为emcpowera1。1.使用命令fdisk–l/dev/emcpowera查看磁盘阵列的分区情况:2.正…

    2022年6月19日
    47
  • Python迭代DataLoader时出现TypeError: Caught TypeError in DataLoader worker process 0.错误。

    Python迭代DataLoader时出现TypeError: Caught TypeError in DataLoader worker process 0.错误。迭代DataLoader时出现TypeError:CaughtTypeErrorinDataLoaderworkerprocess0.错误。遇见一个难以解决的问题遇见一个难以解决的问题迭代DataLoader时出现以下错误,暂时不知道怎么解决,向大家求救,是一个比较稀罕的错误,也分享给大家一个奇葩的问题一起讨论。Traceback(mostrecentcalllast…

    2022年5月5日
    907
  • Windows 下使用 Mingw32-make 来执行 Makefile示例[通俗易懂]

    文章目录先下载Mingw设置好环境变量确认安装环境状态gccmingw32-makeC工程测试main.cmath.ccall_math.c准备好Makefile文件执行Makefile执行前执行后运行main.exe执行Makefileclean清理文件执行前执行后整体运行演示GIFReferernces先下载Mingw这里使用的是mingw32不是64的,需要64位的自行搜索下载32位的可以参考我之前一篇的:C-BookNote-Win开发环境设置

    2022年4月8日
    170
  • 安川ga700变频器故障码集_安川变频器CPF故障码集

    安川ga700变频器故障码集_安川变频器CPF故障码集CPF00 操作器故障 1 数字式操作器通信故障 1 接通电源 5 秒后 也不能和数字式操作器进行通信 CPU 的外部 RAM 不良数字式操作器的插头接触不良变频器控制回路不良控制回路损坏拆下数字式操作器后再重新安装更换变频器试着开闭电源更换变频器 CPF01 操作器故障 2 数字式操作器通信故障 2 与数字式操作器开始通信后 发生了 2 秒以上的通信故障数字式操作器的插头接触不良变频器控制回路不良拆

    2025年6月6日
    2
  • 【虚拟DOM】浅析 虚拟DOM「建议收藏」

    【虚拟DOM】浅析 虚拟DOM「建议收藏」虚拟DOM作为目前流行的DOM操作思想,被广泛用在react中,这套设计的确在用户体验上带来了显著提升。下面我们来浅析一下这个东西,一步步看下去,希望你能有所收获。设计理念尽管MVVM将页面逻辑实现的核心转移到数据层面的修改上,但是最终数据层反映到页面上View的层的渲染和改变仍是通过对应的指令进行DOM操作来完成的。而且,通常一次ViewModel的变化可能会触发液面上多个指令操……

    2025年7月15日
    2

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号