hadoop学习总结

hadoop学习总结hadoop 学习总结 1 hadoop 简介 1 分布式存储系统 HDFS HadoopDistir 分布式存储系统 提供了高可靠 高拓展 高吞吐率的数据存储服务 2 分布式计算框架 MapReduce 分布式计算框架 具有易于编程 高容错率 高拓展性等有点 2 HDFS 优点 1 高容错性 数

 
   
    
    
      fs.defaultFS 
     
    
      hdfs://192.168.0.4:9000 
     
    
    
    
      hadoop.tmp.dir 
     
    
      /opt/hadoop-2.5 
     
    
   #vi hdfs-site.xml: 
   
    
    
      dfs.namenode.secondary.http-address 
     
    
      192.168.0.5:50090 
     
    
    
    
      dfs.namenode.secondary.https-address 
     
    
      192.168.0.5:50091 
     
    
   #vi slaves:配置datenote的属性。 192.168.0.5 192.168.0.8 192.168.0.9 #vi masters:配置secondary namenode 192.168.0.5 

(8)如果以上配置完成后,还不能显示datanode,可以试着添加或修改主机名。hostname /etc/hosts /etc/hostname

 
   
   
     dfs.nameservices 
    
   
     mycluster 
    //nameservice ID 
   - namenode配置: 
   
   
     dfs.ha.namenodes.mycluster 
    
   
     nn1,nn2 
    //两个namenode的名称 
   - nameNode的rpc协议具体配置:(修改两个namenode的value值) 
   
   
     dfs.namenode.rpc-address.mycluster.nn1 
    //注意nameservice ID要一致 
   
     machine1.example.com:8020 
    //第一个namenode的配置 
   
   
   
     dfs.namenode.rpc-address.mycluster.nn2 
    
   
     machine2.example.com:8020 
    //第二个namenode的配置 
   - namenode的http协议的具体配置:(修改两个namenode的value值) 
   
   
     dfs.namenode.http-address.mycluster.nn1 
    
   
     machine1.example.com:50070 
    //第一个namenode的配置 
   
   
   
     dfs.namenode.http-address.mycluster.nn2 
    
   
     machine2.example.com:50070 
    //第二个namenode的配置 
   - edits文件的共享目录: 
   
   
     dfs.namenode.shared.edits.dir 
    
   
     qjournal://node1.example.com:8485;node2.example.com:8485;node3.example.com:8485/mycluster 
    
   - java连接NameNode的配置:基本不用修改 
   
   
     dfs.client.failover.proxy.provider.mycluster 
    
   
     org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider 
    
   - 
   
   
     dfs.ha.fencing.methods 
    
   
     sshfence 
    
   
   
   
     dfs.ha.fencing.ssh.private-key-files 
    
   
     /home/exampleuser/.ssh/id_rsa 
    //私钥目录 
   - 配置journalnode的数据存放目录: - 
   
   
     dfs.journalnode.edits.dir 
    
   
     /path/to/journal/node/local/data 
    
   #编辑 core-site.xml文件 - 
   
   
     fs.defaultFS 
    
   
     hdfs://mycluster 
    //nameservice ID 
   - 
   
   
     hadoop.tmp.dir 
    
   
     /opt/hadoop-2.5 
    
   # 以上是手动切换的配置,如果需要自动切换则需: - 编辑hdfs-site.xml: 
   
   
     dfs.ha.automatic-failover.enabled 
    
   
     true 
    
   - 编辑core-site.xml:配置zoodeeper的三台服务器。(server1 server2 server3) 
   
   
     ha.zookeeper.quorum 
    
   
     zk1.example.com:2181,zk2.example.com:2181,zk3.example.com:2181 
    
   

14.熟悉hdfs hadoop-daemon start-dfs.sh等命令。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/208877.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月19日 上午10:34
下一篇 2026年3月19日 上午10:34


相关推荐

  • 嵌入式系统中启动Hostapd

    嵌入式系统中启动Hostapd项目过程中需要添加AP热点的需求,自然会想用到hostapd,具体的不做分析,自行百度,这里主要分析下启动脚本采用的WiFi模组是“博通”公司的AP6255芯片,“博通”公司的wifi芯片AP与STATION切换需要对网卡驱动进行卸载重装,所以配网方式不建议使用AP模式配网,这会造成多次WiFi模式的切换,耗时可能比较严重。不过给出以下方法,开发者可以自行配置,进入…

    2022年5月11日
    43
  • 转置卷积学习笔记

    转置卷积学习笔记文章目录1.转置卷积定义2.1.转置卷积定义2.

    2022年6月21日
    30
  • 2021mathorcup大数据建模A题思路及相关代码

    2021mathorcup大数据建模A题思路及相关代码详见链接:????正在为您运送作品详情https://mianbaoduo.com/o/bread/YpeTl59r

    2022年5月11日
    55
  • net share 共享文件夹

    net share 共享文件夹共享文件夹并设置共享文件夹为读写 netshareali M test unlimited grant everyone full 同时还需要配合 cacls 来设置文件夹访问权限 caclsM test geveryone rR 读取 W 写入 C 更改 写入 F 完全控制 netshareali M test unlimited grant everyone fullcaclsM test geveryone r

    2025年12月11日
    6
  • 关于安装Maven以及环境变量的配置完整教程[通俗易懂]

    关于安装Maven以及环境变量的配置完整教程[通俗易懂]Maven项目对象模型(POM),可以通过一小段描述信息来管理项目的构建,报告和文档的项目管理工具软件。一、安装1.官网安装地址:Maven–WelcometoApacheMaven2.点击Download3.下载后解压产生此文件夹4.文件夹如图所示二、环境变量配置点击我的电脑->属性->高级系统设置->环境变量新建两个环境变量2.新建:M2_HOME内容:maven的bin目录(这里看大家安装的路径,………

    2022年7月24日
    10
  • Vmware Workstation虚拟机繁忙导致无法关机

    Vmware Workstation虚拟机繁忙导致无法关机环境Windows10(1903版本),Ubuntu18.04,VMwareWorkstationPro15。问题描述由于某些不知名的原因(好吧,其实是从windows向虚拟机复制文件时发生不知名错误),导致Ubuntu卡住不动了,而整个虚拟机也无法关掉。解决方法1.首先每打开一个虚拟机会有一个vmwareworkstationvmx.exe进程(如下图),正常关…

    2025年8月12日
    6

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号