Hue搭建

Hue搭建Hue 概述 Hue 是开源的 ApacheHadoop 系统 HUE HadoopUserEx 最早是由 ClouderaDesk 演化而来 由 Cloudera 贡献给开源社区 它是基于 PythonWeb 框架 Django 实现的 通过使用 Hue 我们可以在浏览器端的 Web 控制台上与 Hadoop 集群进行交互来分析处理数据 例如操作 HDFS 上的数据 运行 MapReduceJob 等等 Hue 所支持的功能特性集合 1 认基于轻量级 sqlite 数据库管理会话数据 用户认证和授权 可以自定义更改

  • Hue概述

Hue是开源的Apache Hadoop UI系统(HUE=HadoopUser Experience),最早是由Cloudera Desktop演化而来,由Cloudera贡献给开源社区,它是基于Python Web框架Django实现的。通过使用Hue我们可以在浏览器端的Web控制台上与Hadoop集群进行交互来分析处理数据,例如操作HDFS上的数据,运行MapReduce Job等等。Hue所支持的功能特性集合:1.认基于轻量级sqlite数据库管理会话数据,用户认证和授权,可以自定义更改为MySQL、Postgresql,以及Oracle等; 2.基于文件浏览器(File Browser)访问HDFS; 3.基于Hive编辑器来开发和运行Hive查询;4.支持基于Solr(读音: SOLer)进行搜索的应用,并提供可视化的数据视图,以及仪表板(Dashboard); 5.支持基于Impala的应用进行交互式查询; 6.支持Spark编辑器和仪表板(Dashboard); 7.支持Pig编辑器,并能够提交脚本任务; 8.支持Oozie编辑器,可以通过仪表板提交和监控Workflow、Coordinator和Bundle; 9.支持HBase浏览器,能够可视化数据、查询数据、修改HBase表; 10.支持Metastore浏览器,可以访问Hive的元数据,以及HCatalog; 11.支持Job浏览器,能够访问MapReduce Job(MR1/MR2-YARN); 12.支持Job设计器,能够创建MapReduce/Streaming/Java Job; 13.支持Sqoop 2编辑器和仪表板(Dashboard); 14.支持ZooKeeper浏览器和编辑器; 15.支持MySql、PostGresql、Sqlite和Oracle数据库查询编辑器。

        Hue的安装并不是那么简单,因为官方并没有编译好的,需要我们自己从github上下载源码、安装依赖、自己编译安装,编译的过程中最难也就是各种依赖缺失报错,本文将实际来进行下载-编译-安装-配置-运行hue的完整的操作过程。

  • 环境准备
  1. CentOS6.8系统(虚拟机)

Jdk1.8

Root用户启动hdfs、yarn

正常连接外网

  1. hue源码包

下载地址:http://archive.cloudera.com/cdh5/cdh/5/hue-3.9.0-cdh5.5.4.tar.gz

官方文档:http://archive.cloudera.com/cdh5/cdh/5/hue-3.9.0-cdh5.5.4/manual.html

  1. maven环境
  1. 下载

https://archive.apache.org/dist/maven/maven-3/3.3.9/binaries/

下载apache-maven-3.3.9-bin.tar.gz

  1. 安装
  1. 上传并解压

将安装包并上传到/opt/software目录

[root@hadoop003 software]# pwd

/opt/software

[root@hadoop003 software]# ll

总用量

-rw-r–r–. 1 root root   11月 15 11:10 apache-flume-1.7.0-bin.tar.gz

-rw-r–r–. 1 root root   11月 13 09:54 apache-hive-1.2.1-bin.tar.gz

-rw-r–r–. 1 root root    12月 10 22:27 apache-maven-3.3.9-bin.tar.gz

解压到/opt/module目录

[root@hadoop003 software]# tar -zxvf apache-maven-3.3.9-bin.tar.gz -C /opt/module/

[root@hadoop003 software]# cd /opt/module/apache-maven-3.3.9/

[root@hadoop003 apache-maven-3.3.9]# pwd

/opt/module/apache-maven-3.3.9

  1. 配置环境变量

[root@hadoop003 apache-maven-3.3.9]# vi /etc/profile

在最后一行添加

#MAVEN_HOME

export MAVEN_HOME=/opt/module/apache-maven-3.3.9/

export PATH=$PATH:$MAVEN_HOME/bin

  1. 验证安装成功

重新加载环境变量,并验证maven是否安装成功

[root@hadoop003 apache-maven-3.3.9]# source /etc/profile

[root@hadoop003 apache-maven-3.3.9]# mvn -version

Apache Maven 3.3.9 (bb52d8502b132ec0a5a3f4c09453c0dc5; 2015-11-11T00:41:47+08:00)

Maven home: /opt/module/apache-maven-3.3.9

Java version: 1.8.0_144, vendor: Oracle Corporation

Java home: /opt/module/jdk1.8.0_144/jre

Default locale: zh_CN, platform encoding: UTF-8

OS name: “linux”, version: “2.6.32-642.el6.x86_64”, arch: “amd64”, family: “unix”

  1. 修改maven的本地仓库位置

[root@hadoop003 apache-maven-3.3.9]# mkdir repo

[root@hadoop003 apache-maven-3.3.9]# cd repo/

[root@hadoop003 repo]# pwd

/opt/module/apache-maven-3.3.9/repo

 

修改本地库路径:

[root@hadoop003 apache-maven-3.3.9]# vim conf/settings.xml

修改前:

Hue搭建

 

修改后:

Hue搭建

 

在settings.xml文件中添加镜像下载点,加快下载速度,比如可添加国内镜像:

找到如下位置,添加红色部分。

    

     

         

nexus-aliyun

        

*

        

Nexus aliyun

        

http://maven.aliyun.com/nexus/content/groups/public

     

  

 

  • 安装hue
  1. 上传并解压hue

将hue的安装包上传到/opt/software目录下

[root@hadoop003 software]# ll

总用量

-rw-r–r–. 1 root root   12月 10 22:46 hue-3.9.0-cdh5.5.4.tar.gz

解压至/opt/module

[root@hadoop003 software]# tar -zxvf hue-3.9.0-cdh5.5.4.tar.gz -C /opt/module/

[root@hadoop003 software]# cd /opt/module/hue-3.9.0-cdh5.5.4/

[root@hadoop003 hue-3.9.0-cdh5.5.4]# ll

总用量 80

drwxr-xr-x. 21 1106 4001  4096 4月  26 2016 apps

drwxr-xr-x.  3 1106 4001  4096 4月  26 2016 cloudera

drwxr-xr-x.  5 1106 4001  4096 4月  26 2016 desktop

drwxr-xr-x.  6 1106 4001  4096 4月  26 2016 docs

drwxr-xr-x.  3 1106 4001  4096 4月  26 2016 ext

-rw-r–r–.  1 1106 4001 11358 4月  26 2016 LICENSE.txt

-rw-r–r–.  1 1106 4001  4742 4月  26 2016 Makefile

-rw-r–r–.  1 1106 4001  8505 4月  26 2016 Makefile.sdk

-rw-r–r–.  1 1106 4001  3531 4月  26 2016 Makefile.vars

-rw-r–r–.  1 1106 4001  2192 4月  26 2016 Makefile.vars.priv

drwxr-xr-x.  2 1106 4001  4096 4月  26 2016 maven

-rw-r–r–.  1 1106 4001   801 4月  26 2016 NOTICE.txt

-rw-r–r–.  1 1106 4001  1305 4月  26 2016 README

drwxr-xr-x.  5 1106 4001  4096 4月  26 2016 tools

-rw-r–r–.  1 1106 4001   932 4月  26 2016 VERSION

  1. 安装编译hue用到的依赖

全部安装

yum install -y gcc gcc-c++ libxml2-devel libxslt-devel cyrus-sasl-devel cyrus-sasl-gssapi python-devel python-setuptools python-simplejson sqlite-devel ant libsasl2-dev libsasl2-modules-gssapi-mit libkrb5-dev libtidy-0.99-0 openldap-devel  libldap2-dev openldap-devel  krb5-devel  gmp-devel openssl-devel

 

安装mysql-devel:

直接采用yum安装的的mysql-devel的版本可能不符,因此,单独安装。

看看你安装的mysql版本,选择适合自己的版本devel和shared

单独安装mysql-devel

上传MySQL-devel-5.6.24-1.el6.x86_64.rpm、MySQL-shared-5.6.24-1.el6.x86_64.rpm

[root@hadoop003 hue-3.9.0-cdh5.5.4]# rpm -ivh /opt/software/MySQL-devel-5.6.24-1.el6.x86_64.rpm

[root@hadoop003 hue-3.9.0-cdh5.5.4]# rpm -ivh /opt/software/MySQL-shared-5.6.24-1.el6.x86_64.rpm

 

  1. 添加hue用户

因为hue的默认用户不是使用root用户,所以需要增加hue用户,用hue用户来编译和运行

useradd hue

passwd hue 密码统一设置为  (我的是hadoop)

chown -R hue:hue hue-3.9.0-cdh5.5.4/

切换为hue用户

  1. 编译hue

[hue@hadoop003 hue-3.9.0-cdh5.5.4]# make apps

Post-processed ‘useradmin/art/useradmin-logo.png’ as ‘useradmin/art/useradmin-logo.e691a8a0fe4e.png’

Post-processed ‘zookeeper/css/zookeeper.css’ as ‘zookeeper/css/zookeeper.dab3cbab10bb.css’

Post-processed ‘zookeeper/help/index.html’ as ‘zookeeper/help/index.7570dbb625f3.html’

Post-processed ‘zookeeper/art/icon_zookeeper_24.png’ as ‘zookeeper/art/icon_zookeeper_24.e3168d30a559.png’

Post-processed ‘zookeeper/art/icon_zookeeper_48.png’ as ‘zookeeper/art/icon_zookeeper_48.21faf1.png’

Post-processed ‘zookeeper/art/line_icons.png’ as ‘zookeeper/art/line_icons.f50a9ca444bf.png’

Post-processed ‘zookeeper/js/base64.js’ as ‘zookeeper/js/base64.ce5e02af31e5.js’

 

907 static files copied to ‘/opt/module/hue-3.9.0-cdh5.5.4/build/static’, 907 post-processed.

make[1]: Leaving directory `/opt/module/hue-3.9.0-cdh5.5.4/apps’

至此,hue已编译并安装成功。

  • Hue基本配置和集成

注意hue的配置全部采用hue用户来完成。

  1. Hue的基本配置
  1. 配置hue.ini

[hue@hadoop003 hue-3.9.0-cdh5.5.4]# pwd

/opt/module/hue-3.9.0-cdh5.5.4

 

[hue@hadoop003 hue-3.9.0-cdh5.5.4]# vim desktop/conf/hue.ini

# Set this to a random string, the longer the better.

  # This is used for secure hashing in the session store.

  secret_key=jFE93j;2[290-eiw.KEiwN2s3[‘d;/.q[eIW^y#e=+Iei*@Mn

 

  # Execute this script to produce the Django secret key. This will be used when

  # `secret_key` is not set.

   secret_key_script=

 

  # Webserver listens on this address and port

  http_host=hadoop003

  http_port=8888

 

  # Time zone name

  time_zone=Asia/Shanghai

  1. 修改权限和启动服务

请检查desktop目录下的desktop.db文件和desktop/conf目录下的hue.ini文件是否为hue用户组的hue用户,如果不是,请修改。

chown hue:hue /opt/module/hue-3.9.0-cdh5.5.4/desktop/desktop.db

chown hue:hue /opt/module/hue-3.9.0-cdh5.5.4/desktop/conf/hue.ini

#修改desktop目录下的desktop.pb目录的权限

chmod o+w /opt/module/hue-3.9.0-cdh5.5.4/desktop/desktop.db

#在build目录下启动hue服务

build/env/bin/supervisor 

  1. 查看Hue的WEB界面

访问地址:http://hadoop003:8888

第一次访问,会让创建一个用户,这个用户是hue软件的超级用户,拥有的权限比较多

创建一个hue用户密码是hadoop。

登录成功后即可进入hue主页面:

账号:hue

密码:hadoop

  Hue搭建

 

Hue搭建

 

 

  1. Hue和HDFS集成
  1. 修改HDFS的2个配置文件

修改core-site.xml配置文件

该配置文件路径:/opt/module/hadoop-2.7.2/etc/hadoop

在该文件中添加如下内容:

  

hadoop.proxyuser.hue.hosts

  

*

  

hadoop.proxyuser.hue.groups

  

*

 

 

修改hdfs-site.xml配置文件

切换到root用户,用root用户身份修改

该配置文件路径:/opt/module/hadoop-2.7.2/etc/hadoop

在该文件中添加如下内容:

    

dfs.webhdfs.enabled


true

 

将修改的配置文件分发到其他节点

[root@hadoop003 module]# scp /opt/module/hadoop-2.7.2/etc/hadoop/core-site.xml hadoop004:/opt/module/hadoop-2.7.2/etc/hadoop/

[root@hadoop003 module]# scp /opt/module/hadoop-2.7.2/etc/hadoop/core-site.xml hadoop005:/opt/module/hadoop-2.7.2/etc/hadoop/

[root@hadoop003 module]# scp /opt/module/hadoop-2.7.2/etc/hadoop/hdfs-site.xml hadoop004:/opt/module/hadoop-2.7.2/etc/hadoop/

[root@hadoop003 module]# scp /opt/module/hadoop-2.7.2/etc/hadoop/hdfs-site.xml hadoop005:/opt/module/hadoop-2.7.2/etc/hadoop/

重启hdfs和yarn

[root@hadoop003 hadoop-2.7.2]# sbin/stop-dfs.sh

[root@hadoop003 hadoop-2.7.2]# sbin/start-dfs.sh

[root@hadoop004 hadoop-2.7.2]# sbin/stop-yarn.sh

[root@hadoop004 hadoop-2.7.2]# sbin/start-yarn.sh

 

  1. 配置hue.ini

切换到hue用户

../hue-3.9.0-cdh5.5.4/desktop/conf/

在[[hdfs_clusters]]标签下进行hdfs的配置:

[[hdfs_clusters]]

    # HA support by using HttpFs

    [[[default]]]

      # Enter the filesystem uri

      fs_defaultfs=hdfs://hadoop003:9000

 

      # NameNode logical name.

       logical_name=

 

      # Use WebHdfs/HttpFs as the communication mechanism.

      # Domain should be the NameNode or HttpFs host.

      # Default port is 14000 for HttpFs.

       webhdfs_url=http://localhost:50070/webhdfs/v1

      webhdfs_url=http://hadoop003:50070/webhdfs/v1

 

      # Change this if your HDFS cluster is Kerberos-secured

       security_enabled=false

 

      # In secure mode (HTTPS), if SSL certificates from YARN Rest APIs

      # have to be verified against certificate authority

       ssl_cert_ca_verify=True

 

      # Directory of the Hadoop configuration

       hadoop_conf_dir=$HADOOP_CONF_DIR when set or ‘/etc/hadoop/conf’

 

      hadoop_conf_dir=/opt/module/hadoop-2.7.2/etc/hadoop

      hadoop_hdfs_home=/opt/module/hadoop-2.7.2

      hadoop_bin=/opt/module/hadoop-2.7.2/bin

 

  1. 重启hue并验证

./build/env/bin/supervisor

 

 Hue搭建

 

[hue@hadoop003 fs]$ pwd

/opt/module/hue-3.9.0-cdh5.5.4/desktop/libs/hadoop/src/hadoop/fs

[hue@hadoop003 fs]$ vim /opt/module/hue-3.9.0-cdh5.5.4/desktop/libs/hadoop/src/hadoop/fs/webhdfs.py

将此处改为root

 

Hue搭建

Hue搭建

 

Hue搭建

 

Hue搭建

 

 

切换root用户,给myhueadmin用户加可写权限

hadoop fs -chmod o+w /user/

接下来,再进行创建,发现创建成功。

Hue搭建

 

在hue的web界面管理HDFS

在该界面里可以正常查看HDFS的文件夹和文件,还可以对文件的内容进行查看,但根据上述配置还不能对文件进行编辑。

  1. Hue和YARN集成
  1. 配置hue.ini

在[[yarn_clusters]]标签下进行yarn的配置:

[[yarn_clusters]]

 

    [[[default]]]

      # Enter the host on which you are running the ResourceManager

      resourcemanager_host=hadoop004

 

      # The port where the ResourceManager IPC listens on

      resourcemanager_port=8032

 

      # Whether to submit jobs to this cluster

      submit_to=True

 

      # Resource Manager logical name (required for HA)

       logical_name=

 

      # Change this if your YARN cluster is Kerberos-secured

       security_enabled=false

 

      # URL of the ResourceManager API

      resourcemanager_api_url=http://hadoop004:8088

 

      # URL of the ProxyServer API

      proxy_api_url=http://hadoop004:8088

 

      # URL of the HistoryServer API

      history_server_api_url=http://hadoop005:19888

  1. 重启hue并验证

./build/env/bin/supervisor

修改配置文件后重新启动yarn和hue服务。

Hue搭建

 

插入数据

点击该表,插入数据。

Hue搭建

Hue搭建

 

Hue搭建

 

  1.  

 

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/204582.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月19日 下午8:00
下一篇 2026年3月19日 下午8:00


相关推荐

  • ubuntu安装qt4.8.7_ubuntu卸载qt

    ubuntu安装qt4.8.7_ubuntu卸载qt由于qt4.8支持的环境比较老,所以ubuntu1820这些高版本安装时会出现各种问题,最好在14和16下安装,本文的版本是ubuntu16.04。下载并安装首先下载,然后解压,下载地址为:https://download.qt.io/archive/qt/4.8/4.8.6/tar-xzvfqt-everywhere-opensource-src-4.8.6.tar.gz然后cd进解压目录中,输入./configure,然后选择o回车,接着输入yes回车./config

    2022年10月15日
    4
  • Java商城源码最好用的java商城电商系统之一

    Java商城源码最好用的java商城电商系统之一为符合新互联网+时代产品线即时起更新演示网址:2021单店版:http://mall.javaemall.com/index.htm2021多店版:http://www.javaemall.com/index.htm源码包含:PC版网站+手机触屏站+APP客户端(安卓+苹果)+微信版(小程序+公众号)几套区别:2021版升级了移动端新功能和UI页面,更符合扁平简约化潮流,新增微信小程序,底层技术框架升级。多店版就是多店铺多商户,多用户B2B2C功能,能入驻开店。单店版是自营B…

    2022年7月8日
    48
  • 为“养龙虾”,全网疯抢Mac mini!断货!涨价!

    为“养龙虾”,全网疯抢Mac mini!断货!涨价!

    2026年3月14日
    2
  • Python– lxml用法

    Python– lxml用法目录 lxml 库 lxml 安装可查看上一篇文章 Element 类 1 节点操作 2 属性操作 3 文本操作 4 文件解析与输出 5 ElementPath6 案例 尤其最后的一篇代码 nbsp nbsp lxml 库 lxml 安装可查看上一篇文章 python 的 HTML XML 的解析器 官方文档 nbsp http lxml de index html 功能 解析 HTML

    2026年3月18日
    1
  • 黑马程序猿 ———- Java网络技术之 —正則表達式 (Day06)

    黑马程序猿 ———- Java网络技术之 —正則表達式 (Day06)

    2022年1月25日
    47
  • python 激活码 2021(注册激活)

    (python 激活码 2021)JetBrains旗下有多款编译器工具(如:IntelliJ、WebStorm、PyCharm等)在各编程领域几乎都占据了垄断地位。建立在开源IntelliJ平台之上,过去15年以来,JetBrains一直在不断发展和完善这个平台。这个平台可以针对您的开发工作流进行微调并且能够提供…

    2022年3月21日
    51

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号