具体说明 Flume介绍、安装和配置

具体说明 Flume介绍、安装和配置

大家好,又见面了,我是全栈君,今天给大家准备了Idea注册码。

社论:

本文总结“Hadoop生态系统”中的当中一员——Apache Flume

具体说明 Flume介绍、安装和配置

写在前面二:

所用软件说明:

具体说明 Flume介绍、安装和配置

一、什么是Apache Flume

官网:Flume is a distributed, reliable, and availableservicefor efficientlycollecting, aggregating, and moving large amounts of log data. It has a simple and flexible architecture based on streaming data flows. It is robust and fault tolerant with tunable reliability mechanisms and many failover and recovery mechanisms. It uses a simple extensible data model that allows for online analytic application.


1、flume是一个分布式的日志收集系统,具有高可靠、高可用、事务管理、失败重新启动等功能。数据处理速度快,全然能够用于生产环境。
经常使用的分布式日志收集系统:
Apache Flume、
Facebook Scribe、
Apache Chukwa
2、flume的核心是agent

agent是一个java进程,执行在日志收集端,通过agent接收日志。然后暂存起来,再发送到目的地。
3、agent里面包括3个核心组件:source、channel、sink。

3.1、source组件是专用于收集日志的。能够处理各种类型各种格式的日志数据,包含avro、thrift、exec、jms、spooling directory、netcat、                                          sequence generator、syslog、http、legacy、自己定义。source组件把数据收集来以后。暂时存放在channel中。

3.2、channel组件是在agent中专用于暂时存储数据的,能够存放在memory、jdbc、file、自己定义。
    channel中的数据仅仅有在sink发送成功之后才会被删除。
3.3、sink组件是用于把数据发送到目的地的组件,目的地包含hdfs、logger、avro、thrift、ipc、file、null、hbase、solr、自己定义。
4、在整个传输数据过程中。流动的是event。事务保证是在event级别。
5、flume能够支持多级flume的agent,支持扇入(fan-in)、扇出(fan-out)。

Flume简单处理示意图

具体说明 Flume介绍、安装和配置

Flume复杂处理示意图

具体说明 Flume介绍、安装和配置


二、Flume安装配置

2.1、下载Flume

Flume下载链接

2.2、解压缩

      cd /home/yujianxin/flume
      tar -zxvf apache-flume-1.4.0-src.tar.gz ; tar -zxvfapache-flume-1.4.0-bin.tar.gz

     然后把src目录中的内容所有拷贝到bin目录 

2.3、配置Flume环境变量

         具体说明 Flume介绍、安装和配置     

三、验证Flume安装是否成功

      具体说明 Flume介绍、安装和配置

      OK!

出现如上截图,说明Flume安装成功。Flume的使用请关注兴许博文。

 

版权声明:本文博客原创文章,博客,未经同意,不得转载。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/117390.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • awvs14安装教程_amesim安装教程

    awvs14安装教程_amesim安装教程AWVS安装1.解压awvs14.zip的压缩包2.点击如图所示的程序进行安装,安装的过程可以更改安装路径(最好是全英文的),出现证书安装把证书也安装一下[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-H9IM7zsf-1636963924896)(C:\Users\Lenovo\Desktop\软件安装\awvs安装.assets\1636948268918.png)]3.点击如下图所示的程序,出现网页关闭即可[外链图片转存失败,源站可能有防盗链机制,建议将图片保存

    2022年9月15日
    2
  • 笔记本(无线网卡)配置虚拟机上网

    笔记本(无线网卡)配置虚拟机上网当我们安装了virtualbox或者VMware虚拟机,都会虚出一个虚拟网卡。如果我们使用的是网线上网,那么可以选择“网桥”的方式让虚拟机上网,这样可以保证虚拟机和主机之间互通,而且虚拟机也可以访问外网。这时,虚拟机可以使用dhcp也可以手工的方式指定ip。那么,如果笔记本使用的是无线网卡上网,那么就无法使用“网桥”的方式配置虚拟机上网了。这时,可以使用host-only的配置方式,同

    2022年5月19日
    44
  • 数据结构与算法邹永林周蓓课后答案_数据结构与算法分析第二版答案

    数据结构与算法邹永林周蓓课后答案_数据结构与算法分析第二版答案出版社:外语教学与研究出版社作者:郑诚出版日期:2012.4ISBN:9787513517409具体封面以实物为准目录数据结构导论自学考试大纲出版前言1.课程性质与课程目标2.考核目标3.课程内容与考核要求4.关于大纲的说明与考核实施要求附录题型举例后记数据结构导论前言第一章概论1.1引言1.2基本概念和术语1.2.1数据、数据元素和数据项1.2.2数据的逻…

    2022年8月18日
    6
  • tomcat大量time wait问题

    tomcat大量time wait问题在服务端访问量大的时候检测到大量的timewait,并且接口请求延时较高。执行netstat-n|awk‘/^tcp/{++S[$NF]}END{for(minS)printm,S[m]}’这个shell命令的意思是把netstat-n后结果的最后一条放到S[]数组中,如果相同则执行+1操作。此时能看到TCP各种状态下的连接数量,示例服务端架构是采用nginx

    2022年5月1日
    54
  • Activiti工作流框架学习笔记(一)「建议收藏」

    Activiti工作流框架学习笔记(一)「建议收藏」工作流的概念先看下面两张图:对以上两张图进行说明:假设这两张图就是华谊兄弟的请假流程图图的组成部分:人物:范冰冰、冯小刚、王中军事件(动作):请假、批准、不批准通过以上分析我们就可以抽象成:接下来给出工作流的书面化概念:工作流(Workflow),就是“业务过程的部分或整体在计算机应用环境下的自动化”,它主要解决的是“使在多个参与者之间按照某种预定义的规则传递文档、

    2022年10月6日
    3
  • xsync 脚本[通俗易懂]

    xsync 脚本[通俗易懂]xsync文件分发脚本#!/bin/bash#1获取输入参数个数,如果没有参数,直接退出pcount=$#if((pcount==0));thenechonoargs;exit;fi#2获取文件名称p1=$1fname=`basename$p1`echofname=$fname#3获取上级目录到绝对路径pdir=`cd-P$(dirname$p1…

    2022年6月2日
    47

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号