具体说明 Flume介绍、安装和配置

具体说明 Flume介绍、安装和配置

大家好,又见面了,我是全栈君,今天给大家准备了Idea注册码。

社论:

本文总结“Hadoop生态系统”中的当中一员——Apache Flume

具体说明 Flume介绍、安装和配置

写在前面二:

所用软件说明:

具体说明 Flume介绍、安装和配置

一、什么是Apache Flume

官网:Flume is a distributed, reliable, and availableservicefor efficientlycollecting, aggregating, and moving large amounts of log data. It has a simple and flexible architecture based on streaming data flows. It is robust and fault tolerant with tunable reliability mechanisms and many failover and recovery mechanisms. It uses a simple extensible data model that allows for online analytic application.


1、flume是一个分布式的日志收集系统,具有高可靠、高可用、事务管理、失败重新启动等功能。数据处理速度快,全然能够用于生产环境。
经常使用的分布式日志收集系统:
Apache Flume、
Facebook Scribe、
Apache Chukwa
2、flume的核心是agent

agent是一个java进程,执行在日志收集端,通过agent接收日志。然后暂存起来,再发送到目的地。
3、agent里面包括3个核心组件:source、channel、sink。

3.1、source组件是专用于收集日志的。能够处理各种类型各种格式的日志数据,包含avro、thrift、exec、jms、spooling directory、netcat、                                          sequence generator、syslog、http、legacy、自己定义。source组件把数据收集来以后。暂时存放在channel中。

3.2、channel组件是在agent中专用于暂时存储数据的,能够存放在memory、jdbc、file、自己定义。
    channel中的数据仅仅有在sink发送成功之后才会被删除。
3.3、sink组件是用于把数据发送到目的地的组件,目的地包含hdfs、logger、avro、thrift、ipc、file、null、hbase、solr、自己定义。
4、在整个传输数据过程中。流动的是event。事务保证是在event级别。
5、flume能够支持多级flume的agent,支持扇入(fan-in)、扇出(fan-out)。

Flume简单处理示意图

具体说明 Flume介绍、安装和配置

Flume复杂处理示意图

具体说明 Flume介绍、安装和配置


二、Flume安装配置

2.1、下载Flume

Flume下载链接

2.2、解压缩

      cd /home/yujianxin/flume
      tar -zxvf apache-flume-1.4.0-src.tar.gz ; tar -zxvfapache-flume-1.4.0-bin.tar.gz

     然后把src目录中的内容所有拷贝到bin目录 

2.3、配置Flume环境变量

         具体说明 Flume介绍、安装和配置     

三、验证Flume安装是否成功

      具体说明 Flume介绍、安装和配置

      OK!

出现如上截图,说明Flume安装成功。Flume的使用请关注兴许博文。

 

版权声明:本文博客原创文章,博客,未经同意,不得转载。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/117390.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • uml的14种图_uml有几种图

    uml的14种图_uml有几种图目录什么是UML?为什么要用UML?UML图有哪些?UML图概览什么是类图?泛化(Generalization)实现(Realization)关联(Association)聚合(Aggregation)组合(Composition)依赖(Dependency)什么是组件图?什么是部署图?什么是对象图?什么是包图?什么是组合结构图?什么是轮廓图?什么是用例图?什么是活动图?什么是状态机图?什么是序列图?什么是通讯图?什

    2025年8月8日
    3
  • Tomcat日志管理(一)[通俗易懂]

    Tomcat日志管理(一)[通俗易懂]官方文档地址:http://tomcat.apache.org/tomcat-7.0-doc/logging.htmlTomcatJULITomcat的日志管理功能是借助于ApacheCommonsLogging库来实现的,该库对当今几个流行的日志框架的精简和封装,从而使得Tomcat日志管理不必依赖于某一个具体的日志框架。从Tomcat6.0开始,Tomcat内的Apache…

    2022年5月22日
    38
  • 复试–完数

    复试–完数

    2021年5月19日
    122
  • leetcode-23合并K个升序链表(分治|堆)

    leetcode-23合并K个升序链表(分治|堆)给你一个链表数组,每个链表都已经按升序排列。请你将所有链表合并到一个升序链表中,返回合并后的链表。示例 1:输入:lists = [[1,4,5],[1,3,4],[2,6]]输出:[1,1,2,3,4,4,5,6]解释:链表数组如下:[ 1->4->5, 1->3->4, 2->6]将它们合并到一个有序链表中得到。1->1->2->3->4->4->5->6示例 2:输入:lists = []输

    2022年8月9日
    3
  • Linux面试题整理[通俗易懂]

    Linux面试题整理[通俗易懂]Linux概述什么是LinuxLinux是一套免费使用和自由传播的类Unix操作系统,是一个基于POSIX和Unix的多用户、多任务、支持多线程和多CPU的操作系统。它能运行主要的Unix工具软件、应用程序和网络协议。它支持32位和64位硬件。Linux继承了Unix以网络为核心的设计思想,是一个性能稳定的多用户网络操作系统。什么是Linux内核?Linux系统的核心是内核。内核控制着计算机系统上的所有硬件和软件,在必要时分配硬件,并根据需要执行软件。系统内存管理 应用

    2022年5月7日
    50
  • 三大战略分析方法——SWOT、PEST、波特五力模型

    三大战略分析方法——SWOT、PEST、波特五力模型目录1.SWOT分析模型「SWOT分析模型简介」「SWOT模型含义介绍」「SWOT分析步骤」2.PEST分析模型PEST分析的内容3.波特五力模型[定义][五力模型]1.SWOT分析模型「SWOT分析模型简介」(也称TOWS分析法、道斯矩阵)。在现在的战略规划报告里,SWOT分析应该算是一个众所周知的工具。来自于麦肯锡咨询公司的SWOT…

    2022年6月12日
    53

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号