整合Flume和Kafka完成实时数据采集

整合Flume和Kafka完成实时数据采集需要注意:参考的网站要与你的kafka的版本一致,因为里面的字段会不一致例如:http://flume.apache.org/releases/content/1.6.0/FlumeUserGuide.html#kafka-sink这是1.6版本的,如果需要查看1.9版本的直接就将1.6.0改为1.9.0即可#avro-memory-kafka.confavro-memory-kafka.sources=avro-sourceavro-memory-kafka.sinks=kafka-.

大家好,又见面了,我是你们的朋友全栈君。

在这里插入图片描述

需要注意:参考的网站要与你的kafka的版本一致,因为里面的字段会不一致
例如:http://flume.apache.org/releases/content/1.6.0/FlumeUserGuide.html#kafka-sink
这是1.6版本的,如果需要查看1.9版本的直接就将1.6.0改为1.9.0即可

# avro-memory-kafka.conf
avro-memory-kafka.sources = avro-source
avro-memory-kafka.sinks = kafka-sink
avro-memory-kafka.channels = memory-channel

# Describe/configure the source
avro-memory-kafka.sources.avro-source.type = avro
avro-memory-kafka.sources.avro-source.bind = hadoop000
avro-memory-kafka.sources.avro-source.port = 44444

# Describe the sink
avro-memory-kafka.sinks.kafka-sink.type = org.apache.flume.sink.kafka.KafkaSink
avro-memory-kafka.sinks.kafka-sink.brokerList = hadoop000:9092
avro-memory-kafka.sinks.kafka-sink.topic = hello_topic
# batchSize 当达到5个日志才会处理,所以消费者出现的消息会慢
avro-memory-kafka.sinks.kafka-sink.batchSize = 5
avro-memory-kafka.sinks.kafka-sink.requiredAcks = 1

# Use a channel which buffers events in memory
avro-memory-kafka.channels.memory-channel.type = memory

# Bind the source and sink to the channel
avro-memory-kafka.sources.avro-source.channels = memory-channel
avro-memory-kafka.sinks.kafka-sink.channel = memory-channel
flume-ng agent \
--name avro-memory-kafka \
--conf $FLUME_HOME/conf \
--conf-file $FLUME_HOME/conf/avro-memory-kafka.conf \
-Dflume.root.logger=INFO,console
flume-ng agent  \
--name exec-memory-avro \
--conf $FLUME_HOME/conf \
--conf-file $FLUME_HOME/conf/exec-memory-avro.conf \
-Dflume.root.logger=INFO,console

启动消费者:
kafka-console-consumer.sh –zookeeper hadoop000:2181 –topic hello_topic

向data.log写入数据,发现消费者出现消息,成功

[hadoop@hadoop000 data]$ echo hellospark1111 >> data.log
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/152379.html原文链接:https://javaforall.net

(0)
上一篇 2022年6月23日 下午12:16
下一篇 2022年6月23日 下午12:16


相关推荐

  • 多继承的概念和优缺点

    多继承的概念和优缺点解析 实际生活中 一些事物往往会拥有两个或两个以上事物的属性 为了解决这个问题 C 引入了多重继承的概念 C 允许为一个派生类指定多个基类 这样的继承结构被称做多重继承 举个例子 人 Person 可以派生出作者 Author 和程序员 Programmer 然而程序员作者同时拥有作家和程序员的两个属性 即既能编程又能写作 使用多重继承的例子程序如下 nbsp nbsp nbsp nbsp nbsp nbsp nbsp in

    2025年11月12日
    6
  • mysql导入excel表异常_mysql导入excel表格数据时出错的解决

    mysql导入excel表异常_mysql导入excel表格数据时出错的解决NavicatforMySQL导入数据时报错1:导入的是Excel2007表格格式的数据。2:报错以后数据加进去了。(选择了错误继续执行)3:这个错误对我的数据有影响吗?4:造成这个错误的原因是什么5:这个是日志文件[2012-07-1113:57:48][Msg]Importstart[2012-07-1113:57:48][Msg]Importtype-Excel20…

    2026年2月8日
    4
  • 【面试】阿里巴巴Java经典面试题整理及答案详解

    【面试】阿里巴巴Java经典面试题整理及答案详解Java开发工程师-面试题目集锦Java的数据结构有哪些?线性表,链表,栈,队列,图,树什么是OOP?面向对象编程面向对象编程的原则有哪些?单一职责原则:一个类中应该是一组相关性很高的函数、数据的封装! 开闭原则;对扩展开放,对修改关闭,即在设计一个模块的时候,应当使这个模块可以在不被修改的前提下被扩展。 里氏替换原则:所有引用基类的地方必须能透明地使用其子类的对象。只…

    2022年7月8日
    22
  • 【网络中心】关于OpenClaw(龙虾)AI工具风险提示

    【网络中心】关于OpenClaw(龙虾)AI工具风险提示

    2026年3月13日
    3
  • 使用Django 测试客户端一起测试视图,模板和URL

    使用Django 测试客户端一起测试视图,模板和URL

    2022年4月2日
    43
  • RootCause深度分析:为什么DCache常会导致LCD显示异常(数据一致性问题)

    RootCause深度分析:为什么DCache常会导致LCD显示异常(数据一致性问题)很多具备 Dcache 的 LCD 显示设备 在 MCU 程序设计中 经常会发生由于使用 DCache 引起的数据错误 混乱等问题 导致 LCD 显示异常 例如出现花屏 页面显示错位 屏幕显示失真等现象 这都是属于数据一致性问题 既 Cache 与外部存储中的数据不一致 会导致 core 软件 与硬件模块 例如 PXP eLCDIF 之间配合失败 也会导致不同软件函数间协调失败 比如需要判断 flag 的

    2026年3月26日
    3

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号