kafka是什么?主要用在什么场景

kafka是什么?主要用在什么场景1、kafka是什么?Kafka是由LinkedIn开发的一个分布式基于发布/订阅的消息系统,使用Scala编写,它以可水平扩展和高吞吐率而被广泛使用。2、产生背景Kafka是一个消息系统,用作LinkedIn的活动流(ActivityStream)和运营数据处理管道(Pipeline)的基础。活动流数据是几乎所有站点在对其网站使用情况做报表时都要用到的数据中最常规的部分。活动数据包括页…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE稳定放心使用

1、kafka是什么?

Kafka是由LinkedIn开发的一个分布式基于发布/订阅的消息系统,使用Scala编写,它以可水平扩展和高吞吐率而被广泛使用。

2、产生背景

Kafka是一个消息系统,用作LinkedIn的活动流(Activity Stream)和运营数据处理管道(Pipeline)的基础。活动流数据是几乎所有站点在对其网站使用情况做报表时都要用到的数据中最常规的部分。活动数据包括页面访问量(Page View)、被查看内容方面的信息以及搜索情况等内容。这种数据通常的处理方式是先把各种活动以日志的形式写入某种文件,然后周期性地对这些文件进行统计分析。运营数据指的3是服务器的性能数据(CPU、IO使用率、请求时间、服务日志等等数据)。运营数据的统计方法种类繁多。

3、基本架构图

kafka是什么?主要用在什么场景

4、基本概念解释

1)Broker

Kafka集群包含一个或多个服务器,这种服务器被称为broker。broker端不维护数据的消费状态,提升了性能。直接使用磁盘进行存储,线性读写,速度快:避免了数据在JVM内存和系统内存之间的复制,减少耗性能的创建对象和垃圾回收。

2)Producer

负责发布消息到Kafka broke

3)Consumer

消息消费者,向Kafka broker读取消息的客户端,consumer从broker拉取(pull)数据并进行处理。

4)Topic

每条发布到Kafka集群的消息都有一个类别,这个类别被称为Topic。(物理上不同Topic的消息分开存储,逻辑上一个Topic的消息虽然保存于一个或多个broker上但用户只需指定消息的Topic即可生产或消费数据而不必关心数据存于何处)

5)Partition

Parition是物理上的概念,每个Topic包含一个或多个Partition.

6)Consumer Group

每个Consumer属于一个特定的Consumer Group(可为每个Consumer指定group name,若不指定group name则属于默认的group)

7)Topic & Partition

Topic在逻辑上可以被认为是一个queue,每条消费都必须指定它的Topic,可以简单理解为必须指明把这条消息放进哪个queue里。为了使得Kafka的吞吐率可以线性提高,物理上把Topic分成一个或多个Partition,每个Partition在物理上对应一个文件夹,该文件夹下存储这个Partition的所有消息和索引文件。若创建topic1和topic2两个topic,且分别有13个和19个分区,则整个集群上会相应会生成共32个文件夹(本文所用集群共8个节点,此处topic1和topic2 replication-factor均为1)。

5、适用场景

1、Messaging

对于一些常规的消息系统,kafka是个不错的选择;partitons/replication和容错,可以使kafka具有良好的扩展性和性能优势.不过到目前为止,我们应该很清楚认识到,kafka并没有提供JMS中的"事务性""消息传输担保(消息确认机制)""消息分组"等企业级特性;kafka只能使用作为"常规"的消息系统,在一定程度上,尚未确保消息的发送与接收绝对可靠(比如,消息重发,消息发送丢失等)

2、Website activity tracking

kafka可以作为"网站活性跟踪"的最佳工具;可以将网页/用户操作等信息发送到kafka中.并实时监控,或者离线统计分析等

3、Metrics

Kafka通常被用于可操作的监控数据。这包括从分布式应用程序来的聚合统计用来生产集中的运营数据提要。

4、Log Aggregation

kafka的特性决定它非常适合作为”日志收集中心”;application可以将操作日志”批量””异步”的发送到kafka集群中,而不是保存在本地或者DB中;kafka可以批量提交消息/压缩消息等,这对producer端而言,几乎感觉不到性能的开支.此时consumer端可以使hadoop等其他系统化的存储和分析系统

更多文章:点击这里

扫码关注公众号《后端开发ipoo》
在这里插入图片描述

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/182419.html原文链接:https://javaforall.net

(0)
上一篇 2022年10月13日 下午2:46
下一篇 2022年10月13日 下午3:00


相关推荐

  • IDEA打包jar包详尽流程

    IDEA打包jar包详尽流程打包流程1.打开菜单栏File-ProjectStructure2.点击Artifacts3.点击”+”-JAR-Frommodulewithdepenencies4.后弹出如下界面,自此开始,各种问题就来了首先Module中,我SocketDemo的Module含有SocketDemo、SocketDe…

    2022年6月30日
    88
  • vue表单验证插件 vuerify

    vue表单验证插件 vuerify表单验证是一个网站或者系统不可或缺的 也是非常重要的一环 使用人工匹配验证的话会非常的复杂 尤其对于大量表单验证更是如此 当然有一些 jQuery 表单验证的插件 或许用着还不错 但是 如果你不想在 vue 中引用 jQuery 的话 只得另寻他法 目前也有一些基于 vue 表单验证的插件 一开始试用了几款效果不太理想 最后找到了一个比较的适合的 color ff0000 vuerify colo

    2026年3月17日
    2
  • 树莓派能做什么_使用树莓派做两轮自平衡车(一)

    树莓派能做什么_使用树莓派做两轮自平衡车(一)为什么要用树莓派做平衡车呢?原因主要有下面几点:第一,我不忍心再让它吃灰了;第二,我想学习linux的应用开发;第三,我想学习linux的驱动开发;第四,树莓派可玩性和可扩展性高;第五,切实体会下嵌入式linux开发与裸机开发的区别,对比一下它们的优缺点;第六,看看自己到底能不能做出个东西来。基于以上原因,我拿出了尘封已久的树莓派开干了。材料清单:树莓派(3,4,zero应该都行)…

    2022年5月1日
    50
  • Word 2019如何从任意页开始设置页码?

    Word 2019如何从任意页开始设置页码?我们在处理 Word2019 文档的时候 偶尔会有需要从指定页 任意页 开始设置页码的情况 Word2019 如何从任意页开始设置页码 下面一起来操作吧 首先 打开需要从指定页开始插入页码 指定页插入页眉也是类似的操作方法 的 Word 文件 然后将光标移到指定页面的第一个字符所在的位置前 示例文档需要开始设置页码的是第 2 页 将鼠标移到菜单栏的 布局 点击一下 然后再点开 分隔符 选项 点击一下分节符下面的 下一页 点击菜单栏的 插入 然后再点击一下 页码 在出现的下拉选项中选择

    2026年3月16日
    21
  • Java常用的输入输出语句「建议收藏」

    Java常用的输入输出语句「建议收藏」对于经常上机刷题的来说,首先得解决输入输出方法,Java的输入输出流在Java学习过程的后面部分才会接触,但是我们可以掌握一些简单的,常用的输入输出方法首先输出大家最熟悉的莫过于输出方法,直接用System.out.println()或者System.out.print()了下面一个实例1234567publicclassMain{    publicstaticvoidmain(Str…

    2022年5月26日
    61
  • 零基础5分钟部署OpenClaw指南:腾讯云轻量服务器一键搞定

    零基础5分钟部署OpenClaw指南:腾讯云轻量服务器一键搞定

    2026年3月13日
    2

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号