kafka和mq的应用场景_kafka和mq

kafka和mq的应用场景_kafka和mqkafka为什么有高的吞吐量?快来看看吧!~~~

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE稳定放心使用

一、前言

在这个系列博客中,小编将向大家介绍一下一款吞吐超级大的消息中间件——kafka。
说到消息中间件MQ,小编也在前面的博客中介绍过 rocketMq,activeMq等等。

至于为什么叫kafka呢?是因为创作它的程序员叫做jay krep,他非常喜欢 弗兰兹·卡夫卡,觉的kafka这个名字很酷,所以就起了这个名字。名字没有什么特别的意思。

二、什么是kafka?能干点什么?

在这里插入图片描述

Kafka是由Apache软件基金会开发的一个开源流平台,由Scala和Java编写。Kafka的Apache官网是这样介绍Kafka的。

流平台?干什么的?

From apache kafka官网

  1. To publish (write) and subscribe to (read) streams of events, including continuous import/export of your data from other systems.
  2. To store streams of events durably and reliably for as long as you want.
  3. To process streams of events as they occur or retrospectively.

翻译过来就是:

  1. 发布和订阅流数据流,包括从其他系统持续导入/导出数据。
  2. 持久化数据流,数据落地
  3. 处理数据流,数据流回放

三、kafka的架构图

在这里插入图片描述

首先kafka其他mq一样,都是有 服务端和客户端组成,客户端我们一般分成 生产者和消费者。

  • 生产者

  • 服务端,一个节点叫做broker,多个broker组成我们的集群。其中通过 zookeeper来管理集群,比如集群配置,leader的选举,负载均衡等。

  • 消费者

在这里插入图片描述

这里还有一些概念要介绍:

  • topic
    队列,生产者会发送消息到topic,消费者从topic消费消息。

  • partition
    分区,目的是提高并发,一个topic可以有多个partition,每个patition内的消息是保证顺序的,是有序队列。

  • segment
    每个patition又由多个segment file组成。文件存储二进制格式数据
    segment = xxx.index + xxxx.timeindex + xxxx.log
    xxxx.log是数据文件,xxx.index 和 xxx.timeindex 是索引文件。

log文件大小默认是1G,超出限制会新建立一个文件。可以通过log.segment.byte参数来配置每个segment大小。

命名规则:partition的第一个segment从0开始,后续每个segment文件名为上一个segment文件最后一条消息的offset + 1

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

  • replica
    副本,kafka为了保证消息的高可用性,为每个日志文件都做了备份,被称作副本,目的就是为了防止数据丢失,这样就拆成了两类:leader 和 follower。如果其中一台broker 宕机,Kafka 会从剩余的 replica 中选举出新的 leader 继续提供服务。

  • leader
    主副本,其中的数据会给到消费者。

  • follower
    从副本,备胎,个别broker宕机的时候,可以重新选举为主副本。从副本中的数据,不会给到消费者。从副本主动从主副本拉取,不同从副本的拉取同步速度也是不一样的。

  • offset
    消费者消费的位置信息,当消费者挂掉或重新恢复的时候可以,从消费位置重新继续消费。

  • consumer group
    消费者组,消费者组内所有的消费者,分别消费不同分区数据,消费互斥。

  • ISR
    in sync replica,基本保持同步的Replica列表,是从副本与主副本保持同步的列表,默认是30s数据,如果从副本保持同步,那么重新选举leader的时候,会被选择;如果与主副本同步差距较大,会被移除,选举leader,将不会被考虑。

  • OSR
    out of sync replica,同步有延迟的follower列表。

  • LEO (logEndOffset)
    表示每个partition的log最后一条message的位置。

  • HW(高水位 HighWatermark)
    每个partition的副本数据间同步且一致的offset位置,即表示所有副本都已经commit的位置
    高水位之前的数据才是Commit后的,对消费者才可见

在这里插入图片描述

四、小结

了解kafka的架构,就是要了解设计理念,阿里的rocketmq也是根据kafka的这个架构来设计的,好的架构可以拓展出更多的中间件。了解透了,你就会有收获。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/182549.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 微型计算机硬件系统的性能主要取决6,大学计算机基础单选试题「附答案」

    微型计算机硬件系统的性能主要取决6,大学计算机基础单选试题「附答案」大学计算机基础单选试题「附答案」一、单选题1.世界上首次提出存储程序计算机体系结构的是(D)A.莫奇莱B.艾仑·图灵C.乔治·布尔D.冯·诺依曼2计算机诞生于(B)A.1941年B.1946年C.1949年D.1950年3、世界上第一台电子数字计算机采用的主要逻辑部件是(A)A.电子管B.晶体管C.继电器D.光电管4、下列叙述正确的是(D)A.世界上第一台电子计算机ENIAC…

    2022年6月28日
    57
  • CompoundButton 源码分析

    CompoundButton 源码分析原文地址:https://github.com/Tikitoo/AndroidSdkSourceAnalysis/blob/master/article/CompoundButton%E6%BA%90%E7%A0%81%E5%88%86%E6%9E%90.md CompoundButton是一个有两种状态(选中和未选中/checkdunchecked)的Button。当你按下(pres…

    2022年6月7日
    34
  • python 下载百度文库_百度文库随便下载,解除限制「建议收藏」

    阅读须知:文章介绍的软件下载地址载文末,需要复制链接到浏览器打开今天有小伙伴在群里问有没有百度文库的下载工具,其实之前推荐过,但目前有新的工具出现了,而且更加好用,所以给大家更新一下百度文档0.95吾爱大神力作,软件是用python写的,跟其他下载器相比,优点就是能下载源文档,以前的冰点也很好用,但缺点是下载的是pdf文件,还需要转换,而这款软件相对来说方便多了纯文字文档下载之后是doc文件,图文…

    2022年4月13日
    62
  • internal server error原因及解决

    internal server error原因及解决常见的内部服务错误的原因有二,一是服务器资源紧张,二是文件权限错误。1.错误的原因一:服务器资源超载。服务器的资源超载:即同一时间内处理器有太多的进程需要处理的时候,会出现500错误。借助SSH,可

    2022年7月4日
    31
  • 为什么机器学习中常常假设数据是独立同分布的?

    为什么机器学习中常常假设数据是独立同分布的?

    2021年11月19日
    64
  • java递归和迭代_Java中的迭代与递归

    java递归和迭代_Java中的迭代与递归递归提到迭代,不得不提一个数学表达式:n!=n*(n-1)*(n-2)*…*1有很多方法来计算阶乘。有肯定数学基础的人都知道n!=n*(n-1)!因而,代码的实现可以直接写成:代码一intfactorial(intn){if(n==1){return1;}else{returnn*factorial(n-1);}}在执行以上代码的时候,其实机器是要执行一系列乘法的:…

    2022年7月13日
    17

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号