kafka的工作原理与常见问题

news/2024/7/7 19:58:08 标签: kafka, 分布式

定义
kafka是一个分布式的基于发布/订阅模式的消息队列(message queue),主要应用于大数据的实时处理领域
消息队列工作原理
消息队列
kafka的组成结构
kafka的基础架构主要有broker、生产者、消费者组构成,还包括zookeeper.
生产者负责发送消息
broker负责缓冲消息,存储在磁盘的,所以数据不易丢失,broker中可以创建topic,每个topic又有partition和replication的概念
消费者组负责处理消息,同一个消费者组的中消费者不能消费同一个partition中的数据
Kakfa如果要组件集群,则只需要注册到一个zk中就可以了,zk中还保留消息消费的进度或者说偏移量或者消费位置

工作流程

1)主线程首先将业务数据封装成ProducerRecord对象
2)调用send方法将消息放入消息收集器RecordAccumlator中暂存
3)Sender线程将消息信息构成请求
4)执行网络IO的线程从RecordAccumlator中将消息取出并批量发送出去
5)Kafka消费者从属于消费者组。消费者组内的消费者订阅的是相同主题,每个消费者接收主题的一部分分区的消息。

常见问题

1:kafka如何保证消息的顺序性?
Kafka 保证消息顺序性是指在单个分区内消息是有序的,即消费者从一个分区中读取消息时,这些消息是按照生产者发送的顺序来消费的。
为了保证消息的顺序性,你需要确保以下几点:
生产者将消息发送到同一个分区
不要并发写入同一个分区,否则可能会导致消息乱序。
消费者从分区中读取消息是按按顺序的并按顺序处理,保证了消息的顺序性。

2:kafka 生产者发送消息时如何来提高发送速率
要提高Kafka生产者的发送速率,可以调整Kafka生产者客户端的几个关键配置参数:
batch.size: 控制生产者一起发送数据的大小,默认是16KB。增加这个值可以批量发送更多的消息,从而提高发送速率。
linger.ms: 控制生产者发送数据之前等待更多消息加入到batch中的时间。降低这个值可以更快地发送小批量消息,默认值为0毫秒)。
max.request.size: 控制生产者能发送的最大消息大小。如果消息大小超过这个值,消息将会被截断。
buffer.memory: 控制生产者可以用来缓存消息的内存大小。增加这个值可以缓存更多的消息。
compression.type: 控制消息被压缩的方式,可以选择压缩类型来减少发送的数据量。


http://www.niftyadmin.cn/n/5535083.html

相关文章

centos7安装宝塔面板

一、进入root模式 sudo su二、安装宝塔面板 if [ -f /usr/bin/curl ];then curl -sSO https://download.bt.cn/install/install_panel.sh;else wget -O install_panel.sh https://download.bt.cn/install/install_panel.sh;fi;bash install_panel.sh ed8484bec

Spring Boot中获取请求参数的几种方式

前言 在构建现代 Web 应用时,处理来自客户端的请求参数是不可或缺的一部分。Spring Boot作为构建微服务应用的领先框架,提供了多种灵活高效的方式来获取请求参数,满足各种应用场景。 无论您是Spring Boot的初学者,还是希望更深入…

rtpengine_mr12.0 基础建设容器运行

目录 Dockerfile rtpengine.conf 容器内编译安装 RTPEngine 正常提供功能 1. 启动RTPEngine服务 2. 删除 RTPEngine服务 3. 加载内核模块 检查所有进程是否正在运行 上传到仓库 博主wx:yuanlai45_csdn 博主qq:2777137742 后期会创建粉丝群&…

力扣第219题“存在重复元素 II”

在本篇文章中,我们将详细解读力扣第219题“存在重复元素 II”。通过学习本篇文章,读者将掌握如何使用滑动窗口和哈希表来解决这一问题,并了解相关的复杂度分析和模拟面试问答。每种方法都将配以详细的解释,以便于理解。 问题描述…

jQuery UI 简介

jQuery UI 简介 1. 引言 jQuery UI 是一个建立在 jQuery JavaScript 库之上的开源小部件和交互库,旨在创建高度交互的网页。它提供了一系列预先设计好的小部件,如拖放、排序、对话框、工具提示等,以及用于构建复杂用户界面的交互方法。jQuery UI 的设计目标是简化 HTML 文…

服务器日志事件ID4107:从自动更新 cab 中提取第三方的根目录列表失败,错误为: 已处理证书链,但是在不受信任提供程序信任的根证书中终止。

在查看Windows系统日志时,你是否有遇到过事件ID4107错误,来源CAPI2,详细信息在 http://www.download.windowsupdate.com/msdownload/update/v3/static/trustedr/en/authrootstl.cab 从自动更新 cab 中提取第三方的根目录列表失败,…

根据服务器流量使用情况推算出网站流量的方法

根据服务器流量使用情况推算网站流量是一个涉及数据监测、分析和计算的过程。以下是一些基本步骤和方法: 1. 收集数据 首先,你需要获取服务器的流量数据,这些数据通常包括: - 总流量:一定时间周期内服务器发送和接收的…

精准控制:Eureka服务续约间隔配置全指南

精准控制:Eureka服务续约间隔配置全指南 在微服务架构中,服务的发现与注册是确保服务间有效通信的关键。Eureka,作为Netflix开源的服务发现框架,提供了一种优雅的方式来实现服务的注册与发现。然而,服务续约间隔的配置…