【Kafka】生产调优与面试题

Kafka万亿级消息实战!(包含各种业务应用场景举例)  https://blog.51cto.com/u_15047392/4872419

上亿数据量下,Kafka是如何优化JVM GC问题的?  https://blog.51cto.com/u_15009384/2566936

搞定这8个Kafka生产级容量评估,每日10亿+请求轻松拿捏  https://blog.csdn.net/weixin_70730532/article/details/125245222

Kafka在美团数据平台的实践   https://tech.meituan.com/2022/08/04/the-practice-of-kafka-in-the-meituan-data-platform.html

如何保证消息不丢失:多副本机制

如何保证消息处理有序:

如何保证不乱序:

消息存储结构:

如何保证百万级写入速度:

  1、页缓存技术(PageCache) + 磁盘顺序写
  2、零拷贝技术 sendFile

    

主从同步原理:

  参考:https://blog.51cto.com/u_13270164/3062005

  高可用:副本(Leader-》Follower机制) 

  ISR: 

Kafka为什么不自己管理缓存,而非要用page cache?原因有如下三点:

  • JVM中一切皆对象,数据的对象存储会带来所谓object overhead,浪费空间;
  • 如果由JVM来管理缓存,会受到GC的影响,并且过大的堆也会拖累GC的效率,降低吞吐量;
  • 一旦程序崩溃,自己管理的缓存数据会全部丢失。

Kafka底层原理之高吞吐、低延迟、零拷贝

 

posted @ 2022-06-22 23:35  飞翔在天  阅读(59)  评论(0编辑  收藏  举报