摘要:
好吧,咱们接着上一篇博客继续用另一种方式来创建Maven项目。不过在创建之前我们应该先熟悉一些相关dos命令。创建web项目命令:[java]view plaincopymvnarchetype:generate-DgroupId=org.open-DartifactId=CRS-Darchetyp... 阅读全文
摘要:
使用Kafka的同学都知道,我们每次创建Kafka主题(Topic)的时候可以指定分区数和副本数等信息,如果将这些属性配置到server.properties文件中,以后调用Java API生成的主题将使用默认值,先改变需要使用命令bin/kafka-topics.sh --zookeeper lo... 阅读全文
摘要:
摘要 Kafka在0.8以前的版本中,并不提供High Availablity机制,一旦一个或多个Broker宕机,则宕机期间其上所有Partition都无法继续提供服务。若该Broker永远不能再恢复,亦或磁盘故障,则其上数据将丢失。而Kafka的设计目标之一即是提供数据持久化,同时对于分布式系... 阅读全文
摘要:
摘要 Kafka是由LinkedIn开发并开源的分布式消息系统,因其分布式及高吞吐率而被广泛使用,现已与Cloudera Hadoop,Apache Storm,Apache Spark集成。本文介绍了Kafka的创建背景,设计目标,使用消息系统的优势以及目前流行的消息系统对比。并介绍了Kafka... 阅读全文
摘要:
nginx的日志文件没有rotate功能。如果你不处理,日志文件将变得越来越大,还好我们可以写一个nginx日志切割脚本来自动切割日志文件。第一步就是重命名日志文件,不用担心重命名后nginx找不到日志文件而丢失日志。在你未重新打开原名字的日志文件前,nginx还是会向你重命名的文件写日志,linu... 阅读全文
摘要:
参考官网site:http://kafka.apache.org/documentation.html#basic_ops_cluster_expansionhttps://cwiki.apache.org/confluence/display/KAFKA/Replication+tools#Rep... 阅读全文
摘要:
学习Kafka的读书笔记,暂未把文章设为翻译类型,因为并非直译文档。水平有限,还请路过高手指正。 “最多(发送)一次”(At most once):消息可以丢失但绝不会重新发送; “至少(发送)一次”(At least once):消息绝不会丢失但是可能会被重新发送; “仅(发送)一次”(Exact... 阅读全文
摘要:
总结下自己在尝试Kafka分区迁移过程中对这部分知识的理解,请路过高手指正。关于Kafka数据迁移的具体步骤指导,请参考如下链接:http://www.cnblogs.com/dycg/p/3922352.html原文作者写的非常清晰。本文主要侧重自己对相关Kafka源代码的理解:generateA... 阅读全文
摘要:
先解释下两个概念:high watermark (HW) 它表示已经被commited的最后一个message offset(所谓commited, 应该是ISR中所有replica都已写入),HW以下的消息都已被ISR中各个replica同步,从而保持一致。HW以上的消息可能是脏数据:部分repl... 阅读全文
摘要:
1.ProducerRecord 含义:发送给Kafka Broker的key/value值对2.内部数据结构:-- Topic(名字)-- PartitionID (可选)-- Key[(可选)-- Value3.生产者记录(简称PR)的发送逻辑: 若指定Partition ID,则PR被发送至指... 阅读全文