2020年4月6日

Spark-作业执行流程概述

摘要: Spark-作业执行流程概述 spark的作业和任务带哦度系统是其核心,它能够有效地进行调度根本原因是对任务划分DAG和容错,使得它对底层到顶层的各个模块之间的调用和处理显的游刃有余。 相关术语 作业(job):RDD中由行动操作所生成的一个或多个调度阶段 调度阶段(stage):每个作业会因为RD 阅读全文

posted @ 2020-04-06 19:38 嘣嘣嚓 阅读(1162) 评论(0) 推荐(0) 编辑

Kafka-独立消费者

摘要: Kafka-独立消费者 有的时候,我们只需要一个消费者从一个主题的所有分区或者某个特定分区读取数据。这时就不需要消费者群组和再均衡了,只需要把主题或者分区分配给消费者,然后开始读取消息并提交偏移量。 如果是这样的话,就不需要订阅主题,取而代之的是为自己分配分区。 代码如下 import com.ch 阅读全文

posted @ 2020-04-06 15:42 嘣嘣嚓 阅读(651) 评论(0) 推荐(0) 编辑

Kafka-序列化器与反序列化器的使用(自定义消息类型)

摘要: Kafka-序列化器与反序列化器的使用(自定义消息类型) 代码如下 Customer /** * @Author FengZhen * @Date 2020-03-30 22:49 * @Description 自定义序列化器的实体类 */ public class Customer { priva 阅读全文

posted @ 2020-04-06 15:29 嘣嘣嚓 阅读(1330) 评论(0) 推荐(0) 编辑

Kafka-再均衡监听器

摘要: Kafka-再均衡监听器 在为消费者分配新分区或移除旧分区时,可以通过消费者API执行一些应用程序代码,在调用subscribe()方法时传进去一个ConsumerRebalanceListener实例就可以了。 public void onPartitionsRevoked(Collection< 阅读全文

posted @ 2020-04-06 14:56 嘣嘣嚓 阅读(1725) 评论(0) 推荐(0) 编辑

Kafka-消费者-偏移量的提交方式

摘要: Kafka-消费者-偏移量的提交方式 每次调用poll()方法,它总是返回由生产者写入Kafka但还没有被消费者读取过的记录,可以追踪到哪些记录是被群组里的哪个消费者读取的。 更新分区当前位置的操作叫做提交。 消费者往一个叫做 _consumer_offset的特殊主题发送消息,消息里包含每个分区的 阅读全文

posted @ 2020-04-06 14:41 嘣嘣嚓 阅读(2149) 评论(0) 推荐(0) 编辑

Kafka-消费者(订阅主题消费数据及常用调优参数解析)

摘要: Kafka-消费者基础使用及常用参数解析 消费者和消费者群组 kafka消费者从属于消费者群组。一个群组里的消费者订阅的是同一个主题,每个消费者接收主题一部分分区的消息。 假设主题T1有4个分区,我们创建了消费者C1,它是群组G1里唯一的消费者,我们用它订阅主题T1。消费者C1将收到主题T1全部的4 阅读全文

posted @ 2020-04-06 13:24 嘣嘣嚓 阅读(2624) 评论(0) 推荐(0) 编辑

导航