Kafka生产者与消费者

1. kafka客户端——生产者

1. pom配置

    <properties>
        <lombok.version>1.16.18</lombok.version>
        <fastjson.version>1.2.66</fastjson.version>
        <kafka.version>2.4.1</kafka.version>
    </properties>


    <dependencies>
        <dependency>
            <groupId>org.apache.kafka</groupId>
            <artifactId>kafka-clients</artifactId>
             <version>${kafka.version}</version>
        </dependency>
        <dependency>
            <groupId>com.alibaba</groupId>
            <artifactId>fastjson</artifactId>
            <version>${fastjson.version}</version>
        </dependency>
        <dependency>
            <groupId>org.projectlombok</groupId>
            <artifactId>lombok</artifactId>
            <version>${lombok.version}</version>
            <optional>true</optional>
        </dependency>

    </dependencies>

2. 生产者发送消息的基本实现

package hcx.kafka.core;

import com.alibaba.fastjson.JSON;
import hcx.kafka.entities.Order;
import org.apache.kafka.clients.producer.*;
import org.apache.kafka.common.serialization.StringSerializer;

import java.util.Properties;
import java.util.concurrent.CountDownLatch;
import java.util.concurrent.ExecutionException;
import java.util.concurrent.Future;
import java.util.concurrent.TimeUnit;

public class MyProducer {
 private final static String TOPIC_NAME="my-replicated-topic";//主题名称
 public static void main(String[] args) throws ExecutionException, InterruptedException {
     Properties props = new Properties();
     props.put(ProducerConfig.BOOTSTRAP_SERVERS_CONFIG,"10.1.48.214:9092,10.1.48.214:9093,10.1.48.214:9094");//设置集群

     //把发送的key从字符串序列化为字节数组
     props.put(ProducerConfig.KEY_SERIALIZER_CLASS_CONFIG, StringSerializer.class.getName());

     //把发送的value从字符串序列化为字节数组
     props.put(ProducerConfig.VALUE_SERIALIZER_CLASS_CONFIG,StringSerializer.class.getName());

     //发消息的客户端初始化
     Producer<String,String> producer = new KafkaProducer<String, String>(props);

     //要发送5条消息
     final int msgNum=5;
     final CountDownLatch countDownLatch=new CountDownLatch(msgNum);

     for (int i=1;i<=5;i++){
         Order order = new Order((long)i,i);

//            //未指定发送分区，具体发送的分区计算公式：hash(key)%partitionNum
//            ProducerRecord<String,String> producerRecord=new ProducerRecord<String, String>(TOPIC_NAME,String.valueOf(order.getOrderId()), JSON.toJSONString(order));
//
//            //3.3 同步方式发送消息
//            Future<RecordMetadata> future = producer.send(producerRecord);
//            RecordMetadata metadata = future.get();
//            System.out.println("同步方式发送消息结果：" + "topic-" +metadata.topic() + "|partition-"+ metadata.partition() + "|offset-" +metadata.offset());

         //指定发送分区
         ProducerRecord<String, String> producerRecord = new ProducerRecord<String, String>(TOPIC_NAME, 0 , String.valueOf(order.getOrderId()),JSON.toJSONString(order));
         //异步回调方式发送消息
         producer.send(producerRecord, new Callback() {
             public void onCompletion(RecordMetadata metadata, Exception exception) {
                 if (exception != null) {
                     System.err.println("发送消息失败：" +
                             exception.getStackTrace());
                 }
                 if (metadata != null) {
                     System.out.println("异步方式发送消息结果：" + "topic-" +metadata.topic() + "|partition-"+ metadata.partition() + "|offset-" + metadata.offset());
                 }
                 countDownLatch.countDown();
             }
         });
     }
     countDownLatch.await(5,TimeUnit.SECONDS);
//        TimeUnit.SECONDS.sleep(10);//方便异步测试
     //4.关闭资源
     producer.close();
 }
}

3.发送消息到指定分区上

 ProducerRecord<String, String> producerRecord = new ProducerRecord<String, String>(TOPIC_NAME, 0 , String.valueOf(order.getOrderId()),JSON.toJSONString(order));

4. 未指定分区

//未指定发送分区，具体发送的分区计算公式：hash(key)%partitionNum
ProducerRecord<String,String> producerRecord=new ProducerRecord<String, String>(TOPIC_NAME,String.valueOf(order.getOrderId()), JSON.toJSONString(order));

5. 同步发送

           //3.3 同步方式发送消息
           Future<RecordMetadata> future = producer.send(producerRecord);
           RecordMetadata metadata = future.get();
           System.out.println("同步方式发送消息结果：" + "topic-" +metadata.topic() + "|partition-"+ metadata.partition() + "|offset-" +metadata.offset());

6. 异步发送消息

			//要发送5条消息
            final int msgNum=5;
            final CountDownLatch countDownLatch=new CountDownLatch(msgNum);
			for (int i=1;i<=5;i++){
            Order order = new Order((long)i,i);
			//指定发送分区
            ProducerRecord<String, String> producerRecord = new ProducerRecord<String, String>(TOPIC_NAME, 0 , String.valueOf(order.getOrderId()),JSON.toJSONString(order));
            //异步回调方式发送消息
            producer.send(producerRecord, new Callback() {
                public void onCompletion(RecordMetadata metadata, Exception exception) {
                    if (exception != null) {
                        System.err.println("发送消息失败：" +
                                exception.getStackTrace());
                    }
                    if (metadata != null) {
                        System.out.println("异步方式发送消息结果：" + "topic-" +metadata.topic() + "|partition-"+ metadata.partition() + "|offset-" + metadata.offset());
                    }
                    countDownLatch.countDown();
                }
            });
        }

7. 关于生产者的ack设置

同步场景下会有三种情况：
- （ 1 ）acks=0：表示producer不需要等待任何broker确认收到消息的回复，就可以继续发送下一条消息。性能最高，但是最容易丢消息。
- （ 2 ）acks=1：至少要等待leader已经成功将数据写入本地log，但是不需要等待所有follower是否成功写入。就可以继续发送下一条消息。这种情况下，如果follower没有成功备份数据，而此时leader又挂掉，则消息会丢失。
- （ 3 ）acks=-1或all：需要等待 min.insync.replicas(默认为 1 ，推荐配置大于等于2) 这个参数配置的副本个数都成功写入日志，这种策略会保证只要有一个备份存活就不会丢失数据。这是最强的数据保证。一般除非是金融级别，或跟钱打交道的场景才会使用这种配置。

props.put(ProducerConfig.ACKS_CONFIG, "1"); //设置ack

8. 细节部分

发送会默认会重试 3 次，每次间隔100ms
发送的消息会先进入到本地缓冲区（32mb），kakfa会跑一个线程，该线程去缓冲区中取16k的数据，发送到kafka，如果到 10 毫秒数据没取满16k，也会发送一次。

2. kafaka客户端——消费者

1. 消费者的基本实现

import org.apache.kafka.clients.consumer.ConsumerConfig;
import org.apache.kafka.clients.consumer.ConsumerRecord;
import org.apache.kafka.clients.consumer.ConsumerRecords;
import org.apache.kafka.clients.consumer.KafkaConsumer;
import org.apache.kafka.common.serialization.StringDeserializer;

import java.time.Duration;
import java.util.Arrays;
import java.util.Properties;

public class MyConsumer {
    private final static String TOPIC_NAME = "my-replicated-topic";
    private final static String CONSUMER_GROUP_NAME = "testGroup";

    public static void main(String[] args) {
        Properties props = new Properties();
        props.put(ConsumerConfig.BOOTSTRAP_SERVERS_CONFIG,"10.1.48.214:9092,10.1.48.214:9093,10.1.48.214:9094");
        // 消费分组名
        props.put(ConsumerConfig.GROUP_ID_CONFIG, CONSUMER_GROUP_NAME);
        props.put(ConsumerConfig.KEY_DESERIALIZER_CLASS_CONFIG, StringDeserializer.class.getName());
        props.put(ConsumerConfig.VALUE_DESERIALIZER_CLASS_CONFIG,StringDeserializer.class.getName());
        //创建一个消费者的客户端
        KafkaConsumer<String, String> consumer = new KafkaConsumer<String,String>(props);
        // 消费者订阅主题列表
        consumer.subscribe(Arrays.asList(TOPIC_NAME));

        while (true) {
            /*
             * poll() API 是拉取消息的⻓轮询
             */
            ConsumerRecords<String, String> records =consumer.poll(Duration.ofMillis( 1000 ));
            for (ConsumerRecord<String, String> record : records) {
                System.out.printf("收到消息：partition = %d,offset = %d, key =%s, value = %s%n", record.partition(),record.offset(), record.key(), record.value());
            }
        }
    }
}

2. 自动提交offset

设置自动提交参数 - 默认

// 是否自动提交offset，默认就是true
props.put(ConsumerConfig.ENABLE_AUTO_COMMIT_CONFIG, "true");
// 自动提交offset的间隔时间
props.put(ConsumerConfig.AUTO_COMMIT_INTERVAL_MS_CONFIG, "1000");

消费者poll到消息后默认情况下，会自动向broker的_consumer_offsets主题提交当前主题-分区消费的偏移量。
自动提交会丢消息：因为如果消费者还没消费完poll下来的消息就自动提交了偏移量，那么此时消费者挂了，于是下一个消费者会从已提交的offset的下一个位置开始消费消息。之前未被消费的消息就丢失掉了。

3. 手动提交offset

设置手动提交参数 - 默认

props.put(ConsumerConfig.ENABLE_AUTO_COMMIT_CONFIG, "false");

手动同步提交

if (records.count() > 0 ) {
    // 手动同步提交offset，当前线程会阻塞直到offset提交成功
    // 一般使用同步提交，因为提交之后一般也没有什么逻辑代码了
    consumer.commitSync();
}

手动异步提交

if (records.count() > 0 ) {
    // 手动异步提交offset，当前线程提交offset不会阻塞，可以继续处理后面的程序逻辑
    consumer.commitAsync(new OffsetCommitCallback() {
    @Override
    public void onComplete(Map<TopicPartition, OffsetAndMetadata>offsets, Exception exception) {
              if (exception != null) {
                  System.err.println("Commit failed for " + offsets);
                  System.err.println("Commit failed exception: " +exception.getStackTrace());
              }
           }
      });
}

4. 消费者的pool消息过程

消费者建立了与broker之间的⻓连接，开始poll消息。

默认一次poll 500条消息

props.put(ConsumerConfig.MAX_POLL_RECORDS_CONFIG, 500 );

可以根据消费速度的快慢来设置，因为如果两次poll的时间如果超出了30s的时间间隔，kafka会认为其消费能力过弱，将其踢出消费组。将分区分配给其他消费者。

可以通过ConsumerConfig.MAX_POLL_INTERVAL_MS_CONFIG进行设置：
```
props.put(ConsumerConfig.MAX_POLL_INTERVAL_MS_CONFIG, 30*1000 );
```
如果每隔1s内没有poll到任何消息，则继续去poll消息，循环往复，直到poll到消息。如果超出了1s，则此次⻓轮询结束
```
ConsumerRecords<String, String> records =consumer.poll(Duration.ofMillis( 1000 ));
```

消费者发送心跳的时间间隔

props.put(ConsumerConfig.HEARTBEAT_INTERVAL_MS_CONFIG, 1000 );

kafka如果超过 10 秒没有收到消费者的心跳，则会把消费者踢出消费组，进行rebalance，把分区分配给其他消费者。
```
props.put(ConsumerConfig.SESSION_TIMEOUT_MS_CONFIG, 10 * 1000 );
```

5 .指定分区消费

consumer.assign(Arrays.asList(new TopicPartition(TOPIC_NAME, 0 )));

6 .指定回溯消费

consumer.assign(Arrays.asList(new TopicPartition(TOPIC_NAME, 0 )));
consumer.seekToBeginning(Arrays.asList(new TopicPartition(TOPIC_NAME,0 )));

7. 指定offset消费

consumer.assign(Arrays.asList(new TopicPartition(TOPIC_NAME, 0 )));
consumer.seek(new TopicPartition(TOPIC_NAME, 0 ), 10 );

8. 指定时间点消费

List<PartitionInfo> topicPartitions =consumer.partitionsFor(TOPIC_NAME);
//从 1 小时前开始消费
long fetchDataTime = new Date().getTime() - 1000 * 60 * 60 ;
Map<TopicPartition, Long> map = new HashMap<>();
for (PartitionInfo par : topicPartitions) {
    map.put(new TopicPartition(TOPIC_NAME, par.partition()),fetchDataTime);
}
Map<TopicPartition, OffsetAndTimestamp> parMap =consumer.offsetsForTimes(map);
for (Map.Entry<TopicPartition, OffsetAndTimestamp> entry :parMap.entrySet()) {
    TopicPartition key = entry.getKey();
    OffsetAndTimestamp value = entry.getValue();
    if (key == null || value == null) continue;
    Long offset = value.offset();
    System.out.println("partition-" + key.partition() +"|offset-" + offset);
    System.out.println();
    //根据消费里的timestamp确定offset
    if (value != null) {
        consumer.assign(Arrays.asList(key));
        consumer.seek(key, offset);
    }
}

9. 新消费组的消费偏移量

当消费主题的是一个新的消费组，或者指定offset的消费方式，offset不存在，那么应该如何消费?

存在两种情况：

latest(默认) ：只消费自己启动之后发送到主题的消息
earliest：第一次从头开始消费，以后按照消费offset记录继续消费，这个需要区别于consumer.seekToBeginning(每次都从头开始消费)

props.put(ConsumerConfig.AUTO_OFFSET_RESET_CONFIG, "earliest");

10. 学习来源

哔哩哔哩：https://www.bilibili.com/video/BV1Xy4y1G7zA

posted @ 2022-08-19 11:23 壶小旭阅读(232) 评论(0) 收藏举报

刷新页面返回顶部

Kafka生产者与消费者

Kafka生产者与消费者

1. kafka客户端——生产者

1. pom配置

2. 生产者发送消息的基本实现

3.发送消息到指定分区上

4. 未指定分区

5. 同步发送

6. 异步发送消息

7. 关于生产者的ack设置

8. 细节部分

2. kafaka客户端——消费者

1. 消费者的基本实现

2. 自动提交offset

3. 手动提交offset

4. 消费者的pool消息过程

5 .指定分区消费

6 .指定回溯消费

7. 指定offset消费

8. 指定时间点消费

9. 新消费组的消费偏移量

10. 学习来源

公告