kafka - 随笔分类(第2页) - 哥不是小萝莉

Kafka消费与心跳机制

摘要：1.概述最近有同学咨询Kafka的消费和心跳机制，今天笔者将通过这篇博客来逐一介绍这些内容。 2.内容 2.1 Kafka消费首先，我们来看看消费。Kafka提供了非常简单的消费API，使用者只需初始化Kafka的Broker Server地址，然后实例化KafkaConsumer类即可拿到To 阅读全文

posted @ 2020-09-28 08:35 哥不是小萝莉阅读(6110) 评论(0) 推荐(2)

如何构建一个生产环境的推荐系统

摘要：1.概述前面介绍过什么是推荐系统，以及推荐系统中的用例，比如基于用户的协同过滤来构建推荐系统。今天给大家介绍如何构建一个生产环境的推荐系统。 2.内容现在互联网上的内容很多，我们可能每天都会接受来自不同消息。例如，电商网站、阅读博客、各类新闻文章等。但是，这些消息并不是所有的内容你都感兴趣，可能阅读全文

posted @ 2020-08-17 08:30 哥不是小萝莉阅读(1996) 评论(0) 推荐(2)

Kafka Eagle V2.0.0新版预览

摘要：1.概述 Kafka Eagle是一款用于管理Kafka的监控系统，且完全开源。当前Kafka Eagle发布了2.0.0版本。今天笔者就为大家来介绍一下2.0.0更新了哪些功能。官网地址：http://www.kafka-eagle.org/ 开源地址：https://github.com/sm 阅读全文

posted @ 2020-07-13 09:16 哥不是小萝莉阅读(3545) 评论(12) 推荐(3)

基于用户的协同过滤来构建推荐系统

摘要：1.概述之前介绍了如何构建一个推荐系统，今天给大家介绍如何基于用户的协同过滤来构建推荐的实战篇。 2.内容协同过滤技术在推荐系统中应用的比较广泛，它是一个快速发展的研究领域。它比较常用的两种方法是基于内存（Memory-Based）和基于模型（Model-Based）。基于内存：主要通过计算近阅读全文

posted @ 2020-06-25 13:54 哥不是小萝莉阅读(2387) 评论(1) 推荐(2)

Kafka SSL安装与配置

摘要：1.概述最近有同学咨询说，Kafka的SSL安全认证如何安装与使用？今天笔者将通过以下几个方面来介绍Kafka的SSL： Kafka 权限介绍 Kafka SSL的安装与使用 Kafka Eagle中如何配置SSL？ 2.内容 2.1 什么是Kafka权限认证？在Kafka 0.9.0.0之后，阅读全文

posted @ 2020-05-24 13:33 哥不是小萝莉阅读(10452) 评论(0) 推荐(3)

如何构建推荐系统

摘要：1.概述最近有被咨询到一些关于推荐系统的问题，今天笔者将为大家分享一些关于如何构建一个推荐系统。 2.内容 2.1 什么是推荐系统？推荐系统是一种信息过滤系统，它旨在预测用户对某项商品的评价。然后，此预测的评分用于向用户推荐商品。预测评分较高的商品将推荐给用户，这个推荐系统用于推荐范围广泛的项目阅读全文

posted @ 2020-04-19 16:12 哥不是小萝莉阅读(3577) 评论(7) 推荐(12)

Kafka网络模型和通信流程剖析

摘要：1.概述最近有同学在学习Kafka的网络通信这块内容时遇到一些疑问，关于网络模型和通信流程的相关内容，这里笔者将通过这篇博客为大家来剖析一下这部分内容。 2.内容 Kafka系统作为一个Message Queue，涉及到的网络通信主要包含以下两个方面： Pull：Consumer从消息队列中拉取消阅读全文

posted @ 2020-02-09 14:41 哥不是小萝莉阅读(4835) 评论(0) 推荐(3)

Kafka日志压缩剖析

摘要：1.概述最近有些同学在学习Kafka时，问到Kafka的日志压缩（Log Compaction）问题，对于Kafka的日志压缩有些疑惑，今天笔者就为大家来剖析一下Kafka的日志压缩的相关内容。 2.内容 2.1 日志压缩是什么？ Kafka是一个基于Log的流处理系统，一个Topic可以有若干个阅读全文

posted @ 2020-01-19 10:01 哥不是小萝莉阅读(5107) 评论(1) 推荐(2)

Kafka Eagle安装详情及问题解答

摘要：1.概述最近有很多同学给笔者留言，说在安装Kafka Eagle的时候，会遇到一些问题，请教如何解决？今天笔者就在这里总结一下安装步骤，和一些安装的注意事项，以及解决方式。 2.内容在安装Kafka Eagle之前，可能新接触的同学对Kafka Eagle不太了解，那我们现在简要介绍一下Kafk 阅读全文

posted @ 2019-12-28 03:22 哥不是小萝莉阅读(12115) 评论(28) 推荐(6)

Kafka幂等性原理及实现剖析

摘要：1.概述最近和一些同学交流的时候反馈说，在面试Kafka时，被问到Kafka组件组成部分、API使用、Consumer和Producer原理及作用等问题都能详细作答。但是，问到一个平时不注意的问题，就是Kafka的幂等性，被卡主了。那么，今天笔者就为大家来剖析一下Kafka的幂等性原理及实现。 2 阅读全文

posted @ 2019-11-24 15:37 哥不是小萝莉阅读(30783) 评论(3) 推荐(7)

HBase数据迁移到Kafka实战

摘要：1.概述在实际的应用场景中，数据存储在HBase集群中，但是由于一些特殊的原因，需要将数据从HBase迁移到Kafka。正常情况下，一般都是源数据到Kafka，再有消费者处理数据，将数据写入HBase。但是，如果逆向处理，如何将HBase的数据迁移到Kafka呢？今天笔者就给大家来分享一下具体的实阅读全文

posted @ 2019-09-15 12:04 哥不是小萝莉阅读(2942) 评论(0) 推荐(1)

Kafka SCRAM和PLAIN实战

摘要：1.概述目前Kafka ACL支持多种权限认证，今天笔者给大家介绍一下SCRAM和PLAIN的权限认证。验证环境如下： JDK：1.8 Kafka：2.3.0 Kafka Eagle：1.3.8 2.内容 2.1 PLAIN认证首先，在$KAFAK_HOME/config目录新建一个文本文件，名阅读全文

posted @ 2019-08-24 14:39 哥不是小萝莉阅读(8887) 评论(1) 推荐(1)

Kafka Eagle V1.3.4更新预览

摘要：1.概述 Kafka Eagle是一款开源的Kafka集群监控系统，源代码托管在Github。目前Kafka Eagle已更新到V1.3.4版本，域名已经统一更新为http://www.kafka-eagle.org/，之前的下载地址和官网使用手册地址均已替换，例如http://download.s 阅读全文

posted @ 2019-07-14 21:13 哥不是小萝莉阅读(3013) 评论(11) 推荐(1)

万亿数据下Hadoop的核心竞争力

摘要：1.前言在大数据时代，Hadoop有着得天独厚的优势。然而，每个企业的技术储备和需求特点不同，他们希望从海量的客户数据中挖掘真正的商业价值，像Google、Facebook、Twitter等这样的企业更是Hadoop的最早获益者。那么，今天我们就来聊一聊，万亿数据下Hadoop的核心竞争力。 2. 阅读全文

posted @ 2019-06-17 09:19 哥不是小萝莉阅读(1693) 评论(0) 推荐(4)

基于Kafka的实时计算引擎如何选择？Flink or Spark？

摘要：1.前言目前实时计算的业务场景越来越多，实时计算引擎技术及生态也越来越成熟。以Flink和Spark为首的实时计算引擎，成为实时计算场景的重点考虑对象。那么，今天就来聊一聊基于Kafka的实时计算引擎如何选择？Flink or Spark？ 2.为何需要实时计算？根据IBM的统计报告显示，过去两阅读全文

posted @ 2019-06-03 09:13 哥不是小萝莉阅读(7861) 评论(0) 推荐(2)

Kafka应用实践与生态集成

摘要：1.前言 Apache Kafka发展至今，已经是一个很成熟的消息队列组件了，也是大数据生态圈中不可或缺的一员。Apache Kafka社区非常的活跃，通过社区成员不断的贡献代码和迭代项目，使得Apache Kafka功能越发丰富、性能越发稳定，截止本篇博客Apache Kafka发布了V2.2.0 阅读全文

posted @ 2019-05-26 23:48 哥不是小萝莉阅读(2644) 评论(1) 推荐(2)

Flink生成Parquet格式文件实战

摘要：1.概述在流数据应用场景中，往往会通过Flink消费Kafka中的数据，然后将这些数据进行结构化到HDFS上，再通过Hive加载这些文件供后续业务分析。今天笔者为大家分析如何使用Flink消费Kafka的数据后，将消费后的数据结构化到Hive数据仓库中。 2.内容 Hive能够识别很多类型的文件，阅读全文

posted @ 2019-02-24 16:47 哥不是小萝莉阅读(13012) 评论(3) 推荐(2)

HBase2实战：HBase Flink和Kafka整合

摘要：1.概述 Apache官方发布HBase2已经有一段时间了，HBase2中包含了许多个Features，从官方JIRA来看，大约有4500+个ISSUES（查看地址），从版本上来看是一个非常大的版本了。本篇博客将为大家介绍HBase2的新特性，以及如何在实战中与Flink、Kafka等组件进行整合。阅读全文

posted @ 2019-01-09 18:08 哥不是小萝莉阅读(10326) 评论(0) 推荐(1)

Kafka性能测试实例

摘要：1.概述在分布式实时数据流场景下，随着数据量的增长，对Kafka集群的性能和稳定性的要求也很高。本篇博客将从生产者和消费者两方面来做性能测试，针对具体的业务和数据量，来调优Kafka集群。 2.内容 2.1 测试环境本次测试的环境信息由三台物理机组成，具体信息如下所示： 2.2 测试工具 Kaf 阅读全文

posted @ 2018-12-09 22:37 哥不是小萝莉阅读(23522) 评论(2) 推荐(4)

使用Flume消费Kafka数据到HDFS

摘要：1.概述对于数据的转发，Kafka是一个不错的选择。Kafka能够装载数据到消息队列，然后等待其他业务场景去消费这些数据，Kafka的应用接口API非常的丰富，支持各种存储介质，例如HDFS、HBase等。如果不想使用Kafka API编写代码去消费Kafka Topic，也是有组件可以去集成消费阅读全文

posted @ 2018-11-19 17:12 哥不是小萝莉阅读(21231) 评论(0) 推荐(1)

哥不是小萝莉

随笔分类 - kafka

公告