会员
周边
新闻
博问
闪存
赞助商
YouClaw
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
哥不是小萝莉
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
3
4
5
6
7
8
9
10
11
···
21
下一页
2021年2月28日
如何系统的了解Kafka
摘要: 1.概述 在大数据的浪潮下,时时刻刻都会产生大量的数据。比如社交媒体、博客、电子商务等等,这些数据会以不同的类型存储在不同的平台里面。为了执行ETL(提取、转换、加载)操作,需要一个消息中间件系统,该系统应该是异步和低耦合的,即来自各种存储系统(如HDFS、Cassandra、RDBMS等)的数据可
阅读全文
posted @ 2021-02-28 16:12 哥不是小萝莉
阅读(1221)
评论(0)
推荐(3)
2021年1月31日
Kafka Fetch Session剖析
摘要: 1.概述 最近有同学留言在使用Kafka的过程中遇到一些问题,比如在拉取的Topic中的数据时会抛出一些异常,今天笔者就为大家来分享一下Kafka的Fetch流程。 2.内容 2.1 背景 首先,我们来了解一下,Fetch Session的目标。Kafka在1.1.0以后的版本中优化了Fetch问题
阅读全文
posted @ 2021-01-31 14:14 哥不是小萝莉
阅读(7218)
评论(0)
推荐(1)
2020年12月26日
Kafka数据每5分钟同步到Hive
摘要: 1.概述 最近有同学留言咨询Kafka数据落地到Hive的一些问题,今天笔者将为大家来介绍一种除Flink流批一体以外的方式(流批一体下次再单独写一篇给大家分享)。 2.内容 首先,我们简单来描述一下数据场景,比如有这样一个数据场景,有一批实时流数据实时写入Kafka,然后需要对Topic中的数据进
阅读全文
posted @ 2020-12-26 17:03 哥不是小萝莉
阅读(7628)
评论(2)
推荐(3)
2020年11月30日
Kafka分布式查询引擎
摘要: 1.概述 Kafka是一个分布式消息中间件系统,里面存储着实际场景中的数据。Kafka原生是不支持点查询的,如果我们想对存储在Topic中的数据进行查询,可能需要对Topic中的数据进行消费落地,然后构建索引(或者数据落地到自带所以的存储系统中,例如HBase、Hive等)。今天,笔者就为大家来介绍
阅读全文
posted @ 2020-11-30 00:24 哥不是小萝莉
阅读(1207)
评论(4)
推荐(1)
2020年10月30日
协同过滤在推荐系统中的应用
摘要: 1.概述 前面的博客介绍过如何构建一个推荐系统,以及简要的介绍了协同过滤的实现。本篇博客,笔者将介绍协同过滤在推荐系统的应用。推荐系统是大数据和机器学习中最常见、最容易理解的应用之一。其实,在日常的生活当中,我们会频繁的遇到推荐的场景 ,比如你在电商网站购买商品、使用视频App观看视频、在手机上下载
阅读全文
posted @ 2020-10-30 00:58 哥不是小萝莉
阅读(1290)
评论(0)
推荐(2)
2020年9月28日
Kafka消费与心跳机制
摘要: 1.概述 最近有同学咨询Kafka的消费和心跳机制,今天笔者将通过这篇博客来逐一介绍这些内容。 2.内容 2.1 Kafka消费 首先,我们来看看消费。Kafka提供了非常简单的消费API,使用者只需初始化Kafka的Broker Server地址,然后实例化KafkaConsumer类即可拿到To
阅读全文
posted @ 2020-09-28 08:35 哥不是小萝莉
阅读(6094)
评论(0)
推荐(2)
2020年8月17日
如何构建一个生产环境的推荐系统
摘要: 1.概述 前面介绍过什么是推荐系统,以及推荐系统中的用例,比如基于用户的协同过滤来构建推荐系统。今天给大家介绍如何构建一个生产环境的推荐系统。 2.内容 现在互联网上的内容很多,我们可能每天都会接受来自不同消息。例如,电商网站、阅读博客、各类新闻文章等。但是,这些消息并不是所有的内容你都感兴趣,可能
阅读全文
posted @ 2020-08-17 08:30 哥不是小萝莉
阅读(1993)
评论(0)
推荐(2)
2020年7月13日
Kafka Eagle V2.0.0新版预览
摘要: 1.概述 Kafka Eagle是一款用于管理Kafka的监控系统,且完全开源。当前Kafka Eagle发布了2.0.0版本。今天笔者就为大家来介绍一下2.0.0更新了哪些功能。 官网地址:http://www.kafka-eagle.org/ 开源地址:https://github.com/sm
阅读全文
posted @ 2020-07-13 09:16 哥不是小萝莉
阅读(3544)
评论(12)
推荐(3)
2020年6月25日
基于用户的协同过滤来构建推荐系统
摘要: 1.概述 之前介绍了如何构建一个推荐系统,今天给大家介绍如何基于用户的协同过滤来构建推荐的实战篇。 2.内容 协同过滤技术在推荐系统中应用的比较广泛,它是一个快速发展的研究领域。它比较常用的两种方法是基于内存(Memory-Based)和基于模型(Model-Based)。 基于内存:主要通过计算近
阅读全文
posted @ 2020-06-25 13:54 哥不是小萝莉
阅读(2383)
评论(1)
推荐(2)
2020年5月24日
Kafka SSL安装与配置
摘要: 1.概述 最近有同学咨询说,Kafka的SSL安全认证如何安装与使用?今天笔者将通过以下几个方面来介绍Kafka的SSL: Kafka 权限介绍 Kafka SSL的安装与使用 Kafka Eagle中如何配置SSL? 2.内容 2.1 什么是Kafka权限认证? 在Kafka 0.9.0.0之后,
阅读全文
posted @ 2020-05-24 13:33 哥不是小萝莉
阅读(10440)
评论(0)
推荐(3)
上一页
1
···
3
4
5
6
7
8
9
10
11
···
21
下一页
公告