java - 随笔分类(第2页) - 哥不是小萝莉

Kafka SSL安装与配置

摘要：1.概述最近有同学咨询说，Kafka的SSL安全认证如何安装与使用？今天笔者将通过以下几个方面来介绍Kafka的SSL： Kafka 权限介绍 Kafka SSL的安装与使用 Kafka Eagle中如何配置SSL？ 2.内容 2.1 什么是Kafka权限认证？在Kafka 0.9.0.0之后，阅读全文

posted @ 2020-05-24 13:33 哥不是小萝莉阅读(10064) 评论(0) 推荐(3) 编辑

Flink消费Kafka到HDFS实现及详解

摘要：1.概述最近有同学留言咨询，Flink消费Kafka的一些问题，今天笔者将用一个小案例来为大家介绍如何将Kafka中的数据，通过Flink任务来消费并存储到HDFS上。 2.内容这里举个消费Kafka的数据的场景。比如，电商平台、游戏平台产生的用户数据，入库到Kafka中的Topic进行存储，然阅读全文

posted @ 2020-03-15 18:26 哥不是小萝莉阅读(20164) 评论(2) 推荐(2) 编辑

Kafka网络模型和通信流程剖析

摘要：1.概述最近有同学在学习Kafka的网络通信这块内容时遇到一些疑问，关于网络模型和通信流程的相关内容，这里笔者将通过这篇博客为大家来剖析一下这部分内容。 2.内容 Kafka系统作为一个Message Queue，涉及到的网络通信主要包含以下两个方面： Pull：Consumer从消息队列中拉取消阅读全文

posted @ 2020-02-09 14:41 哥不是小萝莉阅读(4480) 评论(0) 推荐(3) 编辑

Kafka日志压缩剖析

摘要：1.概述最近有些同学在学习Kafka时，问到Kafka的日志压缩（Log Compaction）问题，对于Kafka的日志压缩有些疑惑，今天笔者就为大家来剖析一下Kafka的日志压缩的相关内容。 2.内容 2.1 日志压缩是什么？ Kafka是一个基于Log的流处理系统，一个Topic可以有若干个阅读全文

posted @ 2020-01-19 10:01 哥不是小萝莉阅读(4931) 评论(1) 推荐(2) 编辑

Kafka Eagle安装详情及问题解答

摘要：1.概述最近有很多同学给笔者留言，说在安装Kafka Eagle的时候，会遇到一些问题，请教如何解决？今天笔者就在这里总结一下安装步骤，和一些安装的注意事项，以及解决方式。 2.内容在安装Kafka Eagle之前，可能新接触的同学对Kafka Eagle不太了解，那我们现在简要介绍一下Kafk 阅读全文

posted @ 2019-12-28 03:22 哥不是小萝莉阅读(11944) 评论(28) 推荐(6) 编辑

Kafka幂等性原理及实现剖析

摘要：1.概述最近和一些同学交流的时候反馈说，在面试Kafka时，被问到Kafka组件组成部分、API使用、Consumer和Producer原理及作用等问题都能详细作答。但是，问到一个平时不注意的问题，就是Kafka的幂等性，被卡主了。那么，今天笔者就为大家来剖析一下Kafka的幂等性原理及实现。 2 阅读全文

posted @ 2019-11-24 15:37 哥不是小萝莉阅读(29448) 评论(3) 推荐(7) 编辑

Hive On HBase实战

摘要：1.概述 HBase是一款非关系型、分布式的KV存储数据库。用来存储海量的数据，用于键值对操作。目前HBase是原生是不包含SQL操作，虽然说Apache Phoenix可以用来操作HBase表，但是需要集成对应的Phoenix依赖包到HBase集群中，同时需要编写对应的Schema才能实现SQL操阅读全文

posted @ 2019-10-27 13:47 哥不是小萝莉阅读(5737) 评论(0) 推荐(2) 编辑

HBase数据迁移到Kafka实战

摘要：1.概述在实际的应用场景中，数据存储在HBase集群中，但是由于一些特殊的原因，需要将数据从HBase迁移到Kafka。正常情况下，一般都是源数据到Kafka，再有消费者处理数据，将数据写入HBase。但是，如果逆向处理，如何将HBase的数据迁移到Kafka呢？今天笔者就给大家来分享一下具体的实阅读全文

posted @ 2019-09-15 12:04 哥不是小萝莉阅读(2886) 评论(0) 推荐(1) 编辑

Kafka SCRAM和PLAIN实战

摘要：1.概述目前Kafka ACL支持多种权限认证，今天笔者给大家介绍一下SCRAM和PLAIN的权限认证。验证环境如下： JDK：1.8 Kafka：2.3.0 Kafka Eagle：1.3.8 2.内容 2.1 PLAIN认证首先，在$KAFAK_HOME/config目录新建一个文本文件，名阅读全文

posted @ 2019-08-24 14:39 哥不是小萝莉阅读(8605) 评论(1) 推荐(1) 编辑

基于Kafka的实时计算引擎如何选择？Flink or Spark？

摘要：1.前言目前实时计算的业务场景越来越多，实时计算引擎技术及生态也越来越成熟。以Flink和Spark为首的实时计算引擎，成为实时计算场景的重点考虑对象。那么，今天就来聊一聊基于Kafka的实时计算引擎如何选择？Flink or Spark？ 2.为何需要实时计算？根据IBM的统计报告显示，过去两阅读全文

posted @ 2019-06-03 09:13 哥不是小萝莉阅读(7671) 评论(0) 推荐(2) 编辑

Hadoop3.2.0使用详解

摘要：1.概述 Hadoop3已经发布很久了，迭代集成的一些新特性也是很有用的。截止本篇博客书写为止，Hadoop发布了3.2.0。接下来，笔者就为大家分享一下在使用Hadoop3中遇到到一些问题，以及解决方法。 2.内容 2.1 基础软件包在使用这些组件时，我们需要做一些准备工作，内容如下： Hado 阅读全文

posted @ 2019-04-23 00:19 哥不是小萝莉阅读(14152) 评论(0) 推荐(2) 编辑

Flink生成Parquet格式文件实战

摘要：1.概述在流数据应用场景中，往往会通过Flink消费Kafka中的数据，然后将这些数据进行结构化到HDFS上，再通过Hive加载这些文件供后续业务分析。今天笔者为大家分析如何使用Flink消费Kafka的数据后，将消费后的数据结构化到Hive数据仓库中。 2.内容 Hive能够识别很多类型的文件，阅读全文

posted @ 2019-02-24 16:47 哥不是小萝莉阅读(12821) 评论(3) 推荐(2) 编辑

Kafka性能测试实例

摘要：1.概述在分布式实时数据流场景下，随着数据量的增长，对Kafka集群的性能和稳定性的要求也很高。本篇博客将从生产者和消费者两方面来做性能测试，针对具体的业务和数据量，来调优Kafka集群。 2.内容 2.1 测试环境本次测试的环境信息由三台物理机组成，具体信息如下所示： 2.2 测试工具 Kaf 阅读全文

posted @ 2018-12-09 22:37 哥不是小萝莉阅读(23373) 评论(2) 推荐(4) 编辑

使用Flume消费Kafka数据到HDFS

摘要：1.概述对于数据的转发，Kafka是一个不错的选择。Kafka能够装载数据到消息队列，然后等待其他业务场景去消费这些数据，Kafka的应用接口API非常的丰富，支持各种存储介质，例如HDFS、HBase等。如果不想使用Kafka API编写代码去消费Kafka Topic，也是有组件可以去集成消费阅读全文

posted @ 2018-11-19 17:12 哥不是小萝莉阅读(21076) 评论(0) 推荐(1) 编辑

Kafka并不难学

摘要：1.为什么写这本书？我建立了一个qq群，有很多人在群里面学习和交流，经常有人问我一些Kafka的知识，我可以感受他们对技术的热情，这是一群刚走出校门，或者工作经验较少，又或是一些转型的开发新人，他们希望通过自学提高自己的开发能力，但是又没有学习渠道和正确的方法，于是我写了这本书。 2.开始写作 2 阅读全文

posted @ 2018-11-10 17:25 哥不是小萝莉阅读(3219) 评论(4) 推荐(1) 编辑

Kafka控制器选举流程剖析

摘要：1.概述平时在使用Kafka的时候，可能关注的更多的是Kafka系统层面的。今天来给大家剖析一下Kafka的控制器，了解一下Kafka控制器的选举流程。 2.内容 Kafka控制器，其实就是一个Kafka系统的Broker。它除了具有一般Broker的功能之外，还具有选举主题分区Leader节点的阅读全文

posted @ 2018-10-21 21:15 哥不是小萝莉阅读(5298) 评论(3) 推荐(1) 编辑

HBase Region合并分析

摘要：1.概述 HBase中表的基本单位是Region，日常在调用HBase API操作一个表时，交互的数据也会以Region的形式进行呈现。一个表可以有若干个Region，今天笔者就来和大家分享一下Region合并的一些问题和解决方法。 2.内容在分析合并Region之前，我们先来了解一下Region 阅读全文

posted @ 2018-09-15 00:59 哥不是小萝莉阅读(11914) 评论(0) 推荐(3) 编辑

HBase BulkLoad批量写入数据实战

摘要：1.概述在进行数据传输中，批量加载数据到HBase集群有多种方式，比如通过HBase API进行批量写入数据、使用Sqoop工具批量导数到HBase集群、使用MapReduce批量导入等。这些方式，在导入数据的过程中，如果数据量过大，可能耗时会比较严重或者占用HBase集群资源较多（如磁盘IO、H 阅读全文

posted @ 2018-08-19 17:29 哥不是小萝莉阅读(37214) 评论(0) 推荐(4) 编辑

HBase查询优化之Short-Circuit Local Reads

摘要：1.概述在《HBase查询优化》一文中，介绍了基于HBase层面的读取优化。由于HBase的实际数据是以HFile的形式，存储在HDFS上。那么，HDFS层面也有它自己的优化点，即：Short-Circuit Local Reads。本篇博客笔者将从HDFS层面来进行优化，从而间接的提升HBase 阅读全文

posted @ 2018-08-12 13:45 哥不是小萝莉阅读(4438) 评论(0) 推荐(2) 编辑

HBase查询优化

摘要：1.概述 HBase是一个实时的非关系型数据库，用来存储海量数据。但是，在实际使用场景中，在使用HBase API查询HBase中的数据时，有时会发现数据查询会很慢。本篇博客将从客户端优化和服务端优化两个方面来介绍，如何提高查询HBase的效率。 2.内容这里，我们先给大家介绍如何从客户端优化查询阅读全文

posted @ 2018-08-05 13:54 哥不是小萝莉阅读(22739) 评论(2) 推荐(3) 编辑

哥不是小萝莉

随笔分类 - java

公告

搜索

最新随笔

积分与排名

随笔分类 (351)

随笔档案 (195)

阅读排行榜

评论排行榜

推荐排行榜

最新评论