随笔分类 -  java

Java下的记录
摘要:1.概述 在开发工作当中,消费 Kafka 集群中的消息时,数据的变动是我们所关心的,当业务并不复杂的前提下,我们可以使用 Kafka 提供的命令工具,配合 Zookeeper 客户端工具,可以很方便的完成我们的工作。随着业务的复杂化,Group 和 Topic 的增加,此时我们使用 Kafka 提 阅读全文
posted @ 2016-09-01 13:15 哥不是小萝莉 阅读(48673) 评论(72) 推荐(9) 编辑
摘要:1.概述 Flink 1.1.0 版本已经在官方发布了,官方博客于 2016-08-08 更新了 Flink 1.1.0 的变动。在这 Flink 版本的发布,添加了 SQL 语法这一特性。这对于业务场景复杂,依赖于 SQL 来分析统计数据,算得上是一个不错的福利。加上之前有同学和朋友邮件中提到,F 阅读全文
posted @ 2016-08-10 17:04 哥不是小萝莉 阅读(25448) 评论(2) 推荐(2) 编辑
摘要:1.概述 在如今数据爆炸的时代,企业的数据量与日俱增,大数据产品层出不穷。今天给大家分享一款产品—— Apache Flink,目前,已是 Apache 顶级项目之一。那么,接下来,笔者为大家介绍Flink 的相关内容。 2.内容 2.1 What's Flink Apache Flink 是一个面 阅读全文
posted @ 2016-06-13 15:23 哥不是小萝莉 阅读(33213) 评论(6) 推荐(6) 编辑
摘要:1.概述 上次给大家分享了关于 Kafka SQL 的实现思路,这次给大家分享如何实现 Kafka SQL。要实现 Kafka SQL,在上一篇《Kafka - SQL 引擎分享》中分享了其实现的思路,核心包含数据源的加载,以及 SQL 树的映射。今天笔者给大家分享相关实现的代码。 2.内容 这里, 阅读全文
posted @ 2016-05-09 09:46 哥不是小萝莉 阅读(4683) 评论(3) 推荐(2) 编辑
摘要:1.概述 大多数情况下,我们使用 Kafka 只是作为消息处理。在有些情况下,我们需要多次读取 Kafka 集群中的数据。当然,我们可以通过调用 Kafka 的 API 来完成,但是针对不同的业务需求,我们需要去编写不同的接口,在经过编译,打包,发布等一系列流程。最后才能看到我们预想的结果。那么,我 阅读全文
posted @ 2016-04-14 09:33 哥不是小萝莉 阅读(4952) 评论(1) 推荐(5) 编辑
摘要:1.概述 在 Kafka 中,官方对外提供了两种消费 API,一种是高等级消费 API,另一种是低等级的消费 API。在 《高级消费 API》一文中,介绍了其高级消费的 API 实现。今天给大家介绍另一种消费 API。 2.内容 在使用过 Kafka 的高级消费 API 后,我们知道它是一种高度抽象 阅读全文
posted @ 2016-03-04 10:08 哥不是小萝莉 阅读(4699) 评论(2) 推荐(4) 编辑
摘要:1.概述 在调度 Hadoop 的相关作业时,有以下几种方式: 基于 Linux 系统级别的 Crontab。 Java 应用级别的 Quartz。 第三方的调度系统。 自行开发 Hadoop 应用调度系统。 对于前两种,使用 Crontab 和 Quartz 是基本可以满足业务需求,但有其弊端。在 阅读全文
posted @ 2016-02-15 18:30 哥不是小萝莉 阅读(19388) 评论(3) 推荐(2) 编辑
摘要:1.概述 Apache Kylin是一个开源的分布式分析引擎,提供SQL接口并且用于OLAP业务于Hadoop的大数据集上,该项目由eBay贡献于Apache。2.What is Kylin 在使用一种模型,我们得知道她是干什么的,那么首先来看看Kylin的特性,其内容如下所示:可扩展超快的OL... 阅读全文
posted @ 2016-01-04 16:11 哥不是小萝莉 阅读(3668) 评论(7) 推荐(3) 编辑
摘要:1.概述 在《Hadoop-Drill深度剖析》一文当中,给大家介绍了Drill的相关内容,就实时查询来说,Drill基本能够满足要求,同时还可以做一个简单业务上的聚合,如果在使用Hive做一些简单的业务统计(不涉及多维度,比如CUBE,ROLLUP之类的函数),只是用一些基本的聚合函数或是JOI... 阅读全文
posted @ 2015-12-15 11:08 哥不是小萝莉 阅读(6703) 评论(2) 推荐(4) 编辑
摘要:1.概述 在《Hadoop - 实时查询Drill》一文当中,笔者给大家介绍如何去处理实时查询这样的业务场景,也是简略的提了一下如何去实时查询HDFS,然起相关细节并未说明。今天给大家细说一下相关细节,其中包含:HDFS,Hive以及HBase等内容。2.数据源和文件格式 在使用Drill去做实... 阅读全文
posted @ 2015-11-28 14:20 哥不是小萝莉 阅读(4002) 评论(0) 推荐(3) 编辑
摘要:1.概述 在现实业务当中,存在这样的业务场景,需要实时去查询HDFS上的相关存储数据,普通的查询(如:Hive查询),时延较高。那么,是否存在时延较小的查询组件。在业界目前较为成熟的有Cloudera的Impala,Apache的Drill,Hortonworks的Stinger。本篇博客主要为大... 阅读全文
posted @ 2015-11-24 16:12 哥不是小萝莉 阅读(6387) 评论(5) 推荐(5) 编辑
摘要:1.概述 在Hadoop应用,随着业务指标的迭代,而使其日趋复杂化的时候,管理Hadoop的相关应用会变成一件头疼的事情,如:作业的依赖调度,任务的运行情况的监控,异常问题的排查等,这些问题会是的我们日常的工作变得复杂。那么,在没有条件和精力去开发一套调度系统的情况下,我们去选择一款第三方开源的调... 阅读全文
posted @ 2015-11-15 11:10 哥不是小萝莉 阅读(15031) 评论(0) 推荐(6) 编辑
摘要:1.概述 最近,有小伙伴涉及到源码编译。然而,在编译期间也是遇到各种坑,在求助于搜索引擎,技术博客,也是难以解决自身所遇到的问题。笔者在被询问多次的情况下,今天打算为大家来写一篇文章来剖析下编译的细节,以及遇到编译问题后,应该如何去解决这样类似的问题。因为,编译的问题,对于后期业务拓展,二次开发,... 阅读全文
posted @ 2015-10-29 10:47 哥不是小萝莉 阅读(1949) 评论(0) 推荐(3) 编辑
摘要:1.概述 本课程的视频教程地址:《Kafka实战项目之编码实践》 该课程我以用户实时上报日志案例为基础,带着大家去完成各个KPI的编码工作,实现生产模块、消费模块,数据持久化,以及应用调度等工作, 通过对这一系列流程的演示,让大家能够去掌握Kafka项目的相关编码以及调度流程。下面,我们首先来预... 阅读全文
posted @ 2015-10-15 10:50 哥不是小萝莉 阅读(2904) 评论(3) 推荐(3) 编辑
摘要:1.概述 在接触了第一代MapReduce和第二代MapReduce之后,或许会有这样的疑惑,我们从一些书籍和博客当中获取MapReduce的一些原理和算法,在第一代当中会有JobTrack,TaskTrack之类的术语,在第二代会有ResourceManager,NodeManager,Appli 阅读全文
posted @ 2015-10-13 16:27 哥不是小萝莉 阅读(1693) 评论(2) 推荐(4) 编辑
摘要:1.概述 其实,在从事过调优相关的工作后,会发现其实调优是一项较为复杂的工作。而对于Hadoop这样复杂且庞大的系统来说,调优更是一项巨大的工作,由于Hadoop包含Common、HDFS、MapReduce、YARN等模块,每个模块都有可以根据自身业务进行优化的工作,本篇博客也是针对某些模块进行... 阅读全文
posted @ 2015-10-10 13:52 哥不是小萝莉 阅读(3239) 评论(3) 推荐(3) 编辑
摘要:1.概述 从HDFS的应用层面来看,我们可以非常容易的使用其API来操作HDFS,实现目录的创建、删除,文件的上传下载、删除、追加(Hadoop2.x版本以后开始支持)等功能。然而仅仅局限与代码层面是不够的,了解其实现的具体细节和过程是很有必要的,本文笔者给大家从以下几个方面进行剖析:Create... 阅读全文
posted @ 2015-09-30 15:19 哥不是小萝莉 阅读(1354) 评论(2) 推荐(2) 编辑
摘要:1.概述 JStorm 是一个类似于 Hadoop 的MapReduce的计算系统,它是由Alibaba开源的实时计算模型,它使用Java重写了原生的Storm模型(Clojure和Java混合编写的),并且再原来的基础上做了许多改进。用户只需按照指定的接口实现一个任务,然后将这个任务提交给JSt... 阅读全文
posted @ 2015-09-15 15:14 哥不是小萝莉 阅读(13632) 评论(11) 推荐(2) 编辑
摘要:1.概述 本课程的视频教程地址:《Kafka实战项目之分析与设计》 本课程我通过一个用户实时上报日志案例作为基础,带着大家去分析Kafka这样一个项目的各个环节,从而对项目的整体设计做比较合理的规划,最终让大家能够通过本课程去掌握类似Kafka项目的分析与设计。下面,我给大家介绍本课程包含的课时... 阅读全文
posted @ 2015-09-07 16:13 哥不是小萝莉 阅读(6739) 评论(2) 推荐(3) 编辑
摘要:1.概述 最近在和人交流时谈到数据相似度和数据共性问题,而刚好在业务层面有类似的需求,今天和大家分享这类问题的解决思路,分享目录如下所示:业务背景编码实践预览截图 下面开始今天的内容分享。2.业务背景 目前有这样一个背景,在一大堆数据中,里面存放着图片的相关信息,如下图所示: 上图只是给大家... 阅读全文
posted @ 2015-09-02 11:36 哥不是小萝莉 阅读(1367) 评论(2) 推荐(2) 编辑

点击右上角即可分享
微信分享提示