独孤风 - 博客园

2020年5月18日

摘要： KafkaCenter是什么 KafkaCenter是一个针对Kafka的一站式，解决方案。用于Kafka集群的维护与管理，生产者和消费者的监控，以及Kafka部分生态组件的使用。对于Kafka的平台化，一直缺少一个成熟的解决方案，之前比较流行的kafka监控方案，如kafka-manager提供阅读全文

posted @ 2020-05-18 09:05 独孤风阅读(3144) 评论(0) 推荐(2)

2020年5月15日

Druid 0.17入门（4）—— 数据查询方式大全

摘要：本文介绍Druid查询数据的方式，首先我们保证数据已经成功载入。 Druid查询基于HTTP，Druid提供了查询视图，并对结果进行了格式化。 Druid提供了三种查询方式，SQL，原生JSON，CURL。一、SQL查询我们用wiki的数据为例查询10条最多的页面编辑 SELECT page, 阅读全文

posted @ 2020-05-15 09:16 独孤风阅读(1210) 评论(0) 推荐(0)

2020年5月11日

流媒体与实时计算，Netflix公司Druid应用实践

摘要： Netflix(Nasdaq NFLX)，也就是网飞公司，成立于1997年，是一家在线影片[租赁]提供商，主要提供Netflix超大数量的[DVD]并免费递送，总部位于美国加利福尼亚州洛斯盖图。1999年开始订阅服务。2009年，该公司可提供多达10万部DVD电影，并有1千万的订户。2007年2月2 阅读全文

posted @ 2020-05-11 08:34 独孤风阅读(1010) 评论(0) 推荐(0)

2020年5月8日

实时流式计算系统中的几个陷阱

摘要：随着诸如Apache Flink，Apache Spark，Apache Storm之类的开源框架以及诸如Google Dataflow之类的云框架的增多，创建实时数据处理作业变得非常容易。这些API定义明确，并且诸如Map-Reduce之类的标准概念在所有框架中都遵循几乎相似的语义。但是，直到今阅读全文

posted @ 2020-05-08 09:46 独孤风阅读(853) 评论(0) 推荐(0)

2020年5月7日

DataHub——实时数据治理平台

摘要： DataHub 首先，阿里云也有一款名为DataHub的产品，是一个流式处理平台，本文所述DataHub与其无关。数据治理是大佬们最近谈的一个火热的话题。不管国家层面，还是企业层面现在对这个问题是越来越重视。数据治理要解决数据质量，数据管理，数据资产，数据安全等等。而数据治理的关键就在于元数据管理阅读全文

posted @ 2020-05-07 09:23 独孤风阅读(26842) 评论(1) 推荐(2)

2020年5月6日

聊聊流计算系统中的核心问题：状态管理

摘要：本文选自《实时流计算系统设计与实现》文末有惊喜状态管理是流计算系统的核心问题之一。在实现流数据的关联操作时，流计算系统需要先将窗口内的数据临时保存起来，然后在窗口结束时，再对窗口内的数据做关联计算。在实现时间维度聚合特征计算和关联图谱特征计算时，更是需要创建大量的寄存用于记录聚合的结果。而CEP 阅读全文

posted @ 2020-05-06 09:30 独孤风阅读(1113) 评论(0) 推荐(0)

2020年4月28日

一小时搭建实时数据分析平台

摘要：实时数据分析门槛较高，我们如何用极少的开发工作就完成实时数据平台的搭建，做出炫酷的图表呢？如何快速的搭建实时数据分析平台，首先我们需要实时数据的接入端，我们选择高扩展性、容错性、速度极快的消息系统Kafka，而实时数据仓库，由于 Druid提供了非常方便快捷配置方式，如果不想编写负责的Flink和阅读全文

posted @ 2020-04-28 14:08 独孤风阅读(2477) 评论(0) 推荐(3)

2020年4月27日

重大更新！Druid 0.18.0 发布—Join登场，支持Java11

摘要： Apache Druid本质就是一个分布式支持实时数据分析的数据存储系统。能够快速的实现查询与数据分析，高可用，高扩展能力。距离上一次更新刚过了二十多天，距离0.17版本刚过了三个多月，Druid再次迎来重大更新，Druid也越来越强大了。 Apache Druid 0.18.0 本次更新了 4 阅读全文

posted @ 2020-04-27 15:39 独孤风阅读(2409) 评论(0) 推荐(2)

2020年4月26日

Linux上非root用户jdk环境变量配置

摘要： 1.设置用户环境变量vi .bash_profile 或者是 vi ~/.bashrc 2.JAVA_HOME=/home/sgmm/jdk1.6.0_13 CLASSPATH=$JAVA_HOME/lib:$JAVA_HOME/jre/lib PATH=$PATH:$JAVA_HOME/bin:$ 阅读全文

posted @ 2020-04-26 14:39 独孤风阅读(1595) 评论(0) 推荐(0)

Scala学习系列（三）——入门与基础

摘要：本课程源码共享于 https://github.com/tree1123/learning-scala 首先，打开IDEA编辑器的SbtExampleProject项目，我们将在这个项目下进行练习本节的练习内容位于 com.tree1123.Base 中新建一个main函数一、声明值和变量阅读全文

posted @ 2020-04-26 13:43 独孤风阅读(312) 评论(0) 推荐(0)

大数据流动

公众号大数据流动。追随大数据的流动，专注于大数据相关技术。相关学习交流群已经成立，欢迎加入~

公告

大数据流动

公众号 大数据流动。 追随大数据的流动，专注于大数据相关技术。 相关学习交流群已经成立，欢迎加入~

公告

公众号大数据流动。追随大数据的流动，专注于大数据相关技术。相关学习交流群已经成立，欢迎加入~