打赏

随笔分类 -  Storm概念学习系列

摘要:不多说,直接上干货! Storm与Hadoop的角色和组件比较 Storm 集群和 Hadoop 集群表面上看很类似。但是 Hadoop 上运行的是 MapReduce 作业,而在 Storm 上运行的是拓扑 Topology,这两者之间是非常不同的。一个关键的区别是:一个MapReduce 作业最 阅读全文
posted @ 2016-10-23 11:19 大数据和AI躺过的坑 阅读(755) 评论(0) 推荐(0) 编辑
摘要:不多说,直接上干货! storm的设计思想 在 Storm 中也有对流(Stream)的抽象,流是一个不间断的、无界的连续 Tuple(Storm在建模事件流时,把流中的事件抽象为 Tuple 即元组)。Storm 认为每个流都有一个 Stream 源,也就是原始元组的源头,所以它将这个源头抽象为 阅读全文
posted @ 2016-10-23 11:17 大数据和AI躺过的坑 阅读(1532) 评论(1) 推荐(1) 编辑
摘要:不多说,直接上干货! storm简介 Storm 是 Twitter 开源的、分布式的、容错的实时计算系统,遵循 Eclipse Public License1.0。 Storm 通过简单的 API 使开发者可以可靠地处理无界持续的流数据,进行实时计算。 Twitter Storm 是使用 Cloj 阅读全文
posted @ 2016-10-23 11:16 大数据和AI躺过的坑 阅读(567) 评论(0) 推荐(0) 编辑
摘要:不多说,直接上干货! storm出现的背景 互联网从诞生的第一时间起,对世界的最大改变就是让信息能够实时交互,从而大大加速了各个环节的效率。正因为大家有对信息实时响应、实时交互的需求,所以软件行业除了个人操作系统之外,数据库(更精确的说是关系型数据库)应该是发展最快、收益最为丰厚的产品了。记得十年前 阅读全文
posted @ 2016-10-23 11:15 大数据和AI躺过的坑 阅读(750) 评论(0) 推荐(0) 编辑
摘要:不多说,直接上干货! 什么是实时流计算? 1、实时流计算背景 2、实时计算应用场景 3、实时计算处理流程 4、实时计算框架 什么是实时流计算? 所谓实时流计算,就是近几年由于数据得到广泛应用之后,在数据持久性建模不满足现状的情况下,急需数据流的瞬时建模或者计算处理。这种实时计算的应用实例有金融服务、 阅读全文
posted @ 2016-10-23 11:13 大数据和AI躺过的坑 阅读(8481) 评论(0) 推荐(0) 编辑
摘要:本博文主要的内容有 .Storm .Flume .Scribe .二次排序详解 .InputFormat的实际使用 .MapReduce迭代器的不同 .HBase编码格式的细节 .设置SingleColumnValueFilter时候注意的地方 .HBase中有两张特殊的Table,ROOT-和.M 阅读全文
posted @ 2016-10-13 15:15 大数据和AI躺过的坑 阅读(483) 评论(0) 推荐(0) 编辑