摘要: 原文链接:Hbase系统架构及数据结构HBase中的表一般有这样的特点:1 大:一个表可以有上亿行,上百万列2 面向列:面向列(族)的存储和权限控制,列(族)独立检索。3 稀疏:对于为空(null)的列,并不占用存储空间,因此,表可以设计的非常稀疏。下面一幅图是Hbase在Hadoop Ecosys... 阅读全文
posted @ 2015-11-15 19:57 ~风轻云淡~ 阅读(1957) 评论(0) 推荐(0) 编辑
摘要: 原文链接:Spark Streaming:大规模流式数据处理的新贵摘要:Spark Streaming是大规模流式数据处理的新贵,将流式计算分解成一系列短小的批处理作业。本文阐释了Spark Streaming的架构及编程模型,并结合实践对其核心技术进行了深入的剖析,给出了具体的应用场景及优化方案。... 阅读全文
posted @ 2015-11-15 14:03 ~风轻云淡~ 阅读(496) 评论(0) 推荐(0) 编辑