摘要: Kafka是由LinkedIn开发的一个分布式的消息系统,使用Scala编写,它以可水平扩展和高吞吐率而被广泛使用。目前越来越多的开源分布式处理系统如Cloudera、Apache Storm、Spark都支持与Kafka集成。 1.下载Kafka并安装 1)下载Apache版本的Kafka。 2) 阅读全文
posted @ 2019-05-29 11:12 misr 阅读(260) 评论(0) 推荐(0) 编辑
摘要: HBase是一个高可靠、高性能、面向列、可伸缩的分布式存储系统,利用Hbase技术可在廉价PC Server上搭建 大规模结构化存储集群。 HBase 是Google Bigtable 的开源实现,与Google Bigtable 利用GFS作为其文件存储系统类似, HBase 利用Hadoop H 阅读全文
posted @ 2019-05-29 11:11 misr 阅读(269) 评论(0) 推荐(0) 编辑