2019年7月16日

17 Flume的理解

摘要: 一、Flume概念 Flume是什么? 由Cloudera公司开源; 分布式、可靠、高可用的海量日志采集系统; 数据源可定制,可扩展; 数据存储系统可定制,可扩展。 中间件:屏蔽了数据源和数据存储系统的异构性 Flume特点 可靠性 保证数据不丢失 可扩展性高性能 各组件数目可扩展 - 吞吐率很高, 阅读全文

posted @ 2019-07-16 17:09 农夫三拳有點疼 阅读(44) 评论(0) 推荐(0) 编辑

15 Hbase的理解

摘要: 一、Hbase概念 1 HBase概述 HBase是一个构建在HDFS上的分布式列存储系统; HBase是Apache Hadoop生态系统中的重要一员,主要用于海量结构化数据存储; 从逻辑上讲,HBase将数据按照表、行和列进行存储。 Hbase与HDFS对比 两者都具有良好的容错性和扩展性,都可 阅读全文

posted @ 2019-07-16 16:57 农夫三拳有點疼 阅读(30) 评论(0) 推荐(0) 编辑

18 Kafka的理解

摘要: 一、 Kafka概述 1-1 Kafka是什么 在流式计算中,Kafka一般用来缓存数据,Storm通过消费Kafka的数据进行计算。 1)Apache Kafka是一个开源消息系统,由Scala写成。是由Apache软件基金会开发的一个开源消息系统项目。 2)Kafka最初是由LinkedIn公司 阅读全文

posted @ 2019-07-16 09:25 农夫三拳有點疼 阅读(28) 评论(0) 推荐(0) 编辑

导航