摘要:
1、flume是分布式的日志收集系统,把手机来的数据传送到目的地去 2、flume传输的数据的基本单位是 event,如果是文本文件,通常是一行记录。 event代表着一个数据流的最小完整单元,由零个或多个header和正文组成,header类似于http头,包含时间的时间戳或者来源服务器主机名等。 阅读全文
摘要:
一、概念 使用BlukLoad方式利用Hbase的数据信息是 按照特点格式存储在HDFS里的特性,直接在HDFS中生成持久化的Hfile数据格式文件,然后完成巨量数据快速入库的操作,配合MapReduce完成这样的操作。 二、优点 1、不占用Region资源 2、不会产生巨量的写入I/O、 3、只需 阅读全文
摘要:
伪分布式: 1、先将zk启动,如果是在伪分布式下,kafka已经集成了zk nohup /kafka_2.11-0.10.0.1/bin/zookeeper-server-start.sh /kafka_2.11-0.10.0.1/config/zookeeper.properties & 2、启动 阅读全文