上一页 1 ··· 13 14 15 16 17
摘要: 1、flume是分布式的日志收集系统,把手机来的数据传送到目的地去 2、flume传输的数据的基本单位是 event,如果是文本文件,通常是一行记录。 event代表着一个数据流的最小完整单元,由零个或多个header和正文组成,header类似于http头,包含时间的时间戳或者来源服务器主机名等。 阅读全文
posted @ 2019-02-21 11:24 xiaolaotou 阅读(1235) 评论(0) 推荐(0) 编辑
摘要: 一、概念 使用BlukLoad方式利用Hbase的数据信息是 按照特点格式存储在HDFS里的特性,直接在HDFS中生成持久化的Hfile数据格式文件,然后完成巨量数据快速入库的操作,配合MapReduce完成这样的操作。 二、优点 1、不占用Region资源 2、不会产生巨量的写入I/O、 3、只需 阅读全文
posted @ 2019-02-21 11:20 xiaolaotou 阅读(837) 评论(0) 推荐(0) 编辑
摘要: 伪分布式: 1、先将zk启动,如果是在伪分布式下,kafka已经集成了zk nohup /kafka_2.11-0.10.0.1/bin/zookeeper-server-start.sh /kafka_2.11-0.10.0.1/config/zookeeper.properties & 2、启动 阅读全文
posted @ 2019-02-21 11:10 xiaolaotou 阅读(426) 评论(0) 推荐(0) 编辑
上一页 1 ··· 13 14 15 16 17