摘要: Flume flume的概述 Apache Flume是一个分布式,可靠且可用的系统,用于有效地从许多不同的source收集,聚合和移动大量日志数据到集中式数据存储。 Apache Flume的使用不仅限于日志数据聚合。由于数据source是可定制的,因此Flume可用于传输大量event 数据,包 阅读全文
posted @ 2020-04-28 21:29 qtyanan 阅读(144) 评论(2) 推荐(0) 编辑
摘要: 安装Hive及配置HiveSever2 Hive是一个数据仓库基础工具在Hadoop中用来处理结构化数据。它架构在Hadoop之上,提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行,使查询和分析方便。 1.安装配置hive 这里使用的是hive-2.3.7版,下载地址: 阅读全文
posted @ 2020-04-28 18:46 qtyanan 阅读(1004) 评论(0) 推荐(0) 编辑