摘要: Hadoop-(Flume) 1. Flume 介绍 1.1. 概述 Flume是一个分布式、可靠、和高可用的海量日志采集、聚合和传输的系统。Flume可以采集文件,socket数据包、文件、文件夹、kafka等各种形式源数据,又可以将采集到的数据(下沉sink)输出到HDFS、hbase、hive 阅读全文
posted @ 2019-08-20 17:13 不穿格子衫的徍爺 阅读(186) 评论(0) 推荐(0) 编辑
摘要: Hadoop-(Hive) 介绍 数据仓库的目的是构建面向分析的集成化数据环境; 数据仓库是存数据的,企业的各种数据往里面存,主要目的是为了分析有效数据,后续会基 于它产出供分析挖掘的数据,或者数据应用需要的数据 ; 特点 面向主题 : 数据仓库通过一个个主题域将多个业务系统的数据加载到一起,为了各 阅读全文
posted @ 2019-08-20 15:30 不穿格子衫的徍爺 阅读(301) 评论(0) 推荐(0) 编辑