摘要:  Flume 简介 Flume 的安装与配置 Fumne 部署 Flume 是 Cloudera 提供的一个高可用、 高可靠、 分布式的海量日志采集、 聚合和传输的系统。 Flume 支持定制各类数据源如 Avro、 Thrift、 Spooling 等。 同时 Flume提供对数据的简单处理 阅读全文
posted @ 2018-10-11 10:08 庙里有个老和尚 阅读(339) 评论(0) 推荐(0) 编辑
摘要: hive数据仓库 保存了一些半结构化的数据-文本数据。元数据数据-保存到mysql/debye(默认)数据库中 数据必须要保存到hdfs上。 Hive一组类似于SQL的语句-MYSQL,当执行SQL语句 时,对应的生成MapReduce程序。 用于解决:Java程序员开发MapReduce的难点。 阅读全文
posted @ 2018-09-26 11:09 庙里有个老和尚 阅读(129) 评论(0) 推荐(0) 编辑
摘要: Maven 是一个项目管理工具。 作用:Maven主要用于jar包管理,工程打包、编译、部署之类的事情Maven也可以来做。使用Maven构建一个项目之后,在项目目录里会有一个名为pom.xml的配置文件,该文件里有工程信息和很多依赖,这些依赖是由dependency标签构成的,用于声明项目所需要的 阅读全文
posted @ 2018-09-14 15:25 庙里有个老和尚 阅读(99) 评论(0) 推荐(0) 编辑
摘要: 数据库RDBMS Relationship DataBase management System -关系型数据管理系统。 都是用二维表的方式来管理数据. 1:下载mysql https://dev.mysql.com/downloads/mysql/5.7.html#downloads 步2:解压 阅读全文
posted @ 2018-09-13 16:04 庙里有个老和尚 阅读(235) 评论(0) 推荐(0) 编辑
摘要: 内容简介 sqoop 的安装 sqoop 的基本命令 数据导入导出示例 sqoop 是一个数据迁移工具。 sqoop 非常简单, 其整合了 Hive 、 Hbase 和 Oozie , 通过 map-reduce 任务来传输数据, 从而提供并发特性和容错。Sqoop 由于是将数据导入到 hdf 阅读全文
posted @ 2018-09-05 20:50 庙里有个老和尚 阅读(597) 评论(0) 推荐(0) 编辑