04 2017 档案
摘要:大数据的知识结构: 一、大数据的相关名词: Hadoop:是一个分布式的大数据框架,包含有三个核心组件:HDFS,YARN,MapReduce。 HBase:是一个NoSql数据库,列式存储。存储并处理大型数据,可以对大型数据提供随机、实时的读写访问。 Hive: 是一个数据仓库工具,运行在Hado
阅读全文
摘要:Hadoop: 官网(hadoop.apache.org)的定义: 一:Hadoop Common: 为Hadoop其它模块提供通用的支持 二:HDFS: 是Hadoop的分布式文件系统,其特点是高度的容错性。提供了副本(3个)的概念。 提供高吞吐量(high throughput)来访问应用程序的
阅读全文
摘要:Maven的创建有两种方式: 作用:构建工程,管理项目。 Maven可以几个东西模块构件为一个整体。可以获取jar包,并且获取其关联的jar包。 本地搭建Maven、使用MyEclipse工具创建Maven项目。 1.本地搭建Maven: 安装maven之前,需要提前安装jdk 1.在apache官
阅读全文