上一页 1 ··· 4 5 6 7 8 9 10 下一页

2015年11月18日

Hadoop学习笔记—20.网站日志分析项目案例(二)数据清洗

摘要: Hadoop学习笔记—20.网站日志分析项目案例(二)数据清洗网站日志分析项目案例(一)项目介绍:http://www.cnblogs.com/edisonchou/p/4449082.html网站日志分析项目案例(二)数据清洗:当前页面网站日志分析项目案例(三)统计分析:http://www.cn... 阅读全文

posted @ 2015-11-18 17:11 1130136248 阅读(364) 评论(0) 推荐(0) 编辑

Hadoop学习笔记—19.Flume框架学习

摘要: Hadoop学习笔记—19.Flume框架学习START:Flume是Cloudera提供的一个高可用的、高可靠的开源分布式海量日志收集系统,日志数据可以经过Flume流向需要存储终端目的地。这里的日志是一个统称,泛指文件、操作记录等许多数据。一、Flume基础理论1.1 常见的分布式日志收集系统 ... 阅读全文

posted @ 2015-11-18 17:10 1130136248 阅读(296) 评论(0) 推荐(0) 编辑

Hadoop学习笔记—20.网站日志分析项目案例(一)项目介绍

摘要: Hadoop学习笔记—20.网站日志分析项目案例(一)项目介绍网站日志分析项目案例(一)项目介绍:当前页面网站日志分析项目案例(二)数据清洗:http://www.cnblogs.com/edisonchou/p/4458219.html网站日志分析项目案例(三)统计分析:http://www.cn... 阅读全文

posted @ 2015-11-18 17:10 1130136248 阅读(231) 评论(0) 推荐(0) 编辑

Hadoop学习笔记系列文章导航

摘要: Hadoop学习笔记系列文章导航一、为何要学习Hadoop? 这是一个信息爆炸的时代。经过数十年的积累,很多企业都聚集了大量的数据。这些数据也是企业的核心财富之一,怎样从累积的数据里寻找价值,变废 为宝炼数成金成为当务之急。但数据增长的速度往往比cpu和内存性能增长的速度还要快得多。要处理海量数据... 阅读全文

posted @ 2015-11-18 17:09 1130136248 阅读(150) 评论(0) 推荐(0) 编辑

Hadoop学习笔记—17.Hive框架学习

摘要: Hadoop学习笔记—17.Hive框架学习一、Hive:一个牛逼的数据仓库1.1 神马是Hive? Hive 是建立在 Hadoop 基础上的数据仓库基础构架。它提供了一系列的工具,可以用来进行数据提取转化加载(ETL),这是一种可以存储、查询和分析存储在 Hadoop 中的大规模数据的机制。H... 阅读全文

posted @ 2015-11-18 17:05 1130136248 阅读(244) 评论(0) 推荐(0) 编辑

Hadoop学习笔记—18.Sqoop框架学习

摘要: Hadoop学习笔记—18.Sqoop框架学习一、Sqoop基础:连接关系型数据库与Hadoop的桥梁1.1 Sqoop的基本概念 Hadoop正成为企业用于大数据分析的最热门选择,但想将你的数据移植过去并不容易。Apache Sqoop正在加紧帮助客户将重要数据从数据库移到Hadoop。随着... 阅读全文

posted @ 2015-11-18 17:05 1130136248 阅读(191) 评论(0) 推荐(0) 编辑

Hadoop学习笔记—16.Pig框架学习

摘要: Hadoop学习笔记—16.Pig框架学习一、关于Pig:别以为猪不能干活1.1 Pig的简介 Pig是一个基于Hadoop的大规模数据分析平台,它提供的SQL-LIKE语言叫Pig Latin,该语言的编译器会把类SQL的数据分析请求转换为一系列经过优化处理的MapReduce运算。Pig为复杂... 阅读全文

posted @ 2015-11-18 17:04 1130136248 阅读(225) 评论(0) 推荐(0) 编辑

Hadoop学习笔记—15.HBase框架学习(基础实践篇)

摘要: Hadoop学习笔记—15.HBase框架学习(基础实践篇)一、HBase的安装配置1.1 伪分布模式安装 伪分布模式安装即在一台计算机上部署HBase的各个角色,HMaster、HRegionServer以及ZooKeeper都在一台计算机上来模拟。 首先,准备好HBase的安装包,我这里使用... 阅读全文

posted @ 2015-11-18 17:03 1130136248 阅读(244) 评论(0) 推荐(0) 编辑

Hadoop学习笔记—14.ZooKeeper环境搭建

摘要: Hadoop学习笔记—14.ZooKeeper环境搭建从字面上来看,ZooKeeper表示动物园管理员,这是一个十分奇妙的名字,我们又想起了Hadoop生态系统中,许多项目的Logo都采用了动物,比如Hadoop采用了大象的形象,所以我们可以猜测ZooKeeper就是对这些动物进行一些管理工作的。一... 阅读全文

posted @ 2015-11-18 17:02 1130136248 阅读(216) 评论(0) 推荐(0) 编辑

Hadoop学习笔记—15.HBase框架学习(基础知识篇)

摘要: Hadoop学习笔记—15.HBase框架学习(基础知识篇)HBase是Apache Hadoop的数据库,能够对大型数据提供随机、实时的读写访问。HBase的目标是存储并处理大型的数据。HBase是一个开源的,分布式的,多版本的,面向列的存储模型,它存储的是松散型数据。一、HBase:BigTab... 阅读全文

posted @ 2015-11-18 17:02 1130136248 阅读(217) 评论(0) 推荐(0) 编辑

上一页 1 ··· 4 5 6 7 8 9 10 下一页

导航