上一页 1 ··· 12 13 14 15 16 17 18 19 20 ··· 24 下一页

2017年5月2日

mapreduce源码解析以及优化

摘要: http://blog.csdn.net/wisgood/article/details/8793483 优化 http://blog.csdn.net/wisgood/article/details/8789906 集群的优化 1、合理分配map和reduce任务的数量(单个节点上map任务、re 阅读全文

posted @ 2017-05-02 14:52 大大的橙子 阅读(227) 评论(0) 推荐(0) 编辑

2017年4月27日

Hadoop2.x + eclipse 插件配置

摘要: http://blog.csdn.net/u012874209/article/details/52105304 搭建集群那些就不用说了,主要有几个关键的地方需要注意(自己的Hadoop版本是2.5.2)。 0、插件hadoop-eclipse-plugin-2.5.2。自己去github或则什么地 阅读全文

posted @ 2017-04-27 17:47 大大的橙子 阅读(475) 评论(0) 推荐(0) 编辑

python spark

摘要: http://blog.jobbole.com/86232/ 1. 安装lib 材料: spark : http://spark.apache.org/downloads.html hadoop : http://hadoop.apache.org/releases.html jdk: http:/ 阅读全文

posted @ 2017-04-27 15:15 大大的橙子 阅读(267) 评论(0) 推荐(0) 编辑

2017年4月24日

Hive与Hbase关系整合

摘要: hive hbase 阅读全文

posted @ 2017-04-24 17:32 大大的橙子 阅读(1573) 评论(0) 推荐(0) 编辑

Sqoop架构以及应用介绍

摘要: 本篇文章在具体介绍Sqoop之前,先给大家用一个流程图介绍Hadoop业务的开发流程以及Sqoop在业务当中的实际地位。 如上图所示:在实际的业务当中,我们首先对原始数据集通过MapReduce进行数据清洗,然后将清洗后的数据存入到Hbase数据库中,而后通过数据仓库Hive对Hbase中的数据进行 阅读全文

posted @ 2017-04-24 17:27 大大的橙子 阅读(682) 评论(0) 推荐(0) 编辑

flume

摘要: flume 阅读全文

posted @ 2017-04-24 15:52 大大的橙子 阅读(100) 评论(0) 推荐(0) 编辑

SOAP

摘要: SOAP 阅读全文

posted @ 2017-04-24 10:52 大大的橙子 阅读(225) 评论(0) 推荐(0) 编辑

2017年4月17日

Linux各目录及每个目录的详细介绍

摘要: linux 阅读全文

posted @ 2017-04-17 18:19 大大的橙子 阅读(356) 评论(0) 推荐(0) 编辑

centos7 + mysql5.7 tar包解压安装

摘要: mysql install 阅读全文

posted @ 2017-04-17 16:53 大大的橙子 阅读(32643) 评论(5) 推荐(2) 编辑

Hive2.0的新特性介绍

摘要: hive2.x 阅读全文

posted @ 2017-04-17 11:15 大大的橙子 阅读(2095) 评论(0) 推荐(0) 编辑

上一页 1 ··· 12 13 14 15 16 17 18 19 20 ··· 24 下一页

导航