瞌睡中的葡萄虎

博客园 首页 新随笔 联系 订阅 管理

2014年6月20日 #

摘要: 现有的hadoop生态系统中存在的问题1)使用mapreduce进行批量离线分析;2)使用hive进行历史数据的分析;3)使用hbase进行实时数据的查询;4)使用storm进行实时的流处理;5)。。。。。。导致:维护成本高、学习成本高Spark的出现弥补了Hadoop生态系统中的缺陷,使用spar... 阅读全文
posted @ 2014-06-20 00:16 瞌睡中的葡萄虎 阅读(1417) 评论(0) 推荐(0) 编辑

摘要: 前提:安装好jdk1.7,hadoop安装步骤:1、安装scala下载地址:http://www.scala-lang.org/download/配置环境变量:export SCALA_HOME=/..../scalaexport PATH=.:$SCALA_HOME/bin ....验证:sca... 阅读全文
posted @ 2014-06-20 00:15 瞌睡中的葡萄虎 阅读(2314) 评论(0) 推荐(0) 编辑

摘要: 编译方式一:mavenexport MAVEN_OPTS="-Xmx2g -XX:MaxPermSize=512M -XX:ReservedCodeCacheSize=512m"mvn -Pyarn -Phive -Dhadoop.version=2.3.0-cdh5.0.0 -Dyarn.vers... 阅读全文
posted @ 2014-06-20 00:13 瞌睡中的葡萄虎 阅读(519) 评论(0) 推荐(0) 编辑