摘要: 【下载】 注意选择spark版本时,与hadoop的版本要搭配 http://spark.apache.org/downloads.html 【安装】 阅读全文
posted @ 2017-02-14 17:07 Aviva_ye 阅读(191) 评论(0) 推荐(0) 编辑
摘要: 【简介】 Impala是Cloudera公司主导开发的新型查询系统,它提供SQL语义,能查询存储在Hadoop的HDFS和HBase中的PB级大数据。已有的Hive系统虽然也提供了SQL语义,但由于Hive底层执行使用的是MapReduce引擎,仍然是一个批处理过程,难以满足查询的交互性。相比之下, 阅读全文
posted @ 2017-02-14 16:36 Aviva_ye 阅读(955) 评论(0) 推荐(0) 编辑
摘要: 【简介】 官网:http://spark.apache.org/ 推荐学习博客:http://dblab.xmu.edu.cn/blog/spark/ spark是一个采用Scala语言进行开发,更快速更稳定的用于大规模数据处理的计算引擎。 是Apache软件基金会最重要的三大分布式计算系统开源项目 阅读全文
posted @ 2017-02-14 12:12 Aviva_ye 阅读(653) 评论(0) 推荐(0) 编辑