2014年7月1日

Spark部署及应用

摘要: 在飞速发展的云计算大数据时代,Spark是继Hadoop之后,成为替代Hadoop的下一代云计算大数据核心技术,目前Spark已经构建了自己的整个大数据处理生态系统,如流处理、图技术、机器学习、NoSQL查询等方面都有自己的技术,并且是Apache顶级Project,可以预计的是2014年下半年... 阅读全文

posted @ 2014-07-01 13:29 spark亚太研究院 阅读(1972) 评论(0) 推荐(2) 编辑

如何成为云计算大数据Spark高手

摘要: Spark是发源于美国加州大学伯克利分校AMPLab的集群计算平台,它立足于内存计算,性能超过Hadoop百倍,从多迭代批量处理出发,兼收并蓄数据仓库、流处理和图计算等多种计算范式,是罕见的全能选手。Spark采用一个统一的技术堆栈解决了云计算大数据的如流处理、图技术、机器学习、NoSQL查询... 阅读全文

posted @ 2014-07-01 13:05 spark亚太研究院 阅读(524) 评论(1) 推荐(1) 编辑

导航