摘要:
一、发展历史 Flink起源于一个名为Stratosphere的研究项目,目的是建立下一代大数据分析平台,于2014年4月16日成为Apache孵化器项目。Stratosphere的最初版本是基于Neffele的研究论文。下面的图表显示了Stratospher... 阅读全文
摘要:
对于一张数据表,如下图所示 对上述表实现分组统计查询: select pageid,age,count(1) from pv_users group by pageid,age; 将上述的SQL查询语句改写成Spark的代码,如下: package com.... 阅读全文