摘要: 一、发展历史 Flink起源于一个名为Stratosphere的研究项目,目的是建立下一代大数据分析平台,于2014年4月16日成为Apache孵化器项目。Stratosphere的最初版本是基于Neffele的研究论文。下面的图表显示了Stratospher... 阅读全文
posted @ 2018-11-13 18:05 大数据技术与数仓 阅读(333) 评论(0) 推荐(0) 编辑
摘要: 对于一张数据表,如下图所示 对上述表实现分组统计查询: select pageid,age,count(1) from pv_users group by pageid,age; 将上述的SQL查询语句改写成Spark的代码,如下: package com.... 阅读全文
posted @ 2018-11-13 10:43 大数据技术与数仓 阅读(222) 评论(0) 推荐(0) 编辑