摘要: https://blog.csdn.net/qq_32023541/article/details/79127882让我们对kafka有个一初步的了解。其实吧,我们知道,数据可以从某个角度分成两类,第一类是批量数据,也就是已经放好的数据,打个比方,就像池塘的水,不会流动,你想怎么计算就怎么计算,你可 阅读全文
posted @ 2019-05-29 22:49 有梦想的土豆 阅读(848) 评论(0) 推荐(0) 编辑
摘要: 一。 spark 是一个快速且通用的集群计算平台 基于内存的运算 通用性;降低维护成本 Spack的设计容纳了其它分布式系统拥有的功能 批处理,迭代式计算,交互查询和流处理等 spark是高度开放的;Python Java scala haddoop 二。 spark core: 包含spark的基 阅读全文
posted @ 2019-05-29 22:47 有梦想的土豆 阅读(3209) 评论(1) 推荐(0) 编辑