Fork me on GitHub

2019年4月20日

摘要: RDD弹性分布式数据集 (Resilient Distributed Dataset) RDD只读可分区,数据集可以缓存在内存中,在多次计算间重复利用。 弹性是指内存不够时可以与磁盘进行交互 join操作就是笛卡尔积的操作过程 spark streaming 实时数据流 Discretized St 阅读全文
posted @ 2019-04-20 22:04 OneLi算法分享社区 阅读(236) 评论(0) 推荐(0) 编辑

导航