@malloc

导航

2019年6月20日 #

SparkStreaming

摘要: 1、RDD基础 RDD.scala源码写到RDD的5个属性。driver生成RDD 分发到个executor,RDD可理解为操作描述,除sc.parallelize()生成的RDD包含数据外,一般RDD不包含具体数据,只存储要读取的文件位置,DAG等。 KafkaUtils.createDirect 阅读全文

posted @ 2019-06-20 23:57 malloc+ 阅读(146) 评论(0) 推荐(0) 编辑