摘要: 1.行动算子介绍 返回的不是一个RDD,而是一个数据值或者集合或者是没有返回 没有行动算子算法,那么无法实现转换算子的执行 2.reduce(fun):T 聚合算子 定义:fun函数类型如下 (T,T)=>T T是RDD的数据集数据的类型 将原先RDD数据集中聚合起来算一个总的结果 sum/coun 阅读全文
posted @ 2022-08-23 23:10 jsqup 阅读(122) 评论(0) 推荐(0) 编辑
摘要: 1.map算子 定义: map(fun)函数 解释: 将RDD的每一个元素通过fun函数计算得到一个新的结果,新的结果我们会组合成为一个新的RDD 特别注意:一对一场景下,RDD的每一条数据对应新的RDD的中一条数据 案例: def mapOper(sc: SparkContext): Unit = 阅读全文
posted @ 2022-08-23 19:47 jsqup 阅读(23) 评论(0) 推荐(0) 编辑
摘要: 1.启动spark命令 1. start-dfs.sh 2. start-yarn.sh 3. start-spark-all.sh 4. start-history-server.sh 5. spark-shell --master spark://node1:7077 阅读全文
posted @ 2022-08-23 15:23 jsqup 阅读(136) 评论(0) 推荐(0) 编辑