摘要: 1.准备文件,上传到hdfs上 2.读文件创建RDD 3.分词 4.排除大小写,标点符号 5.统计词频 6.排序 7.保存输出到文件,查询 B.一句话实现 查看结果: Spark编程的特点:1. 重要概念RDD2. 在进行RDD一系列操作3. RDD在遇到行动操作前的一系列RDD转换操作可流式实现 阅读全文
posted @ 2022-03-31 14:50 代码狂魔‘’ 阅读(29) 评论(0) 推荐(0) 编辑