2022年3月29日

摘要: 一、词频统计 分步骤实现 准备文件 下载小说或长篇新闻稿 上传到hdfs上 hdfs dfs -ls /hdfs 读文件创建RDD lines = sc.textFile(“file:///home/hadoop/ex1_news.txt”) lines.foreach(print) 分词 初次分词 阅读全文

posted @ 2022-03-29 22:10 bracee 阅读(30) 评论(0) 推荐(0) 编辑