摘要: 1.将爬虫大作业产生的csv文件上传到HDFS 此处选取的是rank.csv文件 启动hadoop 在hdfs上创建文件并上传rank.csv至hdfs 查看上传至hdfs上文件的前5条信息 2.对CSV文件进行预处理生成无标题文本文件 编辑pre_deal.sh文件进行数据的取舍处理 3.把hdf 阅读全文
posted @ 2019-06-17 23:40 prous 阅读(162) 评论(0) 推荐(0) 编辑