摘要: 1.这是爬虫大作业的csv数据表,共计2万条数据左右。 2、导入数据表并且去掉头部的第一条数据,然后查看签名10条数据 3、再进行预处理,创建一个脚本文件pre_deal.sh,对数据表中的地址进行省份转换: 4、转换后的txt表,可以看见有中文的地区名 5、开启Hadoop和hive 6、在hdf 阅读全文
posted @ 2019-06-17 09:00 xbk6 阅读(171) 评论(0) 推荐(0) 编辑