2019年6月20日

Hadoop综合大作业

摘要: 我把爬取的数据从数据库中导出,直接设置导出格式为txt,还有不导出列名,所以第一步是txt文件上传到HDFS 1.将爬虫大作业产生的txt文件上传到HDFS 导入成功,查看数据 2.对CSV文件进行预处理生成无标题文本文件 无需处理第二步。 3.把hdfs中的文本文件最终导入到数据仓库Hive中 创 阅读全文

posted @ 2019-06-20 00:28 Lijiajun 阅读(236) 评论(0) 推荐(0) 编辑

导航