Hadoop综合大作业

1.准备本次数据分析的数据(以下为爬虫大作业获取的CSV文件)

 

 

 2.(1)将CSV文件上传到hdfs上

 

(2)查看文件中前10条信息,即可证明是否上传成功。

 

 

3.预处理文件,将CSV文件生成txt文件

(1)先删除第一行字段

 (2)将文本文件上传的hdfs上并查看

5.启动hdfs并启动MySQL服务

 6.创建数据库:

 

7.创建player表b

 8.查看前十条数据

9.分析数据

9.1查看nba中的法国籍球员(select * from b where country='France';)

9.2查看nba中的加拿大球员(select * from b where country='Canada';)

虽然今年nba冠军猛龙队位置在多伦多,但是看一看本土加拿大nba球员好少哦..

9.3查看nba球员身高超过2米的人数有134人(select count(*) from b where height > 2;)

9.4查看在nba打球超过15年的球员数量(select count(*) from b where experience > 15;)

9.5查看在nba打球超过15年的球员都有谁

 

9.6查看号码是15的多少个

 

9.7查看2018年选秀有谁

9.8 查看湖人队球员有谁

 

posted @ 2019-06-21 13:16  cjvil  阅读(754)  评论(0编辑  收藏  举报