Hadoop综合大作业
1.准备本次数据分析的数据(以下为爬虫大作业获取的CSV文件)
2.(1)将CSV文件上传到hdfs上
(2)查看文件中前10条信息,即可证明是否上传成功。
3.预处理文件,将CSV文件生成txt文件
(1)先删除第一行字段
(2)将文本文件上传的hdfs上并查看
5.启动hdfs并启动MySQL服务
6.创建数据库:
7.创建player表b
8.查看前十条数据
9.分析数据
9.1查看nba中的法国籍球员(select * from b where country='France';)
9.2查看nba中的加拿大球员(select * from b where country='Canada';)
虽然今年nba冠军猛龙队位置在多伦多,但是看一看本土加拿大nba球员好少哦..
9.3查看nba球员身高超过2米的人数有134人(select count(*) from b where height > 2;)
9.4查看在nba打球超过15年的球员数量(select count(*) from b where experience > 15;)
9.5查看在nba打球超过15年的球员都有谁
9.6查看号码是15的多少个
9.7查看2018年选秀有谁
9.8 查看湖人队球员有谁