Hadoop综合大作业
作业来源:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/3363
准备上传的文件夹,新建文件夹bigdatacase
获取bigdatacase文件夹的权限 并再里面新建dataset文件夹
查看我爬取数据的前5条数据
#!/bin/bash infile=$1 outfile=$2 awk -F "," 'BEGIN{ id=0;} {id=id+1; print id"\t"$1"\t"$2"\t"$3"\t"$4\t"$5\t"$6\t"$7\t"$8\t"$9\t"$10\t"$11\t"$12\t"$13\t"$14\t"$15\t"$16\t"$17\t"$18\t"$19\t"$20\t"$21\t"$22\t"$23\t"$24\t"$25\t"$26\t"$27 }' $infile > $outfile
这是pre_deal.sh配置文件,因为我获取了27列的数据,所以打了那么多。
预处理成功,生成了user_table.txt文件
查看user_table.txt前面的数据
查看bigdatacase文件
HDFS上传文件夹/bigdatacase/dataset
查看HDFS上传的user_table.txt文件的前10条数据
创建数据库bdlab
使用数据库bdlab
无法创建数据库表 不知道是什么原因,百度了很多遍,按照百度上的各种解决方法都解决不了。
总结:前面都很顺利,UTF-8也设置好了,但是在hive中无法创建数据库表,不知道什么原因,重新安装HIVE和MYSQL都无法成功,HIVE和MYSQL的安装配置都是正常的。