摘要: 1 zhangsan 1999-08-03 3000 2 zhangsan 2008-08-08 5000 3 lisi 2000-08-08 5000 4 zhangsan 2018-08-09 15000 5 lisi 2010-09-06 8000 6 lisi 2016-10-10 15000 7 lisi 2019-05-10 28000 阅读全文
posted @ 2019-05-13 21:11 lilixia 阅读(102) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2019-05-13 20:40 lilixia 阅读(124) 评论(0) 推荐(0) 编辑
摘要: //多种数据类型 阅读全文
posted @ 2019-05-13 19:53 lilixia 阅读(348) 评论(0) 推荐(0) 编辑
摘要: create index id_index on table t_cluster(id) as "org.apache.hadoop.hive.ql.index.compact.CompactIndexHandler" with deferred rebuild; 阅读全文
posted @ 2019-05-13 19:10 lilixia 阅读(107) 评论(0) 推荐(0) 编辑
摘要: 看的次数多 或者 评分高 每个用户最喜欢哪个类型的电影 row_number() ratings表中一个电影出现几次? 一个电影有几种类型? 类型在movies 评分或者观看次数ratings movies join ratings //将类型炸开 select mid,mname,lx from 阅读全文
posted @ 2019-05-13 16:50 lilixia 阅读(260) 评论(0) 推荐(0) 编辑
摘要: alter table store set SERDEPROPERTIES('field.delim'='\t'); 阅读全文
posted @ 2019-05-13 15:39 lilixia 阅读(124) 评论(0) 推荐(0) 编辑
摘要: 1,F,1,10,48067 2,M,56,16,70072 3,M,25,15,55117 4,M,45,7,02460 5,M,25,20,55455 6,F,50,9,55117 7,M,35,1,06810 8,M,25,12,11413 9,M,25,17,61614 10,F,35,1,95370 11,F,25,1,04093 12,M,25,12,32793 13,M,45,1,... 阅读全文
posted @ 2019-05-13 15:38 lilixia 阅读(2517) 评论(0) 推荐(0) 编辑
摘要: 1,1193,5,978300760 1,661,3,978302109 1,914,3,978301968 1,3408,4,978300275 1,2355,5,978824291 1,1197,3,978302268 1,1287,5,978302039 1,2804,5,978300719 1,594,4,978302268 1,919,4,978301368 1,595,5,97882... 阅读全文
posted @ 2019-05-13 15:37 lilixia 阅读(7482) 评论(0) 推荐(0) 编辑
摘要: 上面数据有问题 下面是经过清洗的数据 阅读全文
posted @ 2019-05-13 15:36 lilixia 阅读(2207) 评论(0) 推荐(0) 编辑
摘要: age.txt job.txt 阅读全文
posted @ 2019-05-13 15:32 lilixia 阅读(729) 评论(0) 推荐(0) 编辑