HiveSQL——row_number() over() 使用
摘要:语法格式:row_number() over(partition by 分组列 order by 排序列 desc) row_number() over()分组排序功能: 在使用 row_number() over()函数时候,over()里头的分组以及排序的执行晚于 where 、group by
阅读全文
posted @
2019-10-08 11:17
不同的日子丶看不同的云
阅读(6164)
推荐(0) 编辑
数据分析——Hive数据库初始化失败Error: FUNCTION 'NUCLEUS_ASCII' already exists.
摘要:进入Hive交互系统,“show databases:”。出现报错: Failed to start database 'metastore_db' with class loader sun.misc.Launcher$AppClassLoader 经查找是因为数据库初始化的问题。 进入终端初始化
阅读全文
posted @
2019-08-15 20:51
不同的日子丶看不同的云
阅读(3236)
推荐(0) 编辑
数据分析——5天破10亿的哪吒,为啥这么火,Python来分析
摘要:不知道大家最近有没有去看电影,最近身边的朋友都在向我安利一部叫做《哪吒之魔童降世》的动漫电影。大家无一例外,都说非常的好看。 看一下最近的微信搜索指数,比火热的电视剧“亲爱的热爱的”搜索指数要高出近6倍,比迪斯尼的“狮子王”要高出22倍,确实非常火。 去猫眼上看了一下,结果显示在接近84万人评分的情
阅读全文
posted @
2019-08-06 20:30
不同的日子丶看不同的云
阅读(324)
推荐(0) 编辑
数据分析——巧用ABtest,看杰伦和徐坤的流量之争
摘要:豆瓣的一个关于“周X伦在微博超话没有数据流量,他是不是没有蔡X坤火”的帖子引爆了Jay Chou粉丝与KUN的粉丝的流量之争。两家粉丝以背后最大赢家新浪微博为载体,打响了一场被各大媒体争相报道、吃瓜路人津津乐道的数据流量之战。 用ABtestdech得出结论 一:什么是A/B测试? 统计学角度来讲,
阅读全文
posted @
2019-08-06 20:11
不同的日子丶看不同的云
阅读(796)
推荐(0) 编辑