01 2023 档案

摘要:自增列的生成 over()里不带排序或order by 1是一样的效果 select row_number() over() as id,a1.id,relationwords,relation_words from ods.ods_wpt_management_search_relation_wo 阅读全文
posted @ 2023-01-30 09:08 DB乐之者 阅读(118) 评论(0) 推荐(0) 编辑
摘要:一、指标意义 描述现状:能将数据表现,还原成实际场景。 分析原因:能把导致现状的根本原因找出来。 预测未来:能根据现有的信息,对未来做出一个判断。 改善未来:能明确的定位出一些人,驱动他们去做一些事,让现状一步步走向理想状况。 二、判断是否存在问题的方法:指标监控的“一量三比” 在此,好好介绍2种常 阅读全文
posted @ 2023-01-29 20:30 DB乐之者 阅读(440) 评论(0) 推荐(0) 编辑
摘要:背景 最近很多时候需要将hivesql转化为prestosql ,这里面有很多不能直接复用需要调整func甚至改用其他逻辑。 为了后续方便查询,后面将总结以下经常用到的sql记录下来方便后续使用。 爆炸函数实现 hive:SELECT student,score FROM tests LATERAL 阅读全文
posted @ 2023-01-29 19:10 DB乐之者 阅读(375) 评论(0) 推荐(0) 编辑
摘要:安装过程 新建虚拟环境:conda create -n superset python=3.7 激活虚拟环境:conda activate superset -安装superset:pip install apache-superset -i [https://pypi.douban.com/sim 阅读全文
posted @ 2023-01-12 18:06 DB乐之者 阅读(327) 评论(0) 推荐(0) 编辑
摘要:定义:又称中值,统计学中的专有名词,是按顺序排列的一组数据中居于中间位置的数,代表一个样本、种群或概率分布中的一个数值,其可将数值集合划分为相等的上下两部分 要求不同商品售价的中位数,以及所有商品售价的中位数,数据初始化如下: 简单列举几个hive中可使用方法 法一:percentile_appro 阅读全文
posted @ 2023-01-12 15:08 DB乐之者 阅读(3101) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示