2022 年 8月 27 日随笔档案 - 萧六弟

2022年8月27日

摘要： 1、group by代替distinct去重 2、减少模糊查询如like，以最大化利用索引 3、表连接前利用where筛选 4、减少不必要的字段查询 5.尽量使用select 具体字段代替select * 6、防止数据倾斜 7、合理利用分区 8、使用union all减少连接次数，且方便后续优化 9 阅读全文

posted @ 2022-08-27 23:09 萧六弟阅读(16) 评论(0) 推荐(0) 编辑

AARRR:2.3

摘要： 1.留存指标新用户的留存和所有用户留存不太一样方法一：python import pandas as pddf=pd.read_csv('user_behavior.csv')df=df[['user_id','timestamps']]df['timestamps']=pd.to_dateti 阅读全文

posted @ 2022-08-27 21:35 萧六弟阅读(38) 评论(0) 推荐(0) 编辑

戴小帅的学习笔记

公告