摘要:
1、group by代替distinct去重 2、减少模糊查询如like,以最大化利用索引 3、表连接前利用where筛选 4、减少不必要的字段查询 5.尽量使用select 具体字段代替select * 6、防止数据倾斜 7、合理利用分区 8、使用union all减少连接次数,且方便后续优化 9 阅读全文
摘要:
1.留存指标 新用户的留存和所有用户留存不太一样 方法一:python import pandas as pddf=pd.read_csv('user_behavior.csv')df=df[['user_id','timestamps']]df['timestamps']=pd.to_dateti 阅读全文