2019年2月2日
摘要: groupby+rank 分组+排序 df['row_num']=df['a'].groupby(df['b']).rank(ascending=False,method='max') 阅读全文
posted @ 2019-02-02 18:00 fatcici 阅读(582) 评论(0) 推荐(0) 编辑
  2018年11月27日
摘要: 一、数据指标 产品运营,离不开数据埋点、获取、处理及分析。因此,要充分理解各类数据指标的含义及用途,才能用数据这把金钥匙打开运营的大门。 数据指标分为广告指标、网页指标和用户指标三种。 1、广告指标 (1)CPC CPC,即Cost Per Click, 每点击成本。 (2)CPM CPM,即cos 阅读全文
posted @ 2018-11-27 16:50 fatcici 阅读(635) 评论(0) 推荐(0) 编辑
  2018年11月10日
摘要: sr=pd.read_csv('/Users/macui 1 2/Documents/hot_ifx.csv',names=['timestamp','request1','request2','account_id','api_key','idcard','name','source','confidence','compare_platform','image_type'],header=0... 阅读全文
posted @ 2018-11-10 11:14 fatcici 阅读(135) 评论(0) 推荐(0) 编辑
  2018年1月14日
摘要: 吴恩达机器学习课程,第二讲。 1、多元线性回归 阅读全文
posted @ 2018-01-14 20:59 fatcici 阅读(98) 评论(0) 推荐(0) 编辑
  2017年5月19日
摘要: awk -F ',' '{split ($2,a,"-");split ($3,b,"-"); S[a[1]"\t"b[1]]++}END{for (s in S) print s"\t"S[s]}' huanji_2016_ori-2.csv |sort -r -n -t$'\t' -k3 >hu 阅读全文
posted @ 2017-05-19 14:30 fatcici 阅读(178) 评论(0) 推荐(0) 编辑
  2017年4月10日
摘要: huanji[(huanji['from'].str.contains('金立')) & (huanji['h_month']<201701)].groupby(huanji['to'].str.partition('-').get(0))['uid'].agg({'uv':'count'}).so 阅读全文
posted @ 2017-04-10 15:29 fatcici 阅读(455) 评论(0) 推荐(0) 编辑
  2017年3月30日
摘要: pd.pivot_table(df5,index=['key1','key2'],values=['data1','data2'],aggfunc=[np.sum,np.mean],margins=True) margins=True 会有加和后的数据 参考文章 http://python.jobb 阅读全文
posted @ 2017-03-30 19:13 fatcici 阅读(222) 评论(0) 推荐(0) 编辑
  2017年3月28日
摘要: 一 先筛选出还有'from'列中带有'iphone 6s'的行,然后对这些数据进行groupby,结果倒序排 约等同于sql中的groupby+where+order by +desc df[df['from'].str.contains('iphone 6s plus')].groupby(['f 阅读全文
posted @ 2017-03-28 15:06 fatcici 阅读(3563) 评论(0) 推荐(0) 编辑
摘要: 一 引入数据,以CSV为例 import pandas as pd import numpy as np df=pd.read_csv('/Users/cici/Documents/huanji_2017_ori.csv',header=0,sep='\t',names=['uid','month' 阅读全文
posted @ 2017-03-28 14:58 fatcici 阅读(149) 评论(0) 推荐(0) 编辑