数据分析
numpy:
切片 arr[index,col]
变形 reshape()
级联 concatnate()
切分
排序
Series:
过滤空值
去重 unique()
DataFrame:
创建
索引:
取列
取行
取元素
切片:
切列 df.loc[:,col]
切行 df[]
空值检测和过滤:
空值检测函数:
isnull.any(axis)
notnull.all(axis)
空值过滤思路:
空值过滤函数 dropna(axis=0)
检测重复行 drop_duplicated(keep)
覆盖空值 fillna(method.axis)
过滤重复行:
随机取样:
take([3,1,2,0],axis=1)
random.permutaion(5)
级联机制:
合并机制:
替换: replace(to_replace,value)
映射: map() 充当运算工具:s.map(func) apply()
分组: df.groupby(by)['xxx'].mean()
分组聚合:
df.groupby(by)['xxx'].apply(func)
条件查询函数 df.query('')