数据分析

numpy:

  切片 arr[index,col]

  变形 reshape()

  级联 concatnate()

  切分

  排序

Series:

  过滤空值

  去重 unique()

DataFrame:

  创建

  索引:

    取列

    取行

    取元素

  切片:

    切列 df.loc[:,col]

    切行 df[]

  空值检测和过滤:

    空值检测函数:

      isnull.any(axis)

      notnull.all(axis)

    空值过滤思路:

    空值过滤函数 dropna(axis=0)

    检测重复行 drop_duplicated(keep)

    覆盖空值 fillna(method.axis)

    过滤重复行:

    随机取样:

      take([3,1,2,0],axis=1)

      random.permutaion(5)

    级联机制:

    合并机制:

    替换: replace(to_replace,value)

    映射: map() 充当运算工具:s.map(func) apply()

    分组: df.groupby(by)['xxx'].mean()

    分组聚合:

    df.groupby(by)['xxx'].apply(func)

    条件查询函数 df.query('')    

 

posted @ 2019-03-11 15:32  不喜欢酸甜的刘青阳  阅读(100)  评论(0编辑  收藏  举报