pandas库的一些操作

1.pd.value_count():带入数值可以计算出value有多少的类别

#得到类别的降序
tips['day'].value_counts(sort=True,ascending=True)

 2.sort_values()(按照数值进行排列)/sort_index()(对index/columns的大小进行排列),其中axis=0是默认的值,代表值列

3.reshape():这个是numpy的一个函数,我们可以先把Dataframe.values转换为矩阵再用,一个2*3的Dataframe变成一个shape为(5,1)的dateframe,可以直接用data.reshape(-1,1),其中的-1是自动识别的意思.

4.drop('columns',axis=1)删除行,但是不是在原来的数据做,而是返回结果.

5.idxmax()返回所在的行或是列的最大值的索引

6.unique()返回独一无二的值

posted @ 2018-10-21 18:01  yskn  阅读(211)  评论(0编辑  收藏  举报