对dataframe中某一列进行计数

本来是一项很简单的任务。。。但很容易忘记搞混。。所以还是记录一下

方法一：

df['col'].value_counts()

方法二：

groups = df.groupby('col')
groups.size()  # 这里很容易就用上counts所以错误...

对index进行更改：

df2.index = df2.index.map(f) # f为函数

按值排序

基本语法：by='name' 指定按该行/列来排序；默认ascending=True，升序排序；

>>> df3 = pd.DataFrame(np.random.randint(0,10,(4, 3)), columns=list('bde'), index=range(4))
>>> df3
   b  d  e
0  3  6  7
1  7  7  2
2  4  5  4
3  1  0  3

# 默认axis=0，对col_name列进行排序，该列中每个值对应的行也跟着变动；

df.sort_index(by='col_name')

>>> df3.sort_values(by='b')
   b  d  e
3  1  0  3
0  3  6  7
2  4  5  4
1  7  7  2

# 对第row_name行进行排序，该行中每个值相应的列也跟着变动，ascending=False 降序

df.sort_index(by='row_name', axis=1, ascending=False)

>>> df3.sort_values(by=3, ascending=False, axis=1)
   e  b  d
0  7  3  6
1  2  7  7
2  4  4  5
3  3  1  0

posted @ 2019-03-18 21:27 chen狗蛋儿阅读(16150) 评论(0) 收藏举报

刷新页面返回顶部

chen狗蛋儿

对dataframe中某一列进行计数

对index进行更改：

按值排序

公告