pandas 排序和排名 —— sort_index、sort_values、rank
Series和DataFrame可以按照索引进行排序,也可以按照值来排序,对值也可以进行排名。
一,按照索引排序(sort by index)
对于一个Series或DataFrame,可以按照索引进行排序,使用sort_index()函数来实现索引的排序:
DataFrame.sort_index(axis=0, level=None, ascending=True, inplace=False, kind='quicksort', na_position='last', sort_remaining=True, ignore_index=False, key=None)
参数axis用于指定用于排序的轴,默认值是0(行),也可以设置为1(列)。
举个例子,有如下的序列:
obj = Series([1,2,3,4],index=['d','a','b','c']) print(obj.sort_index())
对于一个DataFrame,列索引和行索引都是索引,既可以按照行索引排序,也可以按照列索引排序。
二,按照值排序 ( sort by values)
DataFrame 和Series也可以使用sort_values()函数对数据值进行排序:
DataFrame.sort_values(by, axis=0, ascending=True, inplace=False, kind='quicksort', na_position='last', ignore_index=False, key=None)
参数axis用于指定用于排序的轴,默认值是0(行),也可以设置为1(列)。如果axis=0,那么参数by用于指定某一个行索引的名称;如果axis=1,那么参数by用于指定某一个列名。
obj = Series([1,4,3,2],index=['d','a','b','c']) print(obj.sort_values())
三,排名(rank)
排名是指为数据进行一个排名,排名的顺序从1开始,依次加1递增。
DataFrame.rank(axis=0, method='average', numeric_only=NoDefault.no_default, na_option='keep', ascending=True, pct=False)
举个例子,按照Number_legs对数据进行排序:
df = pd.DataFrame(data={'Animal': ['cat', 'penguin', 'dog', 'spider', 'snake'], 'Number_legs': [4, 2, 4, 8, np.nan]}) df['default_rank'] = df['Number_legs'].rank(method='dense')
参考文档:
作者:悦光阴
本文版权归作者和博客园所有,欢迎转载,但未经作者同意,必须保留此段声明,且在文章页面醒目位置显示原文连接,否则保留追究法律责任的权利。