「Python实用秘技07」在pandas中实现自然顺序排序

本文完整示例代码及文件已上传至我的Github仓库https://github.com/CNFeffery/PythonPracticalSkills

  这是我的系列文章「Python实用秘技」的第7期,本系列立足于笔者日常工作中使用Python积累的心得体会,每一期为大家带来一个几分钟内就可学会的简单小技巧。

  作为系列第7期,我们即将学习的是:在pandas中实现自然排序顺序

  自然排序顺序(Natural sort order),不同于默认排序针对字符串逐个比较对应位置字符的ASCII码的方式,它更关注字符串实际相对大小意义的排序,举个常见的例子,假如我们有下面这样的一张表,其中value字段是百分比格式的字符串:

  这时如果直接照常基于value字段进行排序,得到的结果明显不符合数据实际意义:

  而我们今天要介绍的技巧,就需要用到第三方库natsort,使用pip install natsort完成安装后,利用其index_natsorted()对目标字段进行自然顺序排序,再配合np.argsort()以及pandassort_values()中的key参数,就可以通过自定义lambda函数,实现利用目标字段自然排序顺序进行正确排序的目的:

  可以看到,此时得到的排序结果完美符合我们的需求~

  更多natsort知识欢迎前往https://github.com/SethMMorton/natsort学习更多。


  本期分享结束,咱们下回见~👋

作者:Feffery

出处:https://www.cnblogs.com/feffery/p/16156984.html

版权:本作品采用「署名-非商业性使用-相同方式共享 4.0 国际」许可协议进行许可。

posted @   费弗里  阅读(729)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· DeepSeek 开源周回顾「GitHub 热点速览」
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!
· AI与.NET技术实操系列(二):开始使用ML.NET
· 单线程的Redis速度为什么快?
点击右上角即可分享
微信分享提示
more_horiz
keyboard_arrow_up dark_mode palette
选择主题