pandas参数设置小技巧
在日常使用pandas
的过程中,由于我们所分析的数据表规模、格式上的差异,使得同样的函数或方法作用在不同数据上的效果存在差异。
而pandas
有着自己的一套参数设置系统,可以帮助我们在遇到不同的数据时灵活调节从而达到最好的效果,本文就将介绍pandas
中常用的参数设置方面的知识。

1 设置DataFrame最大显示行数
pandas
设置参数中的display.max_rows
用于控制打印出的数据框的最大显示行数,我们使用pd.set_option()
来有针对的设置参数,如下面的例子:

在修改display.max_rows
的参数值之后,我们的数据框只会显示指定行数的数据,中间的部分都会以省略号的形式显示,当我们的数据框行数较多,可以加大这个参数以显示更多行数据。
2 设置DataFrame最大显示列数
类似display.max_rows
,通过修改display.max_columns
我们可以调节最大显示的数据框列数(默认是20列),这在我们的数据框字段较多又想全部查看的时候很有用:

3 设置每列的最大显示宽度
对于一些单元格内容长度较长的数据譬如长文本,在查看数据框时过长的部分会被简化为省略号,而通过修改display.max_colwidth
参数我们可以在必要时,使得超长的部分也显示出来:

4 指定小于某个数的元素显示为0
通过display.chop_threshold
参数我们在不修改原始数据的情况下,指定数据框中绝对值小于阈值的数显示为0:

5 格式化浮点数
通过display.float_format
参数我们可以设置浮点数的显示格式,譬如这里我们给浮点数加上¥
前缀并设定保留两位小数:

6 设置info()方法中非缺失值检查的行数上限
针对数据框的info()
方法可以帮助我们查看数据框的一些概览信息,譬如每一列对应的非缺失值个数。
但默认情况下当数据框行数大于1690784行时,再查看info()
信息,会处于计算效率的考虑略去缺失值检查信息。
这时我们可以通过设置display.max_info_rows
参数来提高这个上限:

7 控制小数打印的精度
控制数据框中小数的显示精度除了上文提到的方法之外,还可以通过修改display.precision
参数来控制,默认是6位小数:

8 临时修改参数
有些时候我们只希望在某张表上进行设置参数的修改,不希望影响到之后的其他表的显示。
这时除了用pd.reset_option()
对指定的参数进行复原之外,我们还可以利用with
关键词配合pd.option_context
以临时的方式将指定的参数作用在局部范围内:

以上就是本文的全部内容,欢迎在评论区与我进行讨论~
作者:Feffery
出处:https://www.cnblogs.com/feffery/p/13546877.html
版权:本作品采用「署名-非商业性使用-相同方式共享 4.0 国际」许可协议进行许可。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
· DeepSeek 开源周回顾「GitHub 热点速览」
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!
· AI与.NET技术实操系列(二):开始使用ML.NET
· 单线程的Redis速度为什么快?