[译]如何根据条件从pandas DataFrame中删除不需要的行?

问题来源:https://stackoverflow.com/questions/13851535/how-to-delete-rows-from-a-pandas-dataframe-based-on-a-conditional-expression

问:
我有一个pandas DataFrame,我想删除它特定列中字符串差姑娘是大于2的行,我知道我可以使用df.dropna()来去除包含NaN的行,但我没有找到如何根据条件删除行。
似乎我能够这样做:

df[(len(df['column name']) < 2)]

但却报错了:
KeyError: u'no item named False'
谁能告诉我错在哪里了?

回答一:
当你这样做时,len(df['column name'])你只得到一个数字,即DataFrame中的行数(即列本身的长度)。如果要应用于len列中的每个元素,请使用df['column name'].map(len)。
尝试使用:

df[df['column name'].map(len) < 2]

评论:
我想出了一种使用列表解析的方法:df[[(len(x) < 2) for x in df['column name']]] 但是你这种方法更好些。

回答二:
要直接回答这个问题,一种方法是使用drop方法:

df = df.drop(some labels)
df = df.drop(df[<some boolean condition>].index)

要删除列“score”<50的所有行:

df = df.drop(df[df.score < 50].index)

替换版本

df.drop(df[df.score < 50].index, inplace=True)

多条件情况:
可以使用操作符: | 只需其中一个成立, & 同时成立, ~ 表示取反,它们要用括号括起来。
例如删除列“score<50 和>20的所有行

df = df.drop(df[(df.score < 50) & (df.score > 20)].index)
posted @   bingo彬哥  阅读(29657)  评论(0编辑  收藏  举报
编辑推荐:
· go语言实现终端里的倒计时
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
阅读排行:
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 使用C#创建一个MCP客户端
· ollama系列1:轻松3步本地部署deepseek,普通电脑可用
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· 按钮权限的设计及实现
本站总访问量8989051
点击右上角即可分享
微信分享提示