df_clean.apply(pd.to_numeric, errors='ignore')

在复习之前学习的pandas代码时发现这句话 df_clean.apply(pd.to_numeric, errors='ignore') 感到十分疑惑，apply（）是什么函数，pd.to_numeric又是啥，errors=""有啥作用。

接下来一一解答：

一、map(), apply()和applymap()

　　1.map():

　　　　map() 是一个Series的函数，DataFrame结构中没有map()。map()将一个自定义函数应用于Series结构中的每个元素(elements)。

　　　　下面举一个例子　将w列都加1

    test1=pd.DataFrame(np.arange(12).reshape(3, 4), index=list("abc"), columns=list("WXYZ"))#先构造一个随机的测试数据
    print(test1)
    test1["W"]=test1["W"].map(lambda x:x+1)#将w列的数都加1
    # #lambda在这里其实是在定义一个简单的函数，一个没有函数名的函数
    print(test1)

　　2.apply（）:

　　　　apply()将一个函数作用于DataFrame中的每个行或者列

　　　　下面我们将w，x列相加

　　　　按列相加

    test1['total'] = test1[['W', 'X']].apply(lambda x: x.sum(), axis=1)#按列相加
    print(test1)

　　　　按行相加

    test1.loc['total'] = test1[['W', 'X']].apply(lambda x: x.sum(), axis=0)#按行相加
    print(test1)

　　3.applymap（）:

　　　　将函数做用于DataFrame中的所有元素(elements)

　　　　将所有元素都加5　

def addFive(X):
    return X+5

    test1=test1.applymap(addFive)
    print(test1)

二、pd.to_numeric

　　将参数转换为数字类型。

　　errors中参数的解释：

　　　　'raise'参数：无效的解析将引发异常

　　　　'corece'参数：将无效解析设置为NaN

　　　　'ignore'参数：无效的解析将返回输入

　　先构造数据

    s = pd.Series(['test', '1.0', '2', '2021-12-5', 1, False, None, pd.Timestamp('2021-12-05')])
    print(s)

　　　执行raise会报错，因为该数据里面有非数字

 pd.to_numeric(s,errors="raise")

　　执行ignore只对数字字符串转型，其他不转换

pd.to_numeric(s,errors="ignore")

　　执行coerce会将时间，bool，数字字符串转换为数字，其他为NaN

pd.to_numeric(s,errors="coerce")

posted @ 2021-12-05 09:14 风吹过半夏阅读(1283) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

阅读排行：
· 分享 3 个 .NET 开源的文件压缩处理库，助力快速实现文件压缩解压功能！
· Ollama——大语言模型本地部署的极速利器
· 使用C#创建一个MCP客户端
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型，支持深度思考和联网搜索！
· Windows编程----内核对象竟然如此简单？

公告

昵称：风吹过半夏
园龄： 4年8个月
粉丝： 14
关注： 4

+加关注

2025年3月

日

一

二

三

四

五

六

随笔分类

随笔档案

阅读排行榜

评论排行榜

1. 大二下学期团队项目（后台与前端代码结合）(1)

风吹过半夏

df_clean.apply(pd.to_numeric, errors='ignore')

公告

搜索

常用链接

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论