pandas中的apply函数
pandas中的apply函数
- apply在调用函数时,默认将数据框逐行或逐列作为一个参数代入调用的函数中
- apndas 的
apply()
函数可以作用于Series
或者整个DataFrame
,功能也是自动遍历整个Series
或者DataFrame
, 对每一个元素运行指定的函数 。Pandas 的很多对象都可以使用apply()
来调用函数,如 Dataframe、Series、分组对象、各种时间序列等。
apply 函数接收带有参数的函数
- 键字参数。假设我们对不同的民族可以给不同的加分,定义 add_extra2() 函数通过 args = () 来传递参数,类型为 tuple,一般第一个函数默认为apply处理数据对象,所以agrs传参从第二个参数开始。
data = pd.DataFrame([[1,2,3],[3,4,6],[5,6,8],[7,8,8]],columns=['A','B',"C"])
def fun2(x,y):
if x>np.mean(y):
return 1
else:
return 0
data.loc[:,'A'].apply(fun2,args=(data.loc[:,'B'],))
- 键字参数,直接写就好如下面freq="M"
df[["HepB_1","HepB_2"]] = df[["HepB_1","HepB_2"]].apply(pd.PeriodIndex,freq="M")#添加参数
同时运用多个函数
- 有时候需要批量对同一列数据运用多个函数,这里只需以list将运用的函数传入即可
data = pd.DataFrame([[1,2,3],[3,4,6],[5,6,8],[7,8,8]],columns=['A','B',"C"])
data.loc[:,'A'].apply([str,float,int])
对多列运用同一函数
import pandas as pd
data = pd.DataFrame([[1,2,3],[3,4,6],[5,6,8],[7,8,8]],columns=['A','B',"C"])
cloum = df.columns[1:]
df[cloum].apply(float)
data.apply(float)
#上面无论是选取整个数据框或者多列数据均报错
TypeError: cannot convert the series to <class 'float'>
data.applymap(float)
记录学习的点点滴滴