用均值填充缺失值

        假设数据已经通过如下代码读进来了

import pandas as pd

titanic_data = pd.read_csv('titanic_data.csv',encoding = 'gbk')

        均值填充

for column in list(titanic_data.columns[titanic_data.isnull().sum() > 0]):
    mean_val = titanic_data[column].mean()
    titanic_data[column].fillna(mean_val, inplace=True)

        pandas (sum、mean、max、min、idxmax、idxmin、cumsum、mad、std、var、diff、pct_change、corr)这些函数会默认排除NaN值
        通过指定 skipna=False ,可以使其包含 Nan

posted on 2021-06-12 09:45  雾恋过往  阅读(549)  评论(0编辑  收藏  举报

Live2D