Pandas笔记:缺失值处理
import pandas as pd import numpy as np data = pd.read_csv("./data/test.csv") print(data) print(pd.isnull(data)) # 缺失值True,其他False print(np.any(pd.isnull(data))) # 有缺失值True,没有False print(np.all(pd.notnull(data))) # 没有缺失True,有False print(pd.isnull(data).any()) # 每列是否有缺失 print(pd.notnull(data).all()) # 每列没有缺失 print(data.dropna()) # 删除所有的缺失值 print(data.fillna("NULL")) # 替换NULL # 替换 data_new = data.replace("?",value=np.nan) print(data_new.dropna())
a b c d 0 1 2 3.0 4.0 1 1 2 NaN 4.0 2 1 ? 3.0 4.0 3 1 2 3.0 4.0 4 1 2 3.0 NaN a b c d 0 False False False False 1 False False True False 2 False False False False 3 False False False False 4 False False False True True False a False b False c True d True dtype: bool a True b True c False d False dtype: bool a b c d 0 1 2 3.0 4.0 2 1 ? 3.0 4.0 3 1 2 3.0 4.0 a b c d 0 1 2 3 4 1 1 2 NULL 4 2 1 ? 3 4 3 1 2 3 4 4 1 2 3 NULL a b c d 0 1 2 3.0 4.0 3 1 2 3.0 4.0