python 学习的第六天 数据的预处理
1、空格值得删除:空格值得意思为数据文件上下之间没有对齐,,存在空格,不是空缺值
from pandas import read_csv; df = read_csv('D://PA//4.5//data.csv') newName = df['name'].str.strip(); df['name'] = newName;
2、缺失值的删除
from pandas import read_csv; df = read_csv('D://PA//4.4//data.csv'); newDF = df.dropna();
3、重复值得删除
from pandas import read_csv; df = read_csv('D://PA//4.3//data.csv') newDF = df.drop_duplicates();