python使用xls实验
导入excel表格tips_mod.xls
出现的问题:
导入文件时候报错
[Errno 22] Invalid argument: 'd:\tips.xls'
解决方案:只需要将""改为"\"即可
import numpy as np
import pandas as pd
fdata=pd.read_excel('D:\\tips.xls')
print(fdata.head())
显示前5行数据
显示数据规格大小
print("规格大小")
print(fdata.shape)
显示描述信息
print("描述信息")
print(fdata.describe())
修改拼写错误的字段
print('查看time列有没有错误字段')
print(fdata['time'].unique())
print("修改拼写错误的字段")
fdata.loc[fdata['time']=='Diner','time']='Dinner'
print("修改后的数据为:")
print(fdata['time'].unique())
检测数据中的缺失值
print('监测数据中的缺失值')
print(fdata.isnull().sum())
删除一行内有两个缺失值的数据
print("删除一行内有两个缺失值的数据")
fdata.dropna(thresh=6,inplace=True)
# 只要有6个非缺失值就保留 inplace=true在原数据修改(修改fdata不是修改xls)
print('查看修改后的数据')
print(fdata.isnull().sum())
删除性别或者聚餐时间为空的行
print('删除性别或者聚餐时间为空的行')
fdata.dropna(subset=['sex','time'],inplace=True)
print('查看修改后的数据')
print(fdata.isnull().sum())
对剩余空缺的数据用平均值替代