python使用xls实验

导入excel表格tips_mod.xls

出现的问题:
导入文件时候报错
[Errno 22] Invalid argument: 'd:\tips.xls'
解决方案:只需要将""改为"\"即可

import numpy as np
import pandas as pd
fdata=pd.read_excel('D:\\tips.xls')

print(fdata.head())

显示前5行数据

显示数据规格大小

print("规格大小")
print(fdata.shape)

显示描述信息

print("描述信息")
print(fdata.describe())

修改拼写错误的字段

print('查看time列有没有错误字段')
print(fdata['time'].unique())
print("修改拼写错误的字段")
fdata.loc[fdata['time']=='Diner','time']='Dinner'
print("修改后的数据为:")
print(fdata['time'].unique())

检测数据中的缺失值

print('监测数据中的缺失值')
print(fdata.isnull().sum())

删除一行内有两个缺失值的数据

print("删除一行内有两个缺失值的数据")
fdata.dropna(thresh=6,inplace=True)
# 只要有6个非缺失值就保留 inplace=true在原数据修改(修改fdata不是修改xls)
print('查看修改后的数据')
print(fdata.isnull().sum())

删除性别或者聚餐时间为空的行

print('删除性别或者聚餐时间为空的行')
fdata.dropna(subset=['sex','time'],inplace=True)
print('查看修改后的数据')
print(fdata.isnull().sum())

对剩余空缺的数据用平均值替代


posted @ 2022-04-21 20:02  kingwzun  阅读(458)  评论(0编辑  收藏  举报