导入excel表格tips_mod.xls
出现的问题:
导入文件时候报错
[Errno 22] Invalid argument: 'd:\tips.xls'
解决方案:只需要将""改为"\"即可
| import numpy as np |
| import pandas as pd |
| fdata=pd.read_excel('D:\\tips.xls') |
| |
| print(fdata.head()) |
显示前5行数据
显示数据规格大小
| print("规格大小") |
| print(fdata.shape) |
显示描述信息
| print("描述信息") |
| print(fdata.describe()) |
修改拼写错误的字段
| print('查看time列有没有错误字段') |
| print(fdata['time'].unique()) |
| print("修改拼写错误的字段") |
| fdata.loc[fdata['time']=='Diner','time']='Dinner' |
| print("修改后的数据为:") |
| print(fdata['time'].unique()) |
检测数据中的缺失值
| print('监测数据中的缺失值') |
| print(fdata.isnull().sum()) |
| |
删除一行内有两个缺失值的数据
| print("删除一行内有两个缺失值的数据") |
| fdata.dropna(thresh=6,inplace=True) |
| |
| print('查看修改后的数据') |
| print(fdata.isnull().sum()) |
删除性别或者聚餐时间为空的行
| print('删除性别或者聚餐时间为空的行') |
| fdata.dropna(subset=['sex','time'],inplace=True) |
| print('查看修改后的数据') |
| print(fdata.isnull().sum()) |
对剩余空缺的数据用平均值替代
本文作者:kingwzun
本文链接:https://www.cnblogs.com/kingwz/p/16175812.html
版权声明:本作品采用知识共享署名-非商业性使用-禁止演绎 2.5 中国大陆许可协议进行许可。
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步