用python实现对csv文件的基本处理,并画出箱式图
1.添加相关类库
import pandas as pd
import pandas as np
import matplotlib.pyplot as plt
2.导入csv文件
data=pd.read_csv('catering_sale.csv')
3.输出数据集的基本信息
data1=data.describe()
输出结果:
sale
count 200
mean 2755
std 751.029772
min 22
25% 2451.975
50% 2655.85
75% 3026.125
max 9106.44
4.统计缺失的变量和样本个数
data2=data.isnull().sum()
输出结果:
日期 0
sale 1
dtype: int64
5.删除缺失的变量
data.dropna(axis=0,how='any',inplace=True)
6.画箱式图
plt.boxplot(
x = data.sale, # 指定绘图数据
patch_artist=True, # 要求用自定义颜色填充盒形图,默认白色填充
showmeans=True, # 以点的形式显示均值
boxprops = {'color':'black','facecolor':'#9999ff'}, # 设置箱体属性,填充色和边框色
flierprops = {'marker':'o','markerfacecolor':'red','color':'black'}, # 设置异常值属性,点的形状、填充色和边框色
meanprops = {'marker':'D','markerfacecolor':'indianred'}, # 设置均值点的属性,点的形状、填充色
medianprops = {'linestyle':'--','color':'orange'}) # 设置中位数线的属性,线的类型和颜色
plt.show()
输出结果: