用python实现对csv文件的基本处理,并画出箱式图

1.添加相关类库

import pandas as pd

import pandas as np

import matplotlib.pyplot as plt

2.导入csv文件

data=pd.read_csv('catering_sale.csv')

3.输出数据集的基本信息

data1=data.describe()

输出结果:

              sale

count     200

mean    2755

std        751.029772

min       22

25%      2451.975

50%      2655.85

75%      3026.125

max       9106.44

4.统计缺失的变量和样本个数

data2=data.isnull().sum()

输出结果:

日期    0

sale    1

dtype: int64

5.删除缺失的变量

data.dropna(axis=0,how='any',inplace=True)

6.画箱式图

plt.boxplot(
x = data.sale, # 指定绘图数据

patch_artist=True, # 要求用自定义颜色填充盒形图,默认白色填充

showmeans=True, # 以点的形式显示均值

boxprops = {'color':'black','facecolor':'#9999ff'}, # 设置箱体属性,填充色和边框色

flierprops = {'marker':'o','markerfacecolor':'red','color':'black'}, # 设置异常值属性,点的形状、填充色和边框色

meanprops = {'marker':'D','markerfacecolor':'indianred'}, # 设置均值点的属性,点的形状、填充色

medianprops = {'linestyle':'--','color':'orange'}) # 设置中位数线的属性,线的类型和颜色
plt.show()

输出结果:

 

posted @ 2021-03-12 16:09  暗影猎手1  阅读(2035)  评论(1编辑  收藏  举报