python学习04之柱形图和热图

  1、加载数据

    和折线图一样,我们首先都要将csv文件中的数据加载出来(代码是来自kaggle微教程中的)   

# Path of the file to read
flight_filepath = "../input/flight_delays.csv"

# Read the file into a variable flight_data
flight_data = pd.read_csv(flight_filepath, index_col="Month")

    你们可能会注意到,代码比我们在折线图中使用的代码略短。因为在本例中,由于行标签(来自“Month”列)不与日期对应,所以我们不在括号中添加parse_dates=True。

    但是,我们像以前一样保留前两段文本,以便同时提供这两段:

    数据集的文件路径(在本例中为flight_filepath)和将用于索引行的列的名称(在本例中,index_col="Month")

  2、检查数据

print(flight_data)

 

  3、条形图  

复制代码
# 设置长度和宽度
plt.figure(figsize=(10,6))

# 添加条形图的标签
plt.title("Average Arrival Delay for Spirit Airlines Flights, by Month")

# 标注X轴和Y轴的数据名
sns.barplot(x=flight_data.index, y=flight_data['NK'])

# 添加垂直轴的标签
plt.ylabel("Arrival delay (in minutes)")
复制代码

      第三行代码解析:

        它有三个主要组成部分:

          sns.barplot就是要告诉笔记本我们想要创建一个条形图。请记住,sns引用seaborn包,本课程中用于创建图表的所有命令都以这个前缀开始。

          x = flight_data.index—这决定在水平轴上使用什么。在本例中,我们选择了索引行的列(在本例中,是包含月份的列)。

          y=flight_data['NK'] -设置数据中的列,用于确定每个栏的高度。在本例中,我们选择“NK”列。

          注意:必须选择索引列flight_data。索引,并且不可能使用flight_data['Month'](它将返回一个错误)。

          这是因为当我们加载数据集时,“Month”列用于索引行。我们总是必须使用这种特殊的符号来选择索引列。

  4、热图

复制代码
#设置图形的宽度和高度
plt.figure(figsize=(14,7))

# 添加标签
plt.title("Average Arrival Delay for Each Airline, by Month")

# 热图显示了每个航空公司平均每个月的到达延迟
sns.heatmap(data=flight_data, annot=True)

# 添加水平轴的标签
plt.xlabel("Airline")
复制代码

      第三行代码解析:

        该代码有三个主要组件:

            sns.heatmap就是告诉笔记本,我们想创建一个热图。

            data=flight_data——这告诉笔记本使用flight_data中的所有条目来创建热图。
            annot=True——这确保每个单元格的值都出现在图表上。(省略这一项将删除每个单元格中的数字!)

 

posted on   喜欢世界的宇宙  阅读(606)  评论(0编辑  收藏  举报

努力加载评论中...

导航

点击右上角即可分享
微信分享提示