数据科学包——Matplotlib

  • Matplotlib
    • 包:imoprt matplotlib.pyplot as plt
    • 散点图
      • 作用:显示两变量相关性
        • 正相关
        • 负相关
        • 不相关
      • plt.scatter(x,y)
      • 参数
        • 点的大小:s=面积大小
        • 颜色:c=‘r’
        • 点的形状:marker=’<’
        • 透明度:alpha=
    • 折线图
      • 作用:观察数据随时间变化的趋势
      • plt.plot(x,y)
      • plt.plot_date(x,y,’-’)
      • 参数
        • 线的形状:linestyle=’–’
        • 颜色:color=‘red’
        • 点的形状:marker=’<’
    • 条形图
      • 作用:比较多个类的数据大小
      • 有利于较小数据集的分析
      • plot.bar(left=x, height=y)
      • 参数
        • 颜色:color = ‘blue’
        • 宽度:width=
        • 变为水平条形图:orientation:‘horizontal’
        • 层叠图:bottom=上一层的变量x
      • 直接画水平条形图:plot.barh()
    • 直方图
      • 作用:表示数据分布的情况
      • 一维直方图:plt.hist(x,bins=均分为几块,color=,normed=是否标准化)
      • 二维直方图:plot.hist2d(x,y,bins=)
    • 饼状图
      • 作用:数据各项大小占总和的比例
      • plt.pie(x=数据,labels=标签)
      • 参数
        • 显示具体比例值:autopct=’%.0f%%’
        • 每一部分距圆心的距离:explode=距离列表
        • 阴影:shadow=True
      • 为了让饼状图为正圆,需要将x,y的比例为1:1
        • plt.axes(aspect=1)
    • 箱型图
      • 作用:显示数据分散情况
      • 解释
        • 直线分隔
          • 上边缘
          • 上四分位数
          • 中位数
          • 下四分位数
          • 下边缘
          • 异常值
      • plot.boxplot(x)
      • 多个箱型图:plot.boxplot(xs,labels=)
      • 参数
        • 调整异常点形状:sym=‘0’
        • 边界同最近四分位数之间的距离:whis=
    • 颜色和样式
      • 颜色
        • 内建颜色
          • b:blue
          • g:green
          • r:red
          • c:cyan
          • m:magenta
          • y:yellow
          • k:black
          • w:white
        • 灰度
          • ‘0.5’
        • 十六进制
          • ‘#FF00FF’
        • RBG元组
          • (0.2,0.4,0.2)
      • plot()有marker参数画线,没有画点
      • 点和线的样式
        • 具体查文档
    • 画布
      • fig = plt.figure()
        • 可以添加Axes实例
      • 子图
        • ax = fig.add_subplot(111)
          • 返回Axes实例
          • 参数1:子图总行数
          • 参数2:子图总列数
          • 参数3:子图位置
          • 在figure上添加axes的常用方法
      • 多图
        • 创建多个figure对象
      • 网格
        • 显示网格
          • plt.grid(True)
          • 参数
            • color=
            • linewidth=
            • linestyle=
    • 图例
      • plt.legend(可选标签列表)
        • 也可以在plot里定义label 参数
      • 参数
        • 位置:loc=索引值
          • 具体见文档
          • 自适应为0
        • 扁平化:ncol=分的列数
    • 坐标轴范围
      • plt.axis([xmin,xmax,ymin,ymax])
      • x轴
        • plt.xlim([min,max])
      • y轴
        • plt.ylim([min,max])
      • 只调整一边:参数xmin/xmax =
    • 坐标轴刻度
      • plot对象.locator_param(‘x/y’,nbins=)
        • 刻度分为多少格
      • 获取当前对象坐标轴:plt.gca()
      • 面向对象
        • ax.xaxis.et_majot_formatter
        • 自适应:fig.autpfmt_xdata()
    • 添加坐标轴
      • plt.twinx()
      • plt.twiny()
  • 注释
    • plt.annotate(‘注释内容’, xy=注释位置元组, xytext=注释文本的起始坐标元组, arrowprops=dict(facecolor=‘r’, frac=箭头所占比例, headwidth=箭头宽度, width=箭身宽度) )
  • 添加文本
    • plt.text(起始x,起始y,‘文字内容’)
    • 参数
      • 字体:family
      • 字号:size
      • 字体颜色:color
      • 样式
        • ‘normal’
        • 斜体:‘italic’
      • 字体粗细:weight
      • 外框:bbox=dict(color=, alpha=)
  • Tex公式
    • r’\(latex公式内容\)
  • 区域填充
    • 填充曲线
      • pl.fill(x,y, color,alpha=)
      • 不需要再画线
    • 在两曲线间填充
      • plt.gca.fill_between(x,y1,y2, facecolor=)
      • 参数
        • where=y1>y2#条件表达式
        • interpolate=True # 填充离散值造成的缝隙
  • 形状
    • 包:import matplotlib.patches as mpatches
    • 圆形
      • mpatches.Circle()
    • 矩形
      • mpatches.Rectangle()
    • 多边形
      • mpatches.RegularPolygon()
    • 椭圆
      • mpatches.Ellipes()
    • 将形状加到画布上
      • ax.add_patch(对象)
  • 样式
    • plt.style.use()
posted @ 2020-05-27 21:19  败家小林  阅读(200)  评论(0编辑  收藏  举报