数据分析与展示——Matplotlib库入门
Matplotlib库入门
Matplotlib库介绍
Matliotlib库是Python优秀的数据可视化第三方库。
Matliotlib库的效果见:http://matplotlib.org/gallery.html
Matplotlib库由各种可视化类构成,内部结构复杂,受Matlab启发。
matplotlib.pyplot是绘制各类可视化图形的命令字库,相当于快捷方式。导入方式如下:
import matplotlib.pyplot as plt
范例:使用Matplotlib库绘图
import matplotlib.pyplot as plt plt.plot([3,1,4,5,2]) plt.ylabel("Grade") plt.savefig('test',dpi=600) #PNG文件 plt.show()
plt.savefig()将输出图形存储为文件,默认PNG格式,可以通过dpi修改输出质量。
import matplotlib.pyplot as plt plt.plot([0,2,4,6,8],[3,1,4,5,2]) plt.ylabel("Grade") plt.axis([-1, 10, 0, 6]) plt.show()
plt.plot(x,y)
只有一个输出列表或数组是,参数被当作Y轴,X轴以索引自动生成。当有两个以上参数时,按照X轴和Y轴顺序绘制数据点。plt.axis()指定X轴和Y轴的起始位置。
pyplot的绘图区域
plt.subplot(nrows,ncols,plot_number)
在全局绘图区域中创建一个分区体系,并定位到一个子绘图区域。
范例:分区域绘图
import numpy as np import matplotlib.pyplot as plt def f(t): return np.exp(-t) * np.cos(2 * np.pi * t) a = np.arange(0.0, 5.0, 0.02) plt.subplot(211) # 可以将3个参数合并传参 plt.plot(a ,f(a)) plt.subplot(2,1,2) plt.plot(a, np.cos(2 * np.pi * a),'r--') plt.show()
pyplot的plot()函数
plt.plot(x, y, format_string, **kwargs)
- x:X轴数据,列表或数组,可选(绘制多条曲线时,各条曲线的x不能省略)
- y:Y轴数据,列表或数组
- format_string:控制曲线的格式字符串(由颜色字符、风格字符和标记字符组成),可选
颜色字符 颜色字符 说明 颜色字符 说明 'b' 蓝色 'm' 洋红色 magenta 'g' 绿色 'y' 黄色 'r' 红色 'k' 黑色 'c' 青绿色 cyan 'w' 白色 '#008000' RGB某颜色(十六进制色彩) '0.8' 灰度值字符串 风格字符 风格字符 说明 风格字符 说明 '-' 实线 ':' 虚线 '--' 破折线 '' ' ' 无线条 '-.' 点划线 标记字符 标记字符 说明 标记字符 说明 '.' 点标记 's' 实心方形标记 ',' 像素标记(极小点) 'p' 实心五角标记 'o' 实心圈标记 '*' 星形标记 'v' 倒三角标记 'h' 竖六边形标记 '^' 上三角标记 'H' 横六边形标记 '>' 右三角标记 '+' 十字标记 '<' 左三角标记 'x' x标记 '1' 下花三角标记 'D' 菱形标记 '2' 上花三角标记 'd' 瘦菱形标记 '3' 左花三角标记 '|' 垂直线标记 '4' 右花三角标记 - **kwargs:第二组或更多(x, y, format_string)
- color:控制颜色,color='green'
- linestyle:线条风格,linestyle='dashed'
- marker:标记风格,marker='o'
- markerfacecolor:标记颜色,markerfacecolor='blue'
- marksize,标记尺寸,markerfacecolor=20
范例:将颜色字符、风格字符和标记字符组合使用
import numpy as np import matplotlib.pyplot as plt a = np.arange(10) plt.plot(a, a*1.5, a, a*2.5, a, a*3.5, a, a*4.5) plt.show()
import numpy as np import matplotlib.pyplot as plt a = np.arange(10) plt.plot(a, a*1.5,'go-', a, a*2.5,'rx', a, a*3.5,'*', a, a*4.5,'b-.') plt.show()
pyplot的中文显示
pyplot并不默认支持中文显示,需要rcParams修改字体实现。
import matplotlib.pyplot as plt import matplotlib matplotlib.rcParams['font.family']='SimHei' # 'SimHei'是黑体 plt.plot([3,1,4,5,2]) plt.ylabel("纵轴(值)") plt.savefig('test',dpi=600)
rcParams的属性
属性 | 说明 |
---|---|
'font.family' | 用于显示字体的名字 |
'font.style' | 字体风格,正常'normal'或斜体'italic' |
'font.size' | 字体大小,整数字号或者'large'、'x-small' |
rcParams['font.family']
中文字体 | 说明 |
---|---|
'SimHei' | 中文黑体 |
'Kaiti' | 中文楷体 |
'LiSu' | 中文隶书 |
'FangSong' | 中文仿宋 |
'YouYuan' | 中文幼圆 |
'STSong' | 华文宋体 |
import numpy as np import matplotlib.pyplot as plt import matplotlib matplotlib.rcParams['font.family']='STsong' matplotlib.rcParams['font.size']=20 a = np.arange(0.0, 5.0, 0.02) plt.xlabel('横轴:时间') plt.ylabel("纵轴:振幅") plt.plot(a, np.cos(2*np.pi*a),'r--') plt.show()
在有中文输出的地方,增加一个属性:fontproperties
import numpy as np import matplotlib.pyplot as plt a = np.arange(0.0, 5.0, 0.02) plt.xlabel('横轴:时间',fontproperties='SimHei',fontsize=20) plt.ylabel("纵轴:振幅",fontproperties='SimHei',fontsize=20) plt.plot(a, np.cos(2*np.pi*a),'r--') plt.show()
pyplot的文本显示函数
函数 | 说明 |
---|---|
plt.xlabel() | 对X轴增加文本标签 |
plt.ylabel() | 对Y轴增加文本标签 |
plt.title() | 对图形整体增加文本标签 |
plt.text() | 在任意位置增加文本 |
plt.annotate() | 在图形中增加带箭头的注解 |
范例:使用上述标签
plt.annotate(s, xy=arrow_crd, xytext=text_crd, arrowprops=dict)
import numpy as np import matplotlib.pyplot as plt a = np.arange(0.0, 5.0, 0.02) plt.plot(a, np.cos(2*np.pi*a),'r--') plt.xlabel('横轴:时间',fontproperties='SimHei',fontsize=15,color='green') plt.ylabel("纵轴:振幅",fontproperties='SimHei',fontsize=15) plt.title(r'正弦波实例$y=cos(2\pi x)$',fontproperties='SimHei',fontsize=25) plt.annotate(r'$\mu=100$',xy=(2,1),xytext=(3,1.5),arrowprops=dict(facecolor='black',shrink=0.1,width=2)) # plt.annotate() 中'$$'表示使用Latex格式,xy为箭头指向位置,xytext为文本显示位置,facecolor为箭头颜色,shrink为箭头缩进比率,width为箭头宽度。 plt.axis([-1, 6, -2, 2]) plt.grid(True) plt.show()
pyplot的子绘图区域:plt.subplot2grid()
plt.subplot2grid(GridSpec, CurSpec, colspan=1, rowspan=1)
理念:设定网格,选中网格,确定选中行列区域数量,编号从0开始
- GridSpec为二元组(m,n),表示将网格分为m行n列
- CurSpec为二元组(a,b),表示选择第几个网格,索引从0开始
- colspan和rowspan表示合并几个单元格,默认为1(不合并)
plt.subplot2grid((3,3),(1,0),colspan=2)
GridSpec类
import matplotlib import matplotlib.gridspec as gridspec matplotlib.rcParams['font.size']=6 gs = gridspec.GridSpec(3,3) ax1 = plt.subplot(gs[0, :]) ax2 = plt.subplot(gs[1, :-1]) ax3 = plt.subplot(gs[1:, -1]) ax4 = plt.subplot(gs[2, 0]) ax5 = plt.subplot(gs[2, 1])