python金融与量化分析------Matplotlib(绘图和可视化)

-----------------------------------------------------------Matplotlib:绘图和可视化------------------------------------------------------------------------------
    Matplotlib:---------------------------------------------------是一个强大的Python绘图和数据可视化的工具包
    一:安装方法:------------------------------------------------pip install matplotlib
    
    二:引用方法:------------------------------------------------import matplotlib.pyplot as plt
    
    三:使用:
        1:绘图函数:---------------------------------------------plt.plot()
        2:显示函数------------------------------------------------plt.show()
        3:plot函数:绘制折线图
            ----线型:------------------------------------------------(-,-.,--,..,-.,......等)
            ----点型:------------------------------------------------marker(v,^,s,*,H,+,X,D,o,......等)
            ----颜色:------------------------------------------------color(b,g,r,y,k,w,......等)
            plot函数绘制多条曲线
            pands包对plot的支持
        4:Matplotlip:图像标注
            ----设置图像标题:----------------------------------------plt.title()
            ----设置x轴名称:-----------------------------------------plt.xlabel()
            ----设置y轴名称:-----------------------------------------plt.ylabel()
            ----设置x轴范围:-----------------------------------------plt.xlim()
            ----设置y轴名称:-----------------------------------------plt.ylim()
            ----设置x轴刻度:-----------------------------------------plt.xticks()
            ----设置y轴刻度:-----------------------------------------plt.yticks()
            ----设置曲线图例:-----------------------------------------plt.legend()
        5:Matplotlib:画布与子图
            ----画布--------------------------------------------------figure
                fig = plt.figure()
            ----图:--------------------------------------------------subplot
                ax1 = fig.add subplot(2,2,1)
                
            ----调节子图间距:----------------------------------------subplots_adjust(left, bottom, right, top, wspace, hspace)
        6:Matplotlib-支持的图类型
            坐标图:--------------------------------------------------plt.plot(x,y,fmt,...)

            箱型图:--------------------------------------------------plt.boxplot(data, notch, position)

            条形图:--------------------------------------------------plt.bar(left,height,width,bottom)

            横向条形图:----------------------------------------------plt.barh(width,bottom,left,height)

            极坐标图:------------------------------------------------plt.polar(theta, r)

            饼图:----------------------------------------------------plt.pie(data, explode)

            功率谱密度图:--------------------------------------------plt.psd(x,NFFT=256,pad_to,Fs)

            谱图:----------------------------------------------------plt.specgram(x,NFFT=256,pad_to,F)

            X-Y相关性函数:-------------------------------------------plt.cohere(x,y,NFFT=256,Fs)

            散点图:--------------------------------------------------plt.scatter(x,y)

            步阶图:--------------------------------------------------plt.step(x,y,where)

            直方图:--------------------------------------------------plt.hist(x,bins,normed)
        
        7:Matplotlib——绘制K线图
            matplotlib.finanace子包中有许多绘制金融相关图的函数接口。
            绘制K线图:matplotlib.finance.candlestick_ochl函数

实例:

1:
import matplotlib.pyplot as plt
plt.plot([1,2,3,4])
plt.show()

运行结果
这里写图片描述

你可能会很疑惑X和Y轴为什么是0~3和1~4。原因是这样的,这里我们只是为plot()命令提供 了一个list或者是array,matplotlib就会假设这个序列是Y轴上的取值,并且会自动为你生成X轴上的值。因为python中的范围是从0开始的,因此X轴就是从0开始,长度与Y的长度相同,也就是[0,1,2,3]。

plot()是一个灵活的命令,它的参数可以是任意数量,比如:

    plt.plot([1, 2, 3, 4], [1, 4, 9, 16])
  • 1

这表示的是(x,y)对,(1,1)(2,4)(3,9)(4,16)。这里有第三个可选参数,它是字符串格式的,表示颜色和线的类型。该字符串格式中的字母和符号来自于MATLAB,它是颜色字符串和线的类型字符串的组合。默认情况下,该字符串参数是’b-‘,表示蓝色的实线。
举一个使用红色圆圈绘制上述点集的例子:

    import matplotlib.pyplot as plt
    plt.plot([1,2,3,4], [1,4,9,16], 'ro')
    plt.axis([0, 6, 0, 20])
    plt.show()

这里写图片描述

可以查看plot()的文档,那里有完整的关于线的类型的说明。axis()命令可以方便的获取和设置XY轴的一些属性。

如果matplotlib仅限于使用上面那种list,那么它将显得毫无用处。通常,我们都是使用numpy数组,实际上,所有的序列都将被在内部被转化成numpy数字。下面的例子是使用一个命令用几种不同风格的线绘制一个数组:

    import numpy as np
    import matplotlib.pyplot as plt

    # 0到5之间每隔0.2取一个数
    t = np.arange(0., 5., 0.2)

    # 红色的破折号,蓝色的方块,绿色的三角形
    plt.plot(t, t, 'r--', t, t**2, 'bs', t, t**3, 'g^')
    plt.show()

这里写图片描述

  • 控制线的属性
    线有许多属性可以设置:线宽、线的形状,平滑等等。这里有一些设置线属性的方法:

    • 使用关键字参数
    plt.plot(x,y,linewidth=2.0)
    • 1
    • 对线对象(Line2D)使用set_方法,plot()会返回一个线对象的列表,比如line1, line2 = plot(x1, y1, x2, y2)。下面的代码我们将假设我们只有一条线,即返回的线对象列表的长度为1。
    line, = plt.plot(x, y, '-')
    line.set_antialiased(False) # 关闭平滑
    • 1
    • 2
    • 使用setp()命令。 下面的例子使用的是MATLAB风格的命令去设置一个线的列表的多个属性。setp()可以作用于一个列表对象或者是一个单一的对象。你可以使用python风格的关键字参数或者是MATLAB风格的string/value对为参数:
    lines = plt.plot(x1, y1, x2, y2)
    
    # 使用关键字
    
    plt.setp(lines, color='r', linewidth=2.0)
    
    # 或者是MATLAB风格的string/value对
    
    plt.setp(lines, 'color', 'r', 'linewidth', 2.0)
  • 这是一些Line2D的属性和取值:
    这里写图片描述

  • 工作在多图形(figures)和多坐标系(axes)
    MATLAB和pyplot都有当前图形(figure)和当前坐标系(axes)的概念。所有的绘图命令都是应用于当前坐标系的。gca()和gcf()(get current axes/figures)分别获取当前axes和figures的对象。通常,你不用担心这些,因为他们都在幕后被保存了,下面是一个例子,创建了两个子绘图区域(subplot):

    import numpy as np
    import matplotlib.pyplot as plt
    
    def f(t):
        return np.exp(-t) * np.cos(2*np.pi*t)
    
    t1 = np.arange(0.0, 5.0, 0.1)
    t2 = np.arange(0.0, 5.0, 0.02)
    
    plt.figure("2subplot")
    plt.subplot(211)
    plt.plot(t1, f(t1), 'bo', t2, f(t2), 'k')
    
    plt.subplot(212)
    plt.plot(t2, np.cos(2*np.pi*t2), 'r--')
    plt.show()
  • 这里写图片描述

    figure()命令在这儿可以不写,因为figure(1)将会被默认执行,同样,subplot(111)也是默认被执行的。subplot()中的参数分别指定了numrows、numcols、fignum,其中fignum的取值范围为1到numrows*numcols,分别表示的是将绘图区域划分为numrows行和numcols列个子绘图区域,fignum为当前子图的编号。编号是从1开始,一行一行由左向右编号的。其实subplot中的参数【111】本应写作【1,1,1】,但是如果这三个参数都小于10(其实就是第三个参数小于10)就可以省略逗号。你可以创建任意数量的子图(subplots)和坐标系(axes)。如果你想手动放置一个axes,也就是它不再是一个矩形方格,你就可以使用命令axes(),它可以让坐标系位于任何位置,axes([left,bottom,width,height]),其中所有的值都是0到1(axes([0.3,0.4,0.2,0.3])表示的是该坐标系位于figure的(0.3,0.4)处,其宽度和长度分别为figure横坐标和纵坐标总长的0.2和0.3)。其实subplot和axes的区别就在于axes大小和位置更加随意。
    你可以创建多个figure,通过调用figure(),其参数为figure的编号。当然每个figure可以包含多个subplot或者是多个axes。例子:

    import matplotlib.pyplot as plt
    plt.figure(1)                # 编号为1的figure
    plt.subplot(211)             # figure1中的第一个子图
    plt.plot([1, 2, 3])
    plt.subplot(212)             # figure1中的第二个子图
    plt.plot([4, 5, 6])
    
    
    plt.figure(2)                # figure2
    plt.plot([4, 5, 6])          # 默认使用subplot(111),此时figure2为当      
                                 # 前figure
    
    plt.figure(1)                # 设置figure1为当前figure;  
                                 # 但是subplot(212)为当前子图
    plt.subplot(211)             # 使subplot(211)为当前子图
    plt.title('Easy as 1, 2, 3') # 对subplot(211)命名
  • 我们可以使用clf()和cla()(clear current figure/axes)清除当前figure和当前axes。
    如果你创建了许多figures,你需要注意一件事:figure的内存直到显示调用close()函数才会被完全释放,否则它并没有被全部释放。如果只是删掉对figure的引用,或者是通过关闭window进程管理器关闭该figure,这都是不完全删除figure的,因为pyplot在内部维持了一个引用,直到close()被调用。

  • 文字
    text()命令可以被用来在任何位置添加文字,xlabel()、ylabel()、title()被用来在指定位置添加文字。

    import numpy as np
    import matplotlib.pyplot as plt
    
    mu, sigma = 100, 15
    x = mu + sigma * np.random.randn(10000)
    
    
    # 直方图
    
    n, bins, patches = plt.hist(x, 50, normed=1, facecolor='g', alpha=0.75)
    
    
    plt.xlabel('Smarts')
    plt.ylabel('Probability')
    plt.title('Histogram of IQ')
    plt.text(60, .025, r'$\mu=100,\ \sigma=15$')
    plt.axis([40, 160, 0, 0.03])
    plt.grid(True)
    plt.show()
  • 这里写图片描述
    所有text()命令返回一个matplotlib.text.Text实例,像上面的线一样,可以通过关键字参数在text()定制文本样式,也可以通过setp()来定制文字的样式:

    t = plt.xlabel('my data', fontsize=14, color='red')
    setp(t,color='blue')
    • 1
    • 2
    • 在文本中使用数学表达式
      matplotlib接受任何TeX方程表达式,比如这里写图片描述,你可以写成用”$”符号包裹的TeX表达式:
    plt.title(r'$\sigma_i=15$')
    • 1

    这里的”r”非常重要,它表示后面的字符串是一个纯粹的字符串,不会将后面的反斜杠当作转义字符。matplotlib内置有TeX表达式解释器和排版引擎,和自带的数学字体。因此你可以不用安装TeX就能使用数学表达式,如果你安装了LaTeX和dvipng,你也可以使用LaTex排版你的文字并且直接输出到figures或者是保存。

    • 注释文本
      使用text()命令可以在Axes中任意位置放置文本,一个普遍的文本用法是对一些特性进行注释,annotate()方法让添加注释变得很容易。对于注释有两点需要注意:需要被注释的地方,使用xy参数来指出,还有就是注释文本所放置的位置,使用参数xytext来指定位置,这两个参数都使(x,y)元组:
    import numpy as np
    import matplotlib.pyplot as plt
    
    ax = plt.subplot(111)
    
    t = np.arange(0.0, 5.0, 0.01)
    s = np.cos(2*np.pi*t)
    line, = plt.plot(t, s, lw=2)
    
    plt.annotate('local max', xy=(2, 1), xytext=(3, 1.5),
                arrowprops=dict(facecolor='black', shrink=0.05),
                )
    
    plt.ylim(-2,2)
    plt.show()
  • 这里写图片描述
    这里的xy和xytext所使用的坐标是根据XY轴的刻度的坐标,称为data coordinates。当然也可以使用其他坐标系统,具体参考官方文档。

  • 对数和其他非线性坐标轴(axis)
    matplotlib.pylot不仅仅提供了线性的坐标,还提供了对数(logarithmic)和分对数(logit)坐标。当数据的维度跨越许多数量级时,这种坐标就很有用,改变坐标轴的刻度很容易:

    plt.xscale(‘log’)
  • 下面是一个例子,对于同样的数据,在Y轴使用不同刻度下的曲线图:

    import numpy as np
    import matplotlib.pyplot as plt
    
    
    # 在区间[0,1]制造一些数据
    
    
    # np.random.normal为高斯分布
    
    y = np.random.normal(loc=0.5, scale=0.4, size=1000)
    y = y[(y > 0) & (y < 1)]
    y.sort()
    x = np.arange(len(y))
    
    
    # 创建一个窗口
    
    plt.figure(1)
    
    
    # 线性
    
    plt.subplot(221)
    plt.plot(x, y)
    plt.yscale('linear')
    plt.title('linear')
    plt.grid(True)
    
    
    
    # 对数
    
    plt.subplot(222)
    plt.plot(x, y)
    plt.yscale('log')
    plt.title('log')
    plt.grid(True)
    
    
    
    # symmetric log
    
    plt.subplot(223)
    plt.plot(x, y - y.mean())
    plt.yscale('symlog', linthreshy=0.05)
    plt.title('symlog')
    plt.grid(True)
    
    
    # logit
    
    plt.subplot(224)
    plt.plot(x, y)
    plt.yscale('logit')
    plt.title('logit')
    plt.grid(True)
    
    plt.show()
  • 这里写图片描述

 

实现一个最简单的plot函数调用:

复制代码
1 import matplotlib.pyplot as plt
2 
3 y=pp.DS.Transac_open  # 设置y轴数据,以数组形式提供
4 
5 x=len(y)           # 设置x轴,以y轴数组长度为宽度
6 x=range(x)      # 以0开始的递增序列作为x轴数据
7 
8 plt.plot(x,y)  #  只提供x轴,y轴参数,画最简单图形
复制代码

图形输出结果类似于:

 

加入新方法:

plt.figure() :自定义画布大小

plt.subplot() :设置画布划分以及图像在画布上输出的位置

复制代码
import matplotlib.pyplot as plt

y=pp.DS.Transac_open  # 设置y轴数据,以数组形式提供

x=len(y)           # 设置x轴,以y轴数组长度为宽度
x=range(x)      # 以0开始的递增序列作为x轴数据

#==============================
plt.figure(figsize=(8,8),dpi=80)  # 画图之前首先设置figure对象,此函数相当于设置一块自定义大小的画布,使得后面的图形输出在这块规定了大小的画布上,其中参数figsize设置画布大小
plt.subplot(221) # 将figure设置的画布大小分成几个部分,参数‘221’表示2(row)x2(colu),即将画布分成2x2,两行两列的4块区域,1表示选择图形输出的区域在第一块,图形输出区域参数必须在“行x列”范围                       ,此处必须在1和2之间选择——如果参数设置为subplot(111),则表示画布整个输出,不分割成小块区域,图形直接输出在整块画布上
plt.plot(y,xx) # 在2x2画布中第一块区域输出图形
plt.subplot(222) 
plt.plot(y,xx)    #在2x2画布中第二块区域输出图形
plt.show()
plt.subplot(223)  #在2x2画布中第三块区域输出图形
plt.plot(y,xx)
plt.subplot(224)  # 在在2x2画布中第四块区域输出图形
plt.plot(y,xx)
#==============================

plt.plot(x,y)  #  只提供x轴,y轴参数,画最简单图形
复制代码

 

输出结果:

 

加入新方法:

plt.xticks():设置x轴刻度的表现方式

plt.xlim():设置x轴刻度的取值范围

复制代码
 1 import matplotlib.pyplot as plt
 2 import numpy as nu
 3 
 4 y=pp.DS.Transac_open  # 设置y轴数据,以数组形式提供
 5 
 6 x=len(y)           # 设置x轴,以y轴数组长度为宽度
 7 x=range(x)      # 以0开始的递增序列作为x轴数据
 8 
 9 plt.figure(figsize=(8,8),dpi=80)  # 画图之前首先设置figure对象,此函数相当于设置一块自定义大小的画布,使得后面的图形输出在这块规定了大小的画布上,其中参数figsize设置画布大小
10 plt.subplot(111) # 将figure设置的画布大小分成几个部分,参数‘221’表示2(row)x2(colu),即将画布分成2x2,两行两列的4块区域,1表示选择图形输出的区域在第一块,图形输出区域参数必须在“行x列”范围                       ,此处必须在1和2之间选择——如果参数设置为subplot(111),则表示画布整个输出,不分割成小块区域,图形直接输出在整块画布上
11 plt.plot(y,x)
12 #================================
13 plt.xlim(0,1000)  #  设置x轴刻度范围,从0~1000
14 plt.ylim(0,20)   # 设置y轴刻度的范围,从0~20
15 
16 plt.xticks(nu.linspace(0,1000,15,endpoint=True))  # 设置x轴刻度
17 plt.yticks(nu.linspace(0,20,10,endpoint=True))  # 设置y轴刻度
18 #numpy.linspace()方法返回一个等差数列数组,第一个参数表示等差数列的第一个数,第二个参数表示等差数列最后一个数,第三个参数设置组成等差数列的元素个数,endpoint参数设置最后一个数是否包含在该等差数列。数列中相邻元素间的步长值为随机
19 如:nu.linspace(0,1000,15,endpoint=True)表示:第一个元素为0,最后一个数为1000,在这个 范围内,取15个值,构成一个等差数列,步长值随机,且1000包含在该数列中
20 #================================
21 plt.show()
复制代码

图形输出结果:

 修改plot方法,新加入参数:

plt.plot(y,xx,color='red',linewidth=2.5,linestyle='-') # color参数设置曲线颜色,linewidth设置曲线宽度,linestyle设置曲线风格

输出结果:

posted @ 2018-01-29 19:05  H......T!  阅读(4424)  评论(0编辑  收藏  举报