Python数据可视化

文章目录

      • 5.1.3 其他绘图样式
    • 5.2 金融学图表

第5章 数据可视化

5.1 二维绘图

5.1.1 一维数据集

按照给定的x和y值绘图

    import matplotlib as mpl
    import matplotlib.pyplot as plt
    %matplotlib inline  # 如果是在控制台上执行代码,这行如果报错,下面的图片显示一张,关闭后再执行下一张的显示,不然都会画到一张图上
    np.random.seed(1000)
    # 生成20个标准正态分布(伪)随机数, 保存在一个NumPy ndarray中
    y = np.random.standard_normal(20)
    x = range(len(y))
    plt.plot(x, y)
    plt.title('5-1 按照给定的x和y值绘图')

![5-1 按照给定的x和y值绘图](https://img-
blog.csdn.net/20180626163435801?watermark/2/text/aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80MjAxODI1OA/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA/dissolve/70)

按照给定的一维数组和附加方法绘图

    # 按照给定的一维数组和附加方法绘图
    plt.plot(y)
    plt.title('5-2 按照一维数组给出的数据绘图')

![5-2 按照一维数组给出的数据绘图](https://img-
blog.csdn.net/2018062616353937?watermark/2/text/aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80MjAxODI1OA/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA/dissolve/70)

按照给定的一维数组和附加方法绘图

    # 按照给定的一维数组和附加方法绘图
    plt.plot(y.cumsum())
    plt.title('5-3 按照给定的一维数组和附加方法绘图')

![5-3 按照给定的一维数组和附加方法绘图](https://img-
blog.csdn.net/20180626163609813?watermark/2/text/aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80MjAxODI1OA/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA/dissolve/70)

带有网络和紧凑坐标轴的图表

    # 带有网络和紧凑坐标轴的图表
    plt.plot(y.cumsum())
    plt.grid(True)
    plt.axis('tight')
    plt.title('5-4 带有网络和紧凑坐标轴的图表')

![5-4 带有网络和紧凑坐标轴的图表](https://img-
blog.csdn.net/20180626163632306?watermark/2/text/aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80MjAxODI1OA/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA/dissolve/70)
plt.axis选项

参数 描述
Empty 返回当前坐标轴限值
off 关闭坐标轴和标签
equat 使用等刻度
scaled 通过尺寸变化平衡度量
tight 所有数据可见(缩小限值)
image 是所有数据可见(使用数据限值)
[xmin,xmax,ymin,ymax] 将设置限值为给定的一组值

使用自定义坐标轴限值绘制图表

    # 使用自定义坐标轴限值绘制图表
    plt.plot(y.cumsum())
    plt.grid(True)
    plt.xlim(-1, 20)
    plt.ylim(np.min(y.cumsum()) - 1, np.max(y.cumsum()) + 1)
    plt.title('5-5 使用自定义坐标轴限值绘制图表')

![5-5 使用自定义坐标轴限值绘制图表](https://img-
blog.csdn.net/20180626164617236?watermark/2/text/aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80MjAxODI1OA/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA/dissolve/70)
带有典型标签的图表

    # 带有典型标签的图表
    plt.figure(figsize=(7, 4))
    # the figsize parameter defines the size of the figure in (width,height)
    plt.plot(y.cumsum(),'b',lw=1.5)
    plt.plot(y.cumsum(),'ro')
    plt.grid(True)
    plt.axis('tight')
    plt.xlabel('index')
    plt.ylabel('value')
    plt.title('A Simple Plot')

![5-6 带有典型标签的图表](https://img-
blog.csdn.net/20180626165405606?watermark/2/text/aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80MjAxODI1OA/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA/dissolve/70)

标准颜色缩写

字符 颜色
b
g 绿
r
c
m 品红
y
k
w

标准样式字符

字符 象征
- 实现样式
短划线样式
-. 点实线样式
: 虚线样式
. 点标记
, 像素标记
o 圆标记
v 向下三角形标记
^ 向上三角形标记
< 向左三角形标记
> 向右三角形标记
1 Tri_down标记
2 Tri_up标记
3 Tri_left标记
4 Tri_right标记
s 方形标记
P 五边形标记
* 星号
h 六角形标记1
H 六角形标记2
+ 加好
x X标记
D 菱形标记
d 细菱形标记

5.1.2 二维数据集

用两个数据集绘制图表

    # 用两个数据集绘制图表
    np.random.seed(2000)
    y = np.random.standard_normal((20, 2)).cumsum(axis=0)
    plt.figure(figsize=(7, 4))
    plt.plot(y, lw=1.5)
    plt.plot(y, 'ro')
    plt.grid(True)
    plt.axis('tight')
    plt.xlabel('index')
    plt.ylabel('value')
    plt.title('A Simple Plot')

![用两个数据集绘制图表](https://img-
blog.csdn.net/2018062617155126?watermark/2/text/aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80MjAxODI1OA/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA/dissolve/70)
带有数据集的图表

    # 带有数据集的图表
    plt.figure(figsize=(7, 4))
    plt.plot(y[:, 0], lw=1.5, label='1st')
    plt.plot(y[:, 1], lw=1.5, label='2nd')
    plt.grid(True)
    plt.legend(loc=0)
    plt.axis('tight')
    plt.xlabel('index')
    plt.ylabel('value')
    plt.title('A Simple Plot')

![带有数据集的图表](https://img-
blog.csdn.net/20180626172040907?watermark/2/text/aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80MjAxODI1OA/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA/dissolve/70)
plt.legend选项

位置选项 描述
空白 自动
0 最佳
1 右上
2 左上
3 左下
4 右下
5
6 中左
7 中右
8 中下
9 中上
10

包含两个数据集、 两个y轴的图表

    # 包含两个数据集、 两个y轴的图表
    y[:, 0] = y[:, 0] * 10
    fig, ax1 = plt.subplots()
    plt.plot(y[:, 0], 'b', lw=1.5, label='1st')
    plt.plot(y[:, 0], 'ro')
    plt.grid(True)
    plt.legend(loc=8)
    plt.axis('tight')
    plt.xlabel('index')
    plt.ylabel('value 1st')
    plt.title('A Simple Plot')
    ax2 = ax1.twinx()
    plt.plot(y[:, 1], 'g', lw=1.5, label='2nd')
    plt.legend(loc=0)
    plt.ylabel('value 2nd')

![包含两个数据集、 两个y轴的图表](https://img-
blog.csdn.net/20180626174006156?watermark/2/text/aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80MjAxODI1OA/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA/dissolve/70)

带有两个子图的图表

    # 带有两个子图的图表
    plt.figure(figsize=(7, 5))
    plt.subplot(211)
    plt.plot(y[:, 0], 'b', lw=1.5, label='1st')
    plt.plot(y[:, 0], 'ro')
    plt.grid(True)
    plt.legend(loc=0)
    plt.axis('tight')
    plt.ylabel('value')
    plt.title('A Simple Plot')
    plt.subplot(212)
    plt.plot(y[:, 0], 'g', lw=1.5, label='2nd')
    plt.plot(y[:, 0], 'ro')
    plt.grid(True)
    plt.legend(loc=0)
    plt.axis('tight')
    plt.xlabel('index')
    plt.ylabel('value')

![带有两个子图的图表](https://img-
blog.csdn.net/20180626174622432?watermark/2/text/aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80MjAxODI1OA/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA/dissolve/70)

组合线、点子图和柱状子图

    # 组合线、点子图和柱状子图
    plt.figure(figsize=(9, 4))
    plt.subplot(121)
    plt.plot(y[:, 0], lw=1.5, label='1st')
    plt.plot(y[:, 0], 'ro')
    plt.grid(True)
    plt.legend(loc=0)
    plt.axis('tight')
    plt.xlabel('index')
    plt.ylabel('value')
    plt.title('1st Data Set')
    
    plt.subplot(122)
    plt.bar(np.arange(len(y)), y[:, 1], width=0.5, color='g', label='2nd')
    plt.grid(True)
    plt.legend(loc=0)
    plt.axis('tight')
    plt.xlabel('index')
    plt.title('2nd Data Set')

![组合线、点子图和柱状子图](https://img-
blog.csdn.net/2018062617544112?watermark/2/text/aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80MjAxODI1OA/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA/dissolve/70)

5.1.3 其他绘图样式

通过plot函数绘制散点图

    # 通过plot函数绘制散点图
    y = np.random.standard_normal((1000, 2))
    plt.figure(figsize=(7, 5))
    plt.plot(y[:, 0], y[:, 1], 'ro')
    plt.grid(True)
    plt.xlabel('1st')
    plt.ylabel('2nd')
    plt.title('Scatter Plot')

![通过plot函数绘制散点图](https://img-
blog.csdn.net/20180626180756336?watermark/2/text/aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80MjAxODI1OA/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA/dissolve/70)

通过scatter函数绘制散点图

    # 通过scatter函数绘制散点图
    plt.figure(figsize=(7, 5))
    plt.scatter(y[:, 0], y[:, 1], marker='o')
    plt.grid(True)
    plt.xlabel('1st')
    plt.ylabel('2nd')
    plt.title('Scatter Plot')

![通过scatter函数绘制散点图](https://img-
blog.csdn.net/2018062618084011?watermark/2/text/aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80MjAxODI1OA/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA/dissolve/70)

    # 具备第三维的散点图
    c = np.random.randint(0, 10, len(y))
    plt.figure(figsize=(7, 5))
    plt.scatter(y[:, 0], y[:, 1], c=c, marker='o')
    plt.colorbar()
    plt.grid(True)
    plt.xlabel('1st')
    plt.ylabel('2nd')
    plt.title('Scatter Plot')

![具备第三维的散点图](https://img-
blog.csdn.net/20180626181215635?watermark/2/text/aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80MjAxODI1OA/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA/dissolve/70)
两个数据集的直方图

    # 两个数据集的直方图
    plt.figure(figsize=(7, 5))
    plt.hist(y, label=['1st', '2nd'], bins=25)
    plt.grid(True)
    plt.legend(loc=0)
    plt.xlabel('value')
    plt.ylabel('frequency')
    plt.title('Histogram')

![两个数据集的直方图](https://img-
blog.csdn.net/20180626181515613?watermark/2/text/aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80MjAxODI1OA/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA/dissolve/70)

plt.hist所支持的参数:
plt.hist(x, bins=None, range=None, normed=False, weights=None,
cumulative=False, bottom=None, histtype=‘bar’, align=‘mid’,
orientation=‘vertical’, rwidth=None, log=False, color=None, label=None,
stacked=False, hold=None, data=None, **kwargs)

plt.hist参数

参数 描述
x 列表对象,ndarray对象
bins 数据组(bin)数
range 数据组的上界和下界
normed 规范化为整数
weights x轴上每个值的权重
cumulative 每个数据组包含较低组别的计数
histtype 选项(字符串): bar, barstacked, step, stepfilled
align 选项(字符串): lef, mid, right
orientation 选项(字符串): horizontal, vertical
rwidth 条块的相对宽度
log 对数刻度
color 每个数据集的颜色(类似数组)
label 标签所用的字符席或者字符串序列
stacked 堆叠多个数据集

两个数据集堆叠的直方图

    # 两个数据集堆叠的直方图
    plt.figure(figsize=(7, 4))
    plt.hist(y, label=['1st', '2nd'], color=['b', 'g'], stacked=True, bins=20)
    plt.grid(True)
    plt.legend(loc=0)
    plt.xlabel('value')
    plt.ylabel('frequency')
    plt.title('Histogram')

![两个数据集堆叠的直方图](https://img-
blog.csdn.net/2018062618310539?watermark/2/text/aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80MjAxODI1OA/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA/dissolve/70)

两个数据集的箱形图

    # 两个数据集的箱形图
    fig, ax = plt.subplots(figsize=(7, 4))
    plt.boxplot(y)
    plt.grid(True)
    plt.setp(ax, xticklabels=['1st', '2nd'])
    plt.xlabel('data set')
    plt.ylabel('value')
    plt.title('Boxplot')

![两个数据集的箱形图](https://img-
blog.csdn.net/20180626183502227?watermark/2/text/aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80MjAxODI1OA/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA/dissolve/70)

指数函数、积分面积和LaTeX标签

    # 指数函数、积分面积和LaTeX标签
    from matplotlib.patches import Polygon
    
    
    def func(x):
        return 0.5 * np.exp(x) + 1
    
    
    a, b = 0.5, 1.5
    x = np.linspace(0, 2)
    y = func(x)
    fig, ax = plt.subplots(figsize=(7, 5))
    plt.plot(x, y, 'b', linewidth=2)
    plt.ylim(ymin=0)
    Ix = np.linspace(a, b)
    Iy = func(Ix)
    verts = [(a, 0)] + list(zip(Ix, Iy)) + [(b, 0)]
    poly = Polygon(verts, facecolor='0.7', edgecolor='0.5')
    ax.add_patch(poly)
    
    plt.text(0.5 * (a + b), 1, r"$\int_a^b f(x)\mathrm{d}x$", horizontalalignment='center', fontsize=20)
    plt.figtext(0.9, 0.075, '$x$')
    plt.figtext(0.075, 0.9, '$x$')
    ax.set_xticks((a, b))
    ax.set_xticklabels(('$a$', '$b$'))
    ax.set_yticks([func(a), func(b)])
    ax.set_yticklabels(('$f(a)$', '$f(b)$'))
    plt.grid(True)

![指数函数、积分面积和LaTeX标签](https://img-
blog.csdn.net/20180626190206389?watermark/2/text/aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80MjAxODI1OA/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA/dissolve/70)

5.2 金融学图表

金融数据的蜡烛图

    """
    # import matplotlib.finance as mpf # 这个方法过期了 
    # MatplotlibDeprecationWarning: The finance module has been deprecated in mpl 2.0 and will be removed in mpl 2.2. Please use the module mpl_finance instead. warnings.warn(message, mplDeprecation, stacklevel=1)
    # 要用下面的方法 import mpl_finance as mpf
    # 安装方法: >pip install https://github.com/matplotlib/mpl_finance/archive/master.zip
    """
    import mpl_finance as mpf
    
    # start = (2014, 5, 1)
    # end = (2014, 6, 30)
    # quotes = mpf._quotes_historical_yahoo('GDAXI', start, end)
    # 由于伟大的墙,调取不到国外的数据,这里用tushare获取600118中国卫星的数据
    import tushare as ts
    import datetime
    from matplotlib.pylab import date2num
    
    start = '2018-05-01'
    end = '2018-06-30'
    k_d = ts.get_k_data('600118', start, end, ktype='D')
    k_d.head()
    k_d.date = k_d.date.map(lambda x: date2num(datetime.datetime.strptime(x, '%Y-%m-%d')))
    quotes = k_d.values
    
    fig, ax = plt.subplots(figsize=(8, 5))
    fig.subplots_adjust(bottom=0.2)
    mpf.candlestick_ochl(ax, quotes, width=0.6, colorup='r', colordown='g', alpha=0.8)
    plt.grid(True)
    ax.xaxis_date()
    # dates on the x-axis
    ax.autoscale_view()
    plt.setp(plt.gca().get_xticklabels(), rotation=30)

k_d.head()输入的结果:

| date | open | close | high | low | volume | code
---|---|---|---|---|---|---|---
77 | 2018-05-02 | 23.05 | 22.45 | 23.10 | 22.25 | 90673.0 |
600118
78 | 2018-05-03 | 22.30 | 22.52 | 22.58 | 21.71 | 78948.0 |
600118
79 | 2018-05-04 | 22.50 | 22.35 | 22.58 | 22.21 | 58511.0 |
600118
80 | 2018-05-07 | 22.49 | 22.70 | 22.71 | 22.30 | 58248.0 |
600118
81 | 2018-05-08 | 22.80 | 23.07 | 23.45 | 22.75 | 115629.0 |
600118

最后的图片:
![金融数据的烛柱图](https://img-
blog.csdn.net/20180626200110447?watermark/2/text/aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80MjAxODI1OA/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA/dissolve/70)
金融数据每日摘要图表

    # 金融数据每日摘要图表
    fig, ax = plt.subplots(figsize=(8, 5))
    fig.subplots_adjust(bottom=0.2)
    mpf._plot_day_summary(ax, quotes, colorup='r', colordown='g')
    plt.grid(True)
    ax.xaxis_date()
    # dates on the x-axis
    ax.autoscale_view()
    plt.setp(plt.gca().get_xticklabels(), rotation=30)
    plt.title('金融数据每日摘要图表')

![金融数据每日摘要图表](https://img-
blog.csdn.net/20180626200626728?watermark/2/text/aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80MjAxODI1OA/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA/dissolve/70)

蜡烛图和成交量柱状图组合而成的图表

    # 蜡烛图和成交量柱状图组合而成的图表
    fig, (ax1, ax2) = plt.subplots(2, sharex=True, figsize=(8, 6))
    mpf.candlestick_ochl(ax1, quotes, width=0.6, colorup='r', colordown='g', alpha=0.8)
    ax1.set_title('中国卫星')
    ax1.set_ylabel('index level')
    plt.grid(True)
    ax1.xaxis_date()
    plt.bar(quotes[:,0],quotes[:,5],width=0.5)
    ax2.set_ylabel('volume')
    ax2.grid(True)
    plt.setp(plt.gca().get_xticklabels(), rotation=30)

![蜡烛图和成交量柱状图组合而成的图表](https://img-
blog.csdn.net/20180626201455969?watermark/2/text/aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80MjAxODI1OA/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA/dissolve/70)

5.3 3D绘图

(模拟)隐含波动率的 3D 曲面图

    # 
    strike = np.linspace(50, 150, 24)
    ttm = np.linspace(0.5, 2.5, 24)
    strike, ttm = np.meshgrid(strike, ttm)
    iv = (strike - 100) ** 2 / (100 * strike) / ttm
    # generate fake implied volatilities
    
    from mpl_toolkits.mplot3d import Axes3D
    
    fig = plt.figure(figsize=(9, 6))
    ax = fig.gca(projection='3d')
    surf = ax.plot_surface(strike, ttm, iv, rstride=2, cstride=2, cmap=plt.cm.coolwarm, linewidth=0.5, antialiased=True)
    ax.set_xlabel('strike')
    ax.set_ylabel('time-to-maturity')
    ax.set_zlabel('implied volatility')
    fig.colorbar(surf, shrink=0.5, aspect=5)

![(模拟)隐含波动率的 3D 曲面图](https://img-
blog.csdn.net/20180626202537251?watermark/2/text/aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80MjAxODI1OA/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA/dissolve/70)

plot_surface参数

参数 描述
X,Y,Z 2D数组形式的数据值
rstride 数组行距(步长大小)
cstride 数组列距(步长大小)
color 曲面块颜色
cmap 曲面块颜色映射
facecolors 单独曲面块表面颜色
norm 将值映射为颜色的 Nonnalize实例
vmin 映射的最小值
vmax 映射的最大值

(模拟)隐含波动率的 3D 散点图

    #(模拟)隐含波动率的 3D 散点图
    fig = plt.figure(figsize=(8, 5))
    ax = fig.add_subplot(111,projection='3d')
    ax.view_init(30,60)
    ax.scatter(strike, ttm, iv, zdir='z',s=25,c='b',marker='^')
    ax.set_xlabel('strike')
    ax.set_ylabel('time-to-maturity')
    ax.set_zlabel('implied volatility')

![这里写图片描述](https://img-
blog.csdn.net/20180626202909267?watermark/2/text/aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80MjAxODI1OA/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA/dissolve/70)

end

在这里插入图片描述

posted @ 2021-07-08 11:06  老酱  阅读(156)  评论(0编辑  收藏  举报