用Python做股票市场数据分析—做K线图

     由于本科在校期间身边有许多朋友是金融专业的,他们时长在我耳边谈起股票情况,受他们影响,耳濡目染地对证券时长有了兴趣。毕业前几个月找实习单位时,又机缘巧合地在这方面工作了一段时间,学习了证券交易的各种理论(道氏理论、日本蜡烛图技术、波浪理论等),虽然后期转行做了本专业工作(数据挖掘),但对证券交易这块一直在关注。闲来无事就用Python来实现了一下蜡烛图,话不多说,直接上代码:

# 导入需要的包和模块
import datetime

import pandas as pd
import tushare as ts # 该模块是一个免费提供股票交易数据的API

# 我们将看看从2016年1月1日开始过去一年的股票价格
start = datetime.date(2016,1,1)
end = datetime.date.today()

# 得到国金证券公司的股票数据;股票代码是600109
# 第一个参数是获取股票数据的股票代码串,第二个参数是开始日期,第三个参数是结束日期
guojin = ts.get_h_data('600109',str(start),str(end),'qfq')
type(guojin)
guojin.head()

得到股票数据如下:

# 可视化股票数据
import matplotlib as mlp
import matplotlib.pyplot as plt
%matplotlib inline
%pylab inline

mlp.rcParams['figure.figsize'] = (15,9)
guojin['close'].plot(grid=True)

得到国金证券2015-2016年的收盘价走势情况:

# 导入画图蜡烛图所需模块
from matplotlib.dates import DateFormatter
from matplotlib.dates import WeekdayLocator
from matplotlib.dates import MONDAY
from matplotlib.dates import DayLocator
from matplotlib.finance import candlestick_ohlc

# 定义画图函数
def pandas_candlestick_ohlc(dat,stick='day',otherseries=None):
    """
    参数dat:pandas DataFrame对象采用datetime64指数,和浮点数列
    “开盘价”,“最高价”,“收盘价”,“最低价”
    参数stick:一个字符串或数字只是的时间段覆盖单一的蜡杆。有效
    地字符串输入包括“day”,“week”,“month”,“year”(默认是day)
    和任何数字输入,该数字表明一段时间内包括的交易日
    参数otherseries:一个可迭代的,它将被强制转换为一个列表,包含dat包
    含的其他series将被回执为线条的列
    这将显示一个存储在dat中的股票数据的日本蜡烛K线图
    """
    mondays = WeekdayLocator(MONDAY) # 每周一的主要刻度
    alldays = DayLocator()  # 每周日的次要此刻度
    dayFormatter = DateFormatter("%d")
    
    # 创建一个新的DataFrame,包含按色呼入制定的每个阶段的OHLC数据
    transdat = dat.loc[:,["open","high","low","close"]]
    if type(stick) == str:
        if stick == "day":
            plotdat = transdat
            stick = 1
        elif stick in ['week','month','year']:
            if stick == 'week':
                transdat['week'] = pd.to_datetime(transdat.index).map(
                    lambda x: x.isocalendar()[1])  #确定周 
            elif stick == 'month':
                transdat['month'] = pd.to_datetime(transdat.index).map(
                    lambda x: x.month)  # 确定月
            transdat['year'] = pd.to_datetime(transdat.index).map(
                lambda x: x.isocalendar()[0])   # 确定年
            
            # 按年和其他适当变量分组
            grouped = transdat.groupby(list(set(['year',stick])))
            
            # 创建将要包含绘图的空数据框
            plotdat = pd.DataFrame({"open":[],"high":[],"low":[],"close":[]})
            for name, group in grouped:
                plotdat = plotdat.append(pd.DataFrame({"open":group.iloc[0,0],
                                                     "high":max(group.high),
                                                     "low":min(group.low),
                                                     "close":group.iloc[-1,3]},
                                                     index = [group.index[0]]))
            if stick == "weed":
                stick = 5
            elif stick == "month": 
                stick = 30
            elif stick == "year":
                stick = 365
    elif type(stick) == int and stick >=1:
        transdat["stick"] = [np.float(i/stick) for i in range(len(transdat.index))]
        grouped = transdat.groupby("stick")

        # 创建将要包含绘图的空数据框
        plotdat = pd.DataFrame({"open":[],"high":[],"low":[],"close":[]})
        grouped = transdat.groupby('stick')
        for name,group in grouped:
            plotdat = plotdat.append(pd.DataFrame({"open": group.iloc[0,0],
                                                  "high": max(group.high),
                                                  "low": min(group.low),
                                                  "close": group.iloc[-1,3]},
                                                 index = [group.index[0]]))
    else:
        raise ValueError('Valid inputs to argument "stick" include the\
        strings "day","week","month","year",or a positive integer')

    # 设置plot参数,包括用绘制的轴线对象ax
    fig, ax = plt.subplots()
    fig.subplots_adjust(bottom=0.2)
    if plotdat.index[-1] - plotdat.index[0] < pd.Timedelta('730 days'):
        weekFormatter = DateFormatter("%b %d")  # 例如,1月12
        ax.xaxis.set_major_locator(mondays)
        ax.xaxis.set_minor_locator(alldays)
    else:
        weekFormatter = DateFormatter("%b %d,%Y")
    ax.xaxis.set_major_formatter(weekFormatter)
    ax.grid(True)

    # 创建K线图
    candlestick_ohlc(ax,list(zip(list(date2num(plotdat.index.tolist())),
                                 plotdat["open"].tolist(),
                                 plotdat["high"].tolist(),
                                 plotdat["low"].tolist(),
                                 plotdat["close"].tolist())),
                     colorup = "black",colordown='red')

    # 绘制其他series(如移动平均线)作为线
    if otherseries != None:
        if type(otherseries) != list:
            otherseries = [otherseries]
        dat.loc[:,otherseries].plot(ax=ax,lw=1.3,grid=True)

    ax.xaxis_date()
    ax.autoscale_view()
    plt.setp(plt.gca().get_xticklabels(),rotation=45,
            horizontalalignment='right')
    plt.show()

  下面调用该函数,输出结果:

pandas_candlestick_ohlc(guojin)

  

该图看起来和商用交易软件显示结果差不多,但还是存在些问题,如图像中对于未开盘日期K线不连续,不能缩放等,后期继续加以改进。

posted @ 2017-02-06 22:18  雁渡的寒潭  阅读(11073)  评论(1编辑  收藏  举报