量化学习:聚宽jqdatasdk对接vnpy的数据服务
数据服务:使用聚宽jqdatasdk获取分钟数据按vnpy的Bar格式导入至mongodb中
提供downloadAllMinuteBar(),可以通过定时任务的形式,按vnpy的数据格式,每日获取分钟数据写入到mongodb当中
提供downloadMinuteBarByDate,可以输入开始日期与结束日期,将时间段内的分钟数据写入到mongodb当中
在config文件中配置jqdatasdk的用户名密码
每日增量数据获取(作为数据服务,每日自动运行,将当日的增量数据插入到数据库中):
#---------------------------------------------------------------------- # 当日数据下载,定时任务使用 def downloadAllMinuteBar(): jqdatasdk.auth(JQDATA_USER, JQDATA_PASSWORD) """下载所有配置中的合约的分钟线数据""" print('-' * 50) print(u'开始下载合约分钟线数据') print('-' * 50) today = datetime.today().date() trade_date_list = jqdatasdk.get_trade_days(end_date=today, count=2) symbols_df = jqdatasdk.get_all_securities(types=['futures'], date=today) for index, row in symbols_df.iterrows(): downMinuteBarBySymbol(index, row, str(today), str(trade_date_list[-2])) print('-' * 50) print(u'合约分钟线数据下载完成') print('-' * 50) return
某段时间内的全量数据(为了补全某一段时间的全量数据进行使用):
#---------------------------------------------------------------------- # 按日期一次性补全数据 def downloadMinuteBarByDate(start_date, end_date=datetime.today().date()): jqdatasdk.auth(JQDATA_USER, JQDATA_PASSWORD) """下载所有配置中的合约的分钟线数据""" print('-' * 50) print(u'开始下载合约分钟线数据') print('-' * 50) trade_date_list = jqdatasdk.get_trade_days(start_date=start_date, end_date=end_date) i = 0 for trade_date in trade_date_list: if i == 0: i = 1 continue symbols_df = jqdatasdk.get_all_securities(types=['futures'], date=trade_date) for index, row in symbols_df.iterrows(): downMinuteBarBySymbol(index, row, str(trade_date_list[i]), str(trade_date_list[i-1])) i += 1 print('-' * 50) print(u'合约分钟线数据下载完成') print('-' * 50) return
具体合约当日的数据下载函数与vnpy的Bar类型数据的生成插入数据库的过程:
#---------------------------------------------------------------------- def generateVtBar(symbol, time, d): """生成K线""" bar = VtBarData() bar.vtSymbol = symbol bar.symbol = symbol bar.open = float(d['open']) bar.high = float(d['high']) bar.low = float(d['low']) bar.close = float(d['close']) bar.date = datetime.strptime(time[0:10], '%Y-%m-%d').strftime('%Y%m%d') bar.time = time[11:] bar.datetime = datetime.strptime(bar.date + ' ' + bar.time, '%Y%m%d %H:%M:%S') bar.volume = d['volume'] return bar #---------------------------------------------------------------------- def downMinuteBarBySymbol(symbol, info, today, pre_trade_day): start = time() symbol_name = info['name'] cl = db[symbol_name] cl.ensure_index([('datetime', ASCENDING)], unique=True) # 添加索引 # 在此时间段内可以获取期货夜盘数据 minute_df = jqdatasdk.get_price(symbol, start_date=pre_trade_day + " 20:30:00",end_date=today + " 20:30:00", frequency='minute') # 将数据传入到数据队列当中 for index, row in minute_df.iterrows(): bar = generateVtBar(symbol_name, str(index), row) d = bar.__dict__ flt = {'datetime': bar.datetime} cl.replace_one(flt, d, True) e = time() cost = (e - start) * 1000 print(u'合约%s数据下载完成%s - %s,耗时%s毫秒' % (symbol_name, pre_trade_day, today, cost))
vnpy中提供了好几个数据服务的实现,功能也比较简单,但是能有不错的功效,聚宽的jqdatasdk也提供了很好的数据服务,十分有利于建立本地的体系。
Github: