沪深股市的数据挖掘(2)
设想终于变成了现实。
今天,经过一系列的计算,终于挖掘出了第一个关系:A股票前一天的涨跌幅与B股票的今日的涨跌幅的关系。
493 SH600001 SH600568 1 2008年 1346.77223095276
1050 SH600001 SZ000587 1 2008年 1342.0274896795
1177 SH600001 SZ000780 1 2008年 1341.52334299219
976 SH600001 SZ000430 1 2008年 1341.01744610644
1代表提前了一天,2008年代表是2008年的数据,1346.772等是关联关系值。根据2008年的A股票交易日期(162天)来进行的比值:10分为精确匹配,0分为不匹配。
算法:10-abs((a.updown-b.updown)*50) updown是交易的涨跌幅。
缺陷:1,A股票的交易日期较少,没有考虑全部的交易天数。(2008年的交易天数为246日)。
2,对于算法,没有考虑分级制:如在1%内的权重较低,2-5%权重高等。
3,未能在BW中进行此操作,而是靠sqlserver2005中写语句进行的。
4,还未进行对关联关系的业务分析。
收获:1,熟悉了sqlserver2005中的临时表、游标等。
2,对SQL的语句的熟悉程度得到提升。