未来可以预测吗?

重新回来,回到现在

刚刚登录后,系统提示绑定手机号,欣然绑定。一切都是那么稳定,注册名,邮箱,手机号,翻看历史记录,感谢博客园!

回来看我的ID,也颇具禅意,子标题是“未来决定现在”,感觉好极了。

 

(其实写这篇的想法,是我正在做的系统,主要是数据的预测,有一些想法,但是还很模糊,一定要找个地方说说,就翻到了这里。加上上面的一些感慨,表明时间对了!)

 

预测未来也是人们常常提起的话题,包括影视剧文艺作品,以前还只有进入未来,如科幻。现在时间轴都已经布满了,比如穿越,是回到过去。不但时间,还有空间,时空穿越。

天气预报也越来越准了,昨天的雨,虽然仍然有偏差,但是已经超出我的期望值,我也相信未来预测会更加准确。

 

复杂系统和简单系统

跟人类社会以及相关系统相比,天气系统是一个相对单一的系统,可以说如果把影响天气的关键数据找到后,就可以准确预测天气的下一个运行状态。

当然,可能存在一种人工影响天气的行为,把本来正常的天气系统,比如在某时间,某个地点进行人工干预,让雨提前下来。

但是,在天气系统中,这个干预是少数的,甚至说也是可以预测的。

 

预测的结果值是一个巨大的数据集

至于说是1小时预测,24小时预测,还是7天预测,不同的时延准确率不同。还有覆盖空间的准确性,海淀是不是准确,昌平是不是准确,大兴是不是准确,不同空间的准确率都可能不同。所以说,到最后发现预测的结果是是一个庞大的数据集,不同需求的用户需要根据自己的期望来找到数据。

这就跟以往电台中的天气预报进步太多了。

以前天气预报只是说明天北京有雨,我们根本不知道什么时间有雨,我所处的区域是否会下雨,所以就会产生“天气预报不准”这种结论

现在的技术手段,手机等智能终端的普及,数据提供商,app开发商的不断创新,使手机app上就可以查到更多的预测数据,比如分区,分时的预报,不同区域的使用者针对自己的需求获取预测数据,准确率提高了很多。

其实目前这种不准论也还存在,除了预测系统的原因,(我觉)用别人的预测数据验证自己区域的情况。

 

预测和干预

假设预测数据非常准确,像天气系统这种,人们只要做好防范工作,避免天气原因带来的灾难就行。对于天气,人类社会的行为是一致的,利用天气系统进行战争,犯罪的行为是少数,利用天气预报进行获利虽然有,比如下雨天买伞?不去评说了

但是很多其他的数据预测就不一样了,比如股市,如果预测某支股票要大涨,那么股民为了获得后续上涨的收益,可能买入股票,同时,已经获利者可以趁机卖出已有股票,如果卖出量更大,则可能导致股票反而下跌

由于股市是一个复杂的系统,所谓的复杂就是参与其中的交易者可以影响到数据的成交和走势,这一点同天气系统是完全不一样的

还有同股市系统类似的交通系统,我们每天出门时看路况,地图系统往往会预测一下到达我的目的地的路途是不是有拥堵,我们发现有时预测时不堵,但是实际行驶过程中就会变得拥堵。

交通系统也是一样,预测不堵的信息被更多的参与者接收到后,都选择了这条路,那这条路就拥堵了。

还有很多这样的社会现象,也是一个复杂系统,比如农民种植农产品,工厂生产产品,都会有一定的预测(预测需求、产量、收益),但是实际结果是产品因过剩而导致收益下降。

这些已经接近博弈理论需要解决的问题了,我这里就不展开了。

 

到底要不要预测

既然像股市系统、交通系统这种复杂系统干预问题,我们到底要不要预测,如何利用预测数据?

还有应对干预(博弈)的预测系统吗?

答案当然是肯定的!

要预测,即使原始数据的获取聚合和清理工作非常大,预测数据的准确度目前可能不是很高,对应目标的收益率也不高,但是仍然不能阻挡我们对预测未来的努力。

要论证这个主题其实可以写一大堆。(可是我不写了)

从图像识别技术(图像识别也是预测吗?)的历史我们就行,从最初的60~70%的正确率,到现在识别率接近完美,甚至带上口罩都可以识别,人脸识别已经非常实用普及,收益已经显现。

 

那如何预测呢?

地球人都可以猜到,当然是机器学习了,不能用之前的技术了。

之所以用了“机器学习”这个术语,而不是用人工智能AI,因为AI范畴比较大了,不够具体。我想说的只是一个技术,不是一个虚无的方案和夸夸其谈。

其实在很多机器学习的课程中,都会有房价、股票预测和其他很多预测,但是我目前看到代码和课程中的预测准确率不高(我知道它为什么不高,公开的课程不便把关键数据的方法拿出来)

在量化交易中,很多团队也在使用机器学习构建投资策略,成绩非常不错。

 

具体如何做呢?

以股票数据预测为例:

尝试阶段:

建立一套机器学习的开发环境(tensorflow,pythorch都可以,我选择tensorflow 2.x)

获取股票,建立训练测试数据。基本的每日k线就行。我通过已有数据的训练验证可以达到100%准确率,这可以说明一些情况。

( 以往股票分析出的股票规律和各种模型、线是有道理的,但是仍然对突然的变化无法预测)

通过不同的模型,数据元素选择,获得不同的正确率,目前我的可以达到60~80%,至于为何差距这么大,这主要跟训练数据集的选择有关系。但是这至少有60%以上的胜率了(有点像赌徒?)

每天收盘数据获得后预测第二天的预测数据,但是这时已经不能买卖,买不进来卖不出去。只是在第二天开盘到收盘判断预测的准确性,慢慢建立信心。

问题:

如果预测不准说明什么?

市场随机游走或博弈对抗

 

实操阶段

在尝试基础上,增加预测数据的库,并通过可视化方式进行展示分析。

通过预测第二天的关键数据,继续预测第三天和以后的数据。

建立基于2天的预测数据建立策略模型,每一个策略模型对每一支股票建立成长收益数据,形成新的增强训练

 

对于选股

由于初级阶段没有对大势的把握,所以无法选股,只有在全量股票的策略训练后,才可能找到成长好的个股

在策略池和成长数据中找到目标股

 

后续的文章将慢慢建立对于数据预测的信心

 

posted on 2022-06-28 11:11  haio  阅读(116)  评论(0编辑  收藏  举报