黑天鹅算法与大数据的四个层次

黑天鹅算法与大数据的四个层次


简单来说 黑天鹅算法 对于数据 分为四个层次

1,原始数据,例如zw的足彩数据包 这个是最重要的
2、统计分析数据 ,基于1进行各种基本统计分析
3、黑天鹅素材库,基于2 ,对于盈利率kv>100(这个可以调整,一般高一点,150左右)的数据,记录这些数据的特征点
4,将3记录的数据,作为知识库,建立黑天鹅知识库,模型库,xx库,名字无所谓

ps,12,18,关于特征工程
《[访谈] Olivier Grisel谈scikit-learn和机器学习技术的未来?》
http://www.cnblogs.com/jackyzzy/p/4885391.html
未来的方向是特征生成?
OG:在创建scikit-learn预测模型时,特征始终是一个关键点。




所有数据 消息 都已经体现在赔率里面

实盘时,就是找到和4知识库匹配的数据,可能不止一条,设定几个参数,筛选下
具体细节 参数 需要实盘测试
所以需要几个不同周期时段的实盘数据 多长优化 迭代

特征无所谓 每个字段都可以看做一个特征点
不断优化 调整

对于庄家,赔率,大家要把握一点:平衡
一方面 庄家要赚钱 要设置陷阱 诱惑
一方面 庄家 不能赶尽杀绝 把大家全部吓住 以后就没有生意做了
这样一来 自然形成了一种生物学上的动态平衡
所以 有时间 多看看哲学 易经 对于理科生 没有害处


posted @ 2015-12-01 15:54  统领  阅读(439)  评论(0编辑  收藏  举报