人工智能实战2019 - 第7次作业（2） - 王铈弘

项目	内容
课程	人工智能实战2019
作业要求	第7次作业
课程目标	学习人工智能基础知识
本次作业对我的帮助	练习玩黄金点游戏
参考文献	创新的时机 - 黄金点游戏，挑战黄金点

个人见解

经过认真的分析可知，如果玩家们足够理性、游戏次数足够多，黄金点会趋向于0。但在实际的黄金点游戏中，并不是每个人都是理性的、做了长远思考的（比如我自己，第一次玩时没做出理性思考，每次都是猜着提交了一个数，最终成绩倒数），所以当游戏次数足够多时，黄金点会先较快的下降，然后稳定波动。
在诸多因素影响下，黄金点的变化类似下图。

基于学习的策略

对于此类博弈论的问题，强化学习的算法最受人期望，这样模型就可以自我改进，更好的处理拐点后的预测。但我对于强化学习的理解目前只在概念阶段，没有看懂强化学习的相关算法，无法实现。希望以后能够尝试。

基于时间序列模型和机器学习算法的策略

Facebook所开源的Prophet模型，值得一试（mark，没能有时间去尝试。。。）

基于简单心理的策略

对于在房间1中进行游戏，取过去10场游戏黄金点的平均值。
对于在房间2中进行游戏，可以提交2个数，一个作为干扰，一个作为预测。对于玩家数较少的环境，自己产生的干扰对全局的影响可定性为提高黄金点，但无法定量估计。对于玩家数多的环境，自己产生的干扰对于黄金点的影响无法做定性和定量的分析。也可以提交两个预测值，以期此区间内包含黄金点，一定程度上可以提高积分。

基于控制算法的策略

学习过自动控制原理，可能会想到卡尔曼滤波等控制算法。但是控制算法主要是作用于期望的运动，噪声应遵循高斯分布。显然不适用于黄金点游戏。

posted @ 2019-05-13 17:46 WangShihong 阅读(141) 评论(0) 编辑收藏举报

刷新页面返回顶部

WangShihong