人工智能实战2019 - 第7次作业(2) - 王铈弘

项目 内容
课程 人工智能实战2019
作业要求 第7次作业
课程目标 学习人工智能基础知识
本次作业对我的帮助 练习玩黄金点游戏
参考文献 创新的时机 - 黄金点游戏挑战黄金点

个人见解


经过认真的分析可知,如果玩家们足够理性、游戏次数足够多,黄金点会趋向于0。但在实际的黄金点游戏中,并不是每个人都是理性的、做了长远思考的(比如我自己,第一次玩时没做出理性思考,每次都是猜着提交了一个数,最终成绩倒数),所以当游戏次数足够多时,黄金点会先较快的下降,然后稳定波动。
在诸多因素影响下,黄金点的变化类似下图。

基于学习的策略


对于此类博弈论的问题,强化学习的算法最受人期望,这样模型就可以自我改进,更好的处理拐点后的预测。但我对于强化学习的理解目前只在概念阶段,没有看懂强化学习的相关算法,无法实现。希望以后能够尝试。

基于时间序列模型和机器学习算法的策略


Facebook所开源的Prophet模型,值得一试(mark,没能有时间去尝试。。。)

基于简单心理的策略


对于在房间1中进行游戏,取过去10场游戏黄金点的平均值。
对于在房间2中进行游戏,可以提交2个数,一个作为干扰,一个作为预测。对于玩家数较少的环境,自己产生的干扰对全局的影响可定性为提高黄金点,但无法定量估计。对于玩家数多的环境,自己产生的干扰对于黄金点的影响无法做定性和定量的分析。也可以提交两个预测值,以期此区间内包含黄金点,一定程度上可以提高积分。

基于控制算法的策略


学习过自动控制原理,可能会想到卡尔曼滤波等控制算法。但是控制算法主要是作用于期望的运动,噪声应遵循高斯分布。显然不适用于黄金点游戏。

posted @ 2019-05-13 17:46  WangShihong  阅读(141)  评论(0编辑  收藏  举报