游戏AI
现在比较流行的游戏角色AI开发方法,无外乎“状态机”和“行为树”两种,而这两种在数据结构上,是可以无损转换的,也就是说本质上是一样。这两个技术,都是为了帮游戏开发者,更准确、更完整的表述AI逻辑判断的数据结构。
而机器学习的程序,就好像录像机一样,可以通过记录我们操控的角色的行为,去学习如何模仿我们的操控。当我们表演的足够丰富后,机器学习就可以完全取代人工的操控,做出一些和预设相同的行为特征。
DeepMind 强化学习教父David Silver 喊出了 AI = DL + RL , 意思就是为了解决这个问题, 我们可以先用监督学习让神经网络学习, 监督学习机器每时每刻都知道正确或者错误, 而后再上强化学习, 这样让机器学习到从当下到未来的战略思考。
强化学习本质上还是一个数学优化优化算法。 它的起初的成功得自一个称为Markov决策的框架。 所谓的马尔可夫, 就像物理把原子看成一个行星轨道模型一样, 是一种对真实问题的霸王硬上弓的强行简化。