摘要:
Q-learning 相关的资料 https://www.youtube.com/watch?v=V1eYniJ0Rnk google deepmind 的Q-learning 算法打游戏的一个很酷的视频。请观看 1.http://www.pysnap.com/reinforcement-learn 阅读全文
摘要:
//Q-learning 源码分析。 import java.util.Random; public class QLearning1 { private static final int Q_SIZE = 6; private static final double GAMMA = 0.8; pr 阅读全文
摘要:
在阅读了Q-learning 算法学习-1文章之后。 我分析了这个算法的本质。 算法本质个人分析。 1.算法的初始状态是随机的,所以每个初始状态都是随机的,所以每个初始状态出现的概率都一样的。如果训练的数量够多的 话,就每种路径都会走过。所以起始的Q(X,Y) 肯定是从目标的周围开始分散开来。也就是 阅读全文
摘要:
阅读全文