只有注册用户登录后才能阅读该文。 阅读全文
posted @ 2017-03-11 03:45 BIGBALLON 阅读(38) 评论(0) 推荐(0) 编辑
只有注册用户登录后才能阅读该文。 阅读全文
posted @ 2017-03-11 03:44 BIGBALLON 阅读(20) 评论(0) 推荐(0) 编辑
摘要: 先解決老師留的幾個問題再說吧,23333 XD. [Giraffe][1] 是一個將 Deep Reinforcement Learning 和 Neural Network 结合到一起的Chess AI 程式。 作者 [Matthew Lai][2] 是一個了不起的人,目前就職於 Google D 阅读全文
posted @ 2017-03-11 03:43 BIGBALLON 阅读(204) 评论(0) 推荐(0) 编辑
摘要: Run Giraffe in Ubuntu 要开始trace [Giraffe][1]的code,昨天晚上和杰哥一起看了一些 老师留下一些问题: Investigate features (363) related to bitboard (or map), rules? 这个明天早上我再细看一下 阅读全文
posted @ 2017-03-11 03:42 BIGBALLON 阅读(194) 评论(0) 推荐(0) 编辑
摘要: 昨天报seminar的时候把TD Leaf$(\lambda)$ 搞错了,23333. 本篇文章重新回顾一下Temporal Difference Learning, 主要包括TD$(0)$,TD$(1)$,TD$(\lambda)$, 最后再回顾一下TD Leaf$(\lambda)$. Pape 阅读全文
posted @ 2017-03-11 03:41 BIGBALLON 阅读(1917) 评论(1) 推荐(0) 编辑