只有注册用户登录后才能阅读该文。 阅读全文
只有注册用户登录后才能阅读该文。 阅读全文
摘要:
先解決老師留的幾個問題再說吧,23333 XD. [Giraffe][1] 是一個將 Deep Reinforcement Learning 和 Neural Network 结合到一起的Chess AI 程式。 作者 [Matthew Lai][2] 是一個了不起的人,目前就職於 Google D 阅读全文
摘要:
Run Giraffe in Ubuntu 要开始trace [Giraffe][1]的code,昨天晚上和杰哥一起看了一些 老师留下一些问题: Investigate features (363) related to bitboard (or map), rules? 这个明天早上我再细看一下 阅读全文
摘要:
昨天报seminar的时候把TD Leaf$(\lambda)$ 搞错了,23333. 本篇文章重新回顾一下Temporal Difference Learning, 主要包括TD$(0)$,TD$(1)$,TD$(\lambda)$, 最后再回顾一下TD Leaf$(\lambda)$. Pape 阅读全文