2017 年 3月 11 日随笔档案 - BIGBALLON

2017年3月11日

只有注册用户登录后才能阅读该文。阅读全文

posted @ 2017-03-11 03:45 BIGBALLON 阅读(38) 评论(0) 推荐(0) 编辑

只有注册用户登录后才能阅读该文。阅读全文

posted @ 2017-03-11 03:44 BIGBALLON 阅读(20) 评论(0) 推荐(0) 编辑

摘要：先解決老師留的幾個問題再說吧，23333 XD. [Giraffe][1] 是一個將 Deep Reinforcement Learning 和 Neural Network 结合到一起的Chess AI 程式。作者 [Matthew Lai][2] 是一個了不起的人，目前就職於 Google D 阅读全文

posted @ 2017-03-11 03:43 BIGBALLON 阅读(204) 评论(0) 推荐(0) 编辑

Something about Giraffe

摘要： Run Giraffe in Ubuntu 要开始trace [Giraffe][1]的code，昨天晚上和杰哥一起看了一些老师留下一些问题： Investigate features (363) related to bitboard (or map), rules? 这个明天早上我再细看一下阅读全文

posted @ 2017-03-11 03:42 BIGBALLON 阅读(194) 评论(0) 推荐(0) 编辑

Review of TD-Leaf(lambda)

摘要：昨天报seminar的时候把TD Leaf$(\lambda)$ 搞错了，23333. 本篇文章重新回顾一下Temporal Difference Learning，主要包括TD$(0)$,TD$(1)$,TD$(\lambda)$，最后再回顾一下TD Leaf$(\lambda)$. Pape 阅读全文

posted @ 2017-03-11 03:41 BIGBALLON 阅读(1917) 评论(1) 推荐(0) 编辑

BIGBALLON

Backup blog @ bigballon.github.io

公告