12 2017 档案

该文被密码保护。
posted @ 2017-12-29 21:26 AHU-WangXiao 阅读(6) 评论(0) 推荐(0) 编辑
摘要:一文读懂 深度强化学习算法 A3C (Actor-Critic Algorithm) 2017-12-25 16:29:19 对于 A3C 算法感觉自己总是一知半解,现将其梳理一下,记录在此,也给想学习的小伙伴一个参考。 想要认识清楚这个算法,需要对 DRL 的算法有比较深刻的了解,推荐大家先了解下 阅读全文
posted @ 2017-12-25 16:47 AHU-WangXiao 阅读(67688) 评论(2) 推荐(5) 编辑
摘要:深度强化学习的18个关键问题 from: https://zhuanlan.zhihu.com/p/32153603 85 人赞了该文章 深度强化学习的问题在哪里?未来怎么走?哪些方面可以突破? 这两天我阅读了两篇篇猛文A Brief Survey of Deep Reinforcement Lea 阅读全文
posted @ 2017-12-21 09:13 AHU-WangXiao 阅读(1994) 评论(0) 推荐(0) 编辑
摘要:Graph Convolutional Networks 2018-01-16 19:35:17 this Tutorial comes from YouTube Video:https://www.youtube.com/watch?v=0_O8PdZBc5s&t=2097s 之所以这个方面的研究 阅读全文
posted @ 2017-12-18 21:42 AHU-WangXiao 阅读(5637) 评论(0) 推荐(0) 编辑
该文被密码保护。
posted @ 2017-12-18 00:30 AHU-WangXiao 阅读(10) 评论(0) 推荐(0) 编辑
摘要:ResNet, AlexNet, VGG, Inception: Understanding various architectures of Convolutional Networks by KOUSTUBH this blog from: http://cv-tricks.com/cnn/un 阅读全文
posted @ 2017-12-17 20:27 AHU-WangXiao 阅读(1062) 评论(0) 推荐(0) 编辑
摘要:深度学习课程笔记(七):模仿学习(imitation learning) 2017.12.10 本文所涉及到的 模仿学习,则是从给定的展示中进行学习。机器在这个过程中,也和环境进行交互,但是,并没有显示的得到 reward。在某些任务上,也很难定义 reward。如:自动驾驶,撞死一人,reward 阅读全文
posted @ 2017-12-10 11:04 AHU-WangXiao 阅读(25347) 评论(4) 推荐(1) 编辑
该文被密码保护。
posted @ 2017-12-08 22:47 AHU-WangXiao 阅读(33) 评论(0) 推荐(0) 编辑
该文被密码保护。
posted @ 2017-12-05 23:04 AHU-WangXiao 阅读(3) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示