论文笔记——NEURAL ARCHITECTURE SEARCH WITH REINFORCEMENT LEARNING

论文地址:https://arxiv.org/abs/1611.01578

1. 论文思想

强化学习,用一个RNN学一个网络参数的序列,然后将其转换成网络,然后训练,得到一个反馈,这个反馈作用于RNN网络,用于生成新的序列。

2. 整体架构

3. RNN网络

4. 具体实现

因为每生成一个网络,都会训练一遍,Google用了800个GPU,训练了12800个网络,它采用的是分布式训练的方法。

5. 结论

posted @ 2017-11-19 20:31  清水汪汪  阅读(2392)  评论(0编辑  收藏  举报