摘要: Summary 我的理解就是原本节点和节点之间操作是离散的,因为就是从若干个操作中选择某一个,而作者试图使用softmax和relaxation(松弛化)将操作连续化,所以模型结构搜索的任务就转变成了对连续变量$α={α^{(i,j)}}$以及$w$的学习。(这里$α$可以理解成the encodi 阅读全文
posted @ 2018-09-05 21:28 marsggbo 阅读(4104) 评论(0) 推荐(0) 编辑