摘要: **发表时间:**2020(AAAI 2021) **文章要点:**这篇文章提出Propositional Logic Nets (PROLONETS),通过建立决策树的方式来初始化神经网络的结构和权重,从而将人类知识嵌入到神经网络中作为初始化warm start,然后进行强化学习。 具体的,就是先 阅读全文
posted @ 2022-04-18 07:57 initial_h 阅读(127) 评论(0) 推荐(1) 编辑
摘要: **发表时间:**2018(ICLR 2018) **文章要点:**这篇文章设计了特别的网络结构,将树结构嵌入到神经网络中,实现了look-ahead tree的online planning,将model free和online planning结合起来,并提出了TreeQN和ATreeC算法。并 阅读全文
posted @ 2022-04-18 07:54 initial_h 阅读(77) 评论(0) 推荐(0) 编辑