摘要:
**发表时间:**2020(AAAI 2021) **文章要点:**这篇文章提出Propositional Logic Nets (PROLONETS),通过建立决策树的方式来初始化神经网络的结构和权重,从而将人类知识嵌入到神经网络中作为初始化warm start,然后进行强化学习。 具体的,就是先 阅读全文
摘要:
**发表时间:**2018(ICLR 2018) **文章要点:**这篇文章设计了特别的网络结构,将树结构嵌入到神经网络中,实现了look-ahead tree的online planning,将model free和online planning结合起来,并提出了TreeQN和ATreeC算法。并 阅读全文