12 2019 档案
元学习基本概念笔记
摘要:元学习是深度学习领域最活跃的研究领域之一。人工智能(AI)社区中的一些思想流派赞成这样的论点,即元学习是解锁人工智能(AGI)的垫脚石之一。近年来,我们已经看到了元学习技术的研究与开发中的爆炸式增长。但是,元学习背后的一些基本思想仍然被数据科学家和工程师误解。...
深度强化学习系列tensorflow2.0自定义loss函数实现policy gradient策略梯度
摘要:本篇文章利用tensorflow2.0自定义loss函数实现policy gradient策略梯度,自定义loss=-log(prob) *Vt现在训练最高分能到193分,但是还是不稳定,在修改中,欢迎一起探讨文章代码也有参考莫烦大佬的代码action_dim...