摘要:
详细内容 简介 根据维基百科对强化学习的定义:Reinforcement learning (RL) is an area of machine learning inspired by behaviorist psychology, concerned with how software agen 阅读全文
摘要:
两者都可以用来衡量两个概率分布之间的差异性。JS散度是KL散度的一种变体形式。 KL散度:也称相对熵、KL距离。对于两个概率分布P和Q之间的差异性(也可以简单理解成相似性),二者越相似,KL散度越小。 KL散度的性质:●非负性。即KL散度大于等于零。 ●非对称性。即运算时交换P和Q的位置,得到的结果 阅读全文