2022 年 5月 21 日随笔档案 - lvdongjie-avatarx

2022年5月21日

摘要：详细内容简介根据维基百科对强化学习的定义：Reinforcement learning (RL) is an area of machine learning inspired by behaviorist psychology, concerned with how software agen 阅读全文

posted @ 2022-05-21 19:28 lvdongjie-avatarx 阅读(860) 评论(0) 推荐(0) 编辑

KL散度（距离）和JS散度（距离）

摘要：两者都可以用来衡量两个概率分布之间的差异性。JS散度是KL散度的一种变体形式。 KL散度：也称相对熵、KL距离。对于两个概率分布P和Q之间的差异性（也可以简单理解成相似性），二者越相似，KL散度越小。 KL散度的性质：●非负性。即KL散度大于等于零。 ●非对称性。即运算时交换P和Q的位置，得到的结果阅读全文

posted @ 2022-05-21 13:47 lvdongjie-avatarx 阅读(462) 评论(0) 推荐(0) 编辑

lvdongjie-avatarx

此博客专攻人工智能。

公告