会员
周边
捐助
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
Halo辉Go
博客园
首页
新随笔
联系
订阅
管理
2023年8月24日
信息量、熵值,交叉熵等信息的详解
摘要: 信息量、熵、交叉熵、KL散度、交叉熵损失函数 - 哔哩哔哩 (bilibili.com)
阅读全文
posted @ 2023-08-24 20:57 Halo辉Go
阅读(16)
评论(0)
推荐(0)
编辑
总结一下强化学习中的面试问题
摘要: 1、PPO算法运用了clip函数限制取值范围,为什么还要加上min呢? 2、AC架构与PPO之间的区别? 3、什么是装饰器? 4、lamada函数? 5、什么是model-based与model-free? 6、python中map函数的用法? 7、准确率、精确率、召回率、F1score的意义? 8
阅读全文
posted @ 2023-08-24 20:27 Halo辉Go
阅读(136)
评论(0)
推荐(0)
编辑
公告