会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
Victo
我的网络笔记本,用于收藏和总结一些知识。
博客园
::
首页
::
博问
::
闪存
::
新随笔
:: :: ::
管理
::
公告
2020年10月13日
【机器学习】置信区间上界算法UCB(Upper Confidence Bound)
摘要: 引用原文:https://segmentfault.com/a/1190000018871668 本文将要开始介绍机器学习中的强化学习, 这里首先应用一个多臂老·虎·机(The Multi-Armed Bandit Problem)问题来给大家解释什么是强化学习。 多臂老·虎·机问题 如图所示,我们
阅读全文
posted @ 2020-10-13 13:48 VictoKu
阅读(11127)
评论(3)
推荐(1)
编辑