2020 年 10月 13 日随笔档案 - VictoKu

2020年10月13日

【机器学习】置信区间上界算法UCB(Upper Confidence Bound)

摘要：引用原文：https://segmentfault.com/a/1190000018871668 本文将要开始介绍机器学习中的强化学习，这里首先应用一个多臂老·虎·机(The Multi-Armed Bandit Problem)问题来给大家解释什么是强化学习。多臂老·虎·机问题如图所示，我们阅读全文

posted @ 2020-10-13 13:48 VictoKu 阅读(11127) 评论(3) 推荐(1) 编辑

Victo

公告