09 2024 档案

摘要:UCB(Upper Confidence Bound)算法是一种用于解决多臂老x虎机问题的启发式方法。多臂老x虎机问题是一种用以模拟现实世界决策问题的数学模型,其中“臂”代表不同的行动或选择,而“老x虎机”代表这些行动的随机结果。UCB算法的目标是在探索(exploration)和利用(exploi 阅读全文
posted @ 2024-09-08 21:44 静听微风tom 阅读(724) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示