03 2022 档案
摘要:强化学习中涉及的采样方法包括重要性采样的相关内容和一些自己的思考 在之前内容的整理中涉及了一些重要性采样的内容,在介绍蒙特卡罗离线策略 时有所提及。其中详细介绍了到底什么是重要性采样。 这篇博文主要想更加深刻得思考为什么用的是重要性采样方法? 强化学习中为什么要用重要性采样? 参考链接中一句话说的很
阅读全文
摘要:要解决的问题很简单如题,判断乘积方差与方差乘积之间的大小关系。 不得不说,乍一看真的很简单-_- 就是那种简单套路,随便一比应该就出来了吧 自己一去做好像就不是这么回事了... 上网查了一下基本没有详细步骤,就把我最后的智慧结晶贴出来(虽然这是数学证明的常用套路) 问题 随机变量和相互独
阅读全文