09 2023 档案

摘要:Finite-time Analysis of the Multiarmed Bandit Problem Abstract Reinforcement learning policies face the exploration versus exploitation dilemma, i.e. 阅读全文
posted @ 2023-09-16 11:01 藤君 阅读(121) 评论(0) 推荐(0) 编辑
摘要:大纲 级数 敛散性判断【比较判别法、比值判别法、根值判别法、积分判别法(注意,到这里的都是正项级数的判别法)、莱布尼茨判别法、阿贝尔判别法、迪利克雷判别法】、幂级数、傅里叶级数 幂级数的收敛半径、收敛区间、收敛域、和函数、阿贝尔引理 傅里叶级数:周期为2π的,迪利克雷定理,周期为2l的 阅读全文
posted @ 2023-09-04 21:00 藤君 编辑

点击右上角即可分享
微信分享提示