复杂系统 | 20240116 · 考试题目回忆版

相关链接：

十个判断题，感觉都是正确的（）

十个选择题，应该也算比较基础，考到了 EBO 和什么 steady state distribution，什么 estimate interval \((1/t)^{1/2}\) 收敛之类。

（btw 这次客观题答错不扣分；jls 当时说，想答错扣分，保证 random policy 的得分期望为 0… 幸好后来没有实施）

有三个大题，第一个是 alias method 画表 + 数归证明。

第二个是 policy gradient theorem，第一问给出形式，第二问证明。（没复习 policy gradient theorem，现场推的东西是错的，完蛋…）

第三个是给出并证明 Little's Law。

posted @ 2024-02-06 10:37 MoonOut 阅读(73) 评论(0) 收藏举报

刷新页面返回顶部

月出兮彩云归 🌙