Loading

摘要: 在很多应用场景中,马尔可夫决策过程的状态转移概率 \(p(s^ {\prime}|s,a)\) 和奖励函数 \(r\left( {s,a,s^{\prime}} \right)\) 都是未知的。这种情况一般需要智能体与环境交互,然后收集一些样本,然后再根据这些样本来求解最优策略,这种基于采样的学习方 阅读全文
posted @ 2020-04-27 16:40 MayeZhang 阅读(1181) 评论(0) 推荐(0) 编辑
摘要: 简直整公式的神器啊,直接对公式截图然后就出来对应的Latex代码了 1 下载桌面版 直接下载安装就可以了 链接:Mathpix官网 2 注册个账号 每个月有50个免费截图次数,用完了换个邮箱再注册就ok了 链接:Mathpix账号注册 3 使用 打开桌面版应用点击加号 随便找个公式截图 ​ 可以看出 阅读全文
posted @ 2020-03-29 17:59 MayeZhang 阅读(1602) 评论(0) 推荐(0) 编辑
摘要: 本来天真的以为 \(h_{i,j}\) 就是发射端第 \(i\) 个天线和接收端第 \(j\) 个天线之间的固定通道连接,后来在看一篇Millimeter-Wave通信论文时候发现这每一个 \(h_{i,j}\) 就应该相当于一个子信道,也是由一堆不同的路径叠加而成的。发现好几篇与毫米波相关的论文使 阅读全文
posted @ 2020-02-27 20:31 MayeZhang 阅读(24104) 评论(13) 推荐(4) 编辑
摘要:  博客园快捷发布工具测试 测试 test 可以的? $$ \theta = \alpha+theta $$ 阅读全文
posted @ 2020-02-27 16:44 MayeZhang 阅读(173) 评论(1) 推荐(0) 编辑