摘要: 这篇文章是https://www.cnblogs.com/chester-cs/p/12928649.html的代码补充解释,这里我仅仅实现了Value迭代,Policy迭代读者可以尝试自己实现。 学习了MDP即马尔科夫决策过程之后我就想用代码实现实现,想看看机器是如何不断优化自身的。 考虑这样一个 阅读全文
posted @ 2020-07-30 15:08 思念殇千寻 阅读(578) 评论(0) 推荐(0) 编辑
摘要: 参考资料: https://inst.eecs.berkeley.edu/ USTC_MIRA_ML_Slides Lecturer: Jie Wang 机器学习课上到了增强学习这一节,其中提到了Markov决策过程以及增强学习的一些个算法(比如:增强学习中的Q-learning算法,MDP中的va 阅读全文
posted @ 2020-07-30 14:36 思念殇千寻 阅读(686) 评论(0) 推荐(0) 编辑
摘要: 你可能会遇到这样的情况,你使用PC上的各种下载工具从网站上下载了一个比较大的文件,然后你想将这个文件传输到你的手机上(比如.apk文件)。这个时候你应该使用什么样的方法呢?即PC(本地) to Andriod(本地)。 1. 考虑使用网盘或者网络文件中转站 因为万恶的资本主义,目前市面上的网盘都会对 阅读全文
posted @ 2020-07-30 13:31 思念殇千寻 阅读(1697) 评论(0) 推荐(0) 编辑