2020 年 7月 30 日随笔档案 - 思念殇千寻

2020年7月30日

摘要：这篇文章是https://www.cnblogs.com/chester-cs/p/12928649.html的代码补充解释，这里我仅仅实现了Value迭代，Policy迭代读者可以尝试自己实现。学习了MDP即马尔科夫决策过程之后我就想用代码实现实现，想看看机器是如何不断优化自身的。考虑这样一个阅读全文

posted @ 2020-07-30 15:08 思念殇千寻阅读(578) 评论(0) 推荐(0) 编辑

对马尔科夫决策过程MDP（Markov Decision Processes）的一点理解

摘要：参考资料： https://inst.eecs.berkeley.edu/ USTC_MIRA_ML_Slides Lecturer: Jie Wang 机器学习课上到了增强学习这一节，其中提到了Markov决策过程以及增强学习的一些个算法（比如：增强学习中的Q-learning算法，MDP中的va 阅读全文

posted @ 2020-07-30 14:36 思念殇千寻阅读(686) 评论(0) 推荐(0) 编辑

使用Web在PC和安卓之间传输文件(Transfer files via wifi)

摘要：你可能会遇到这样的情况，你使用PC上的各种下载工具从网站上下载了一个比较大的文件，然后你想将这个文件传输到你的手机上（比如.apk文件）。这个时候你应该使用什么样的方法呢？即PC（本地） to Andriod（本地）。 1. 考虑使用网盘或者网络文件中转站因为万恶的资本主义，目前市面上的网盘都会对阅读全文

posted @ 2020-07-30 13:31 思念殇千寻阅读(1697) 评论(0) 推荐(0) 编辑

思念殇千寻

Why join the navy if you can be a pirate.

公告