摘要: 最近安装了win7 64位旗舰版+Vistual Studio2017,发现编译程序的时候出现sdk的错误,网上的解决方法大同小异,但都不太好使,经过一番折腾,总算是完美解决。 编译时VS2017报错如下所示: vs2017 error MSB8036: The Windows SDK versio 阅读全文
posted @ 2018-04-09 09:01 飞翔的拖拉机 阅读(32569) 评论(0) 推荐(0) 编辑
摘要: ubuntu14.04.5+ROS indigo,在运行gazebo2.2.3时,出现“error [node.cc:90] no namespace found”的错误,但gazebo依然可以打开使用。 网上很多教程虽然给出了办法,但下载网址不对,自己折腾了半天,总算发现需要将原来的 http:/ 阅读全文
posted @ 2018-04-04 19:03 飞翔的拖拉机 阅读(1318) 评论(0) 推荐(0) 编辑
摘要: 对于IEEE 会议或者期刊的投稿,常常需要先进行pdftest,也就是格式审查,如果审查不通过,那么就无法投稿。审查时会出现各种问题,千奇百怪,但大部分都能找到有效的解决方案。 其中This document has 1 type 3 font occurring on page 4的解决方案大部分 阅读全文
posted @ 2018-03-06 10:44 飞翔的拖拉机 阅读(2377) 评论(0) 推荐(0) 编辑
摘要: Latex作为目前最好用的文档编排工具,以前只是简单会一点,现在也已经忘得差不多了。因为写小论文的需要,打算重新开始学习,以前用的是Texlive和Texmaker,这次经过师兄的推荐,还是打算选择CTex套装,但自己把WinEdt7.0换成了WinEdt10.2,并完美注册码破解。经过两个多小时的 阅读全文
posted @ 2018-01-02 11:40 飞翔的拖拉机 阅读(49755) 评论(1) 推荐(6) 编辑
摘要: 大名鼎鼎的蒙特卡洛方法(MC),源自于一个赌城的名字,作为一种计算方法,应用领域众多,主要用于求值。蒙特卡洛方法的核心思想就是:模拟 抽样 估值。 蒙特卡洛的使用条件:1.环境是可模拟的;2.只适合情节性任务(episode tasks)。 蒙特卡洛在强化学习中的应用: 1.完美信息博弈:围棋、象棋 阅读全文
posted @ 2017-12-07 16:38 飞翔的拖拉机 阅读(6879) 评论(0) 推荐(0) 编辑
摘要: 假设一个风投公司想使他的收益最大化,这时他总会面临一个两难问题: 何时去投资那些已经成功的公司?何时去投资那些还没有成功但具有很大潜力的公司?简单说就是,收益总是伴随着风险而存在. 这样的两难问题在日常生活中也是非常常见的,称为EE问题(Exploration and Exploitation tr 阅读全文
posted @ 2017-12-07 16:37 飞翔的拖拉机 阅读(3531) 评论(0) 推荐(0) 编辑
摘要: RL问题的基础就是马尔科夫决策过程(MDP),因此,这一块内容虽然基础,但确是不得不总结的内容。网上虽然有很多博客、专栏介绍,但总感觉似是而非,有些还有些许错误。这里打算按照教材中的体系再度总结一下吧。这一块概念性的东西比较多,比如马尔科夫性质(无后效性),比如值函数、最优值函数、最优动作价值函数等 阅读全文
posted @ 2017-12-07 16:37 飞翔的拖拉机 阅读(1298) 评论(0) 推荐(0) 编辑
摘要: 动态规划是强化学习里面最基础的部分,其核心思想 通用策略迭代(Generalized Policy Iteration,GPI)。 首先强调一点,动态规划(Dynamic Programming)要求一个完全已知的环境模型,所谓完全已知,就是MDP的五元组全部已知,当然了,主要还是指状态转移概率已知 阅读全文
posted @ 2017-12-07 16:37 飞翔的拖拉机 阅读(4343) 评论(0) 推荐(3) 编辑
摘要: 本人硕士期间就对RL比较感兴趣,当时AlpahGo还没火,可能更多是对于Strong AI的前景和未来有着较大期待吧,后来随着AlphaGo--Master zero版本的不断更新,再加上OpenAI的星际争霸等,RL逐步焕发出了新的生机。因此,自从2016年下半年开始断断续续地学习强化学习到现在, 阅读全文
posted @ 2017-12-07 16:36 飞翔的拖拉机 阅读(3549) 评论(0) 推荐(0) 编辑