摘要: 1.Monte-Carlo Reinforcement Learning a)MC方法直接从经历中的episodes中学习 b)MC方法是无模型的, c)从完整的episodes中学习:而不是走一步学学一步(bootstrapping) d)注意:只能将MC方法应用到episodic MDPs,而且 阅读全文
posted @ 2017-04-14 21:37 陈煜弘 阅读(273) 评论(0) 推荐(0) 编辑
摘要: 1.生成dot 2.根据生成的dot生成png图 3.结果: 4.使用代码 阅读全文
posted @ 2017-04-14 12:18 陈煜弘 阅读(218) 评论(0) 推荐(0) 编辑
摘要: 1.使用Jmeter进行性能测试 2,性能的关键指标 通过技术手段模拟大量用户同时访问被测应用,观察、记录和分析系统的各项性能指标的过程。 1)模拟大量并发用户 2)监控系统负载参数分析系统瓶颈 3)平均响应时间:平均每个请求从发送到接收响应的时间 性能指标--系统资源类 CPU:cpu的占用率 内 阅读全文
posted @ 2017-04-06 15:59 陈煜弘 阅读(243) 评论(0) 推荐(0) 编辑
摘要: 1.实验问题 在4x4矩阵中添加终点和障碍点,分别有一个或多个,并且满足以下属性: 终点:value值不变,始终为0,邻接点可到达用大写字母E表示 障碍点:表示该点在矩阵中“不存在”,邻接点不可到达该点,且该点没有value值跟状态,使用符号‘#’表示 以任意除以上两种结点之外的所有其它结点为起点, 阅读全文
posted @ 2017-04-02 23:20 陈煜弘 阅读(3455) 评论(0) 推荐(0) 编辑
摘要: 1.利用动态序列或时间分量去最优化一个问题的程序 它是解决复杂问题的一种方法,通过分解子问题,解决子问题,组合子问题的解来实现 2.动态编程是解决包含以下属性问题的解决办法: 1)最优子结构 最优应用原则和最优解能被分解成子问题 2)覆盖子问题 子问题出现多次 子问题的解可以被缓存和重复利用 3)M 阅读全文
posted @ 2017-03-31 19:01 陈煜弘 阅读(290) 评论(0) 推荐(0) 编辑
摘要: 1.MDPs介绍 1)马尔可夫决策过程正式描述了强化学习的环境,并且环境是可观测的 2)当前状态完全刻画了整个过程 3)几乎所有的强化学习问题都可以描述成为MDPs,比如 最优控制优先使用连续MDPs 部分可观测问题可以转换为MDPs “侠盗飞车”也是状态相关的MDPs 2.马尔可夫特性:即无记忆性 阅读全文
posted @ 2017-03-31 15:51 陈煜弘 阅读(385) 评论(0) 推荐(0) 编辑
摘要: Selenium上机实验 博客地址:http://www.cnblogs.com/--CYH--/p/6612232.html github:https://github.com/JohnsonGreen/winfile/tree/master/WorkSpace/EclipseJavaWeb/Se 阅读全文
posted @ 2017-03-24 16:43 陈煜弘 阅读(263) 评论(0) 推荐(0) 编辑
摘要: 注意:由遍历序列构造二叉树,由二叉树的先序序列和中序序列,后续序列和中序序列,层序序列和中序序列可以唯一地确定一棵二叉树,如果只知道二叉树的先序序列和后序序列则无法唯一确定一棵二叉树 线索二叉树: 阅读全文
posted @ 2017-03-20 11:42 陈煜弘 阅读(434) 评论(0) 推荐(0) 编辑
摘要: 1.树的定义 树是N(N>=0)个结点的有限集合,N=0时,称为空树,这是一种特殊情况。在任意一棵非空树种应满足: 1)有且仅有一个特定的成为根的结点 2)当N>1时,其余结点可分为m(m>0)个互不相交的有限集合T1,T2,T3..Tm,其中每一个集合,本身又是一棵树,并且称为根节点的子树。显然树 阅读全文
posted @ 2017-03-18 23:07 陈煜弘 阅读(247) 评论(0) 推荐(0) 编辑
摘要: 恢复内容开始 1.静态局部变量的特点: 1)不会随着函数的调用和退出而发生变化,不过,尽管该变量还继续存在,但不能使用它。倘若再次调用定义它的函数时,它又可继续使用,而且保存了前次被调用后留下的值 2)静态局部变量只会初始化一次 3)静态属性只能被初始化为一个字符值或一个常量,不能使用表达式。即使局 阅读全文
posted @ 2017-03-18 10:53 陈煜弘 阅读(218) 评论(0) 推荐(0) 编辑