摘要: 目录0.scipy.optimize.minimize1.无约束最小化多元标量函数1.1Nelder-Mead(单纯形法) 1.2拟牛顿法:BFGS算法1.3牛顿 - 共轭梯度法:Newton-CG2 约束最小化... 阅读全文
posted @ 2019-02-22 22:34 jj千寻 阅读(5157) 评论(0) 推荐(0) 编辑
摘要: 目录1.马尔科夫性2.马尔科夫随机过程3.马尔科夫决策过程(MDP)3.1记状态s的状态值函数v(用于评价s的价值)为:3.2状态—行为价值函数q:3.3计算形式:3.4定义最优:4.实际计算MDP过程 参考博客... 阅读全文
posted @ 2019-02-22 20:33 jj千寻 阅读(1039) 评论(0) 推荐(0) 编辑