摘要:
目录0.scipy.optimize.minimize1.无约束最小化多元标量函数1.1Nelder-Mead(单纯形法) 1.2拟牛顿法:BFGS算法1.3牛顿 - 共轭梯度法:Newton-CG2 约束最小化... 阅读全文
摘要:
目录1.马尔科夫性2.马尔科夫随机过程3.马尔科夫决策过程(MDP)3.1记状态s的状态值函数v(用于评价s的价值)为:3.2状态—行为价值函数q:3.3计算形式:3.4定义最优:4.实际计算MDP过程 参考博客... 阅读全文