会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
买 了 佛 冷
新随笔
联系
管理
2018年11月20日
强化学习之QLearning
摘要: 注:以下第一段代码是 "文章" 提供的代码,但是简书的代码粘贴下来不换行,所以我在这里贴了一遍。其原理在原文中也说得很明白了。 算个旅行商问题 基本介绍 戳 "代码解释与来源" 代码整个计算过程使用的以下公式 QLearning 在上面的公式中,S表示当前的状态,a表示当前的动作,s~表示下一个状态
阅读全文
posted @ 2018-11-20 16:14 春雨冰河
阅读(1273)
评论(0)
推荐(0)
编辑
公告