会员
商店
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
二球悬铃木
博客园
首页
新随笔
联系
订阅
管理
随笔 - 52
文章 - 0
评论 - 1
阅读 -
55527
04 2023 档案
强化学习 Reinforcement Learning
摘要:强化学习 Reinforcement Learning 强化学习是一种机器学习思想,其关心一个智能体如何采取行动以达到最大化激励回报。 基本的强化学习模型以马尔可夫决策过程建模。 马尔可夫决策过程 Markov Decision Process 系统要素 A 行动空间; S状态空间; $P^a_{s
阅读全文
posted @
2023-04-12 02:02
二球悬铃木
阅读(194)
评论(0)
推荐(0)
编辑
公告
昵称:
二球悬铃木
园龄:
10年6个月
粉丝:
0
关注:
0
+加关注
<
2025年3月
>
日
一
二
三
四
五
六
23
24
25
26
27
28
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
1
2
3
4
5
搜索
常用链接
我的随笔
我的评论
我的参与
最新评论
我的标签
我的标签
机器学习
(12)
数学
(8)
NLP
(5)
深度学习
(5)
ubuntu
(3)
java
(3)
自然语言处理
(3)
scala
(2)
python
(2)
maven
(2)
更多
随笔分类
Linux(2)
tensorflow(1)
Web(2)
编程(8)
概率论(1)
构建工具(2)
机器学习(14)
开发环境(3)
容器化(1)
深度学习(3)
数据分析(2)
数据格式化(1)
数据库(2)
数学(10)
索引(1)
题录工具(1)
微积分(1)
线性代数(1)
信息论(1)
优化理论(1)
自然语言处理(8)
更多
随笔档案
2023年4月(1)
2022年7月(21)
2022年3月(1)
2021年11月(1)
2019年12月(1)
2019年11月(1)
2019年10月(1)
2019年5月(1)
2019年3月(2)
2019年2月(4)
2019年1月(4)
2018年12月(3)
2017年3月(5)
2016年9月(1)
2016年8月(1)
2016年7月(2)
2015年4月(2)
更多
推荐排行榜
1. 短文本、字符串相似度算法(1)
最新评论
1. Re:解决Ubuntu下sublime中不能输入中文的问题
ubuntu环境版本14.04
--二球悬铃木
点击右上角即可分享