联合会员
周边
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
mmhhhlb
博客园
首页
新随笔
联系
管理
订阅
随笔- 15 文章- 0 评论- 0 阅读-
1540
2025年1月21日
强化学习、MDP、策略梯度法
摘要: 一.简介 深度学习、强化学习和深度强化学习是机器学习的三个重要子领域。它们有着各自独特的应用场景和研究目标,虽然都属于机器学习的范畴,但各自的实现方式和侧重点有所不同。 1.1 深度学习与强化学习 1.1.1深度学习 深度学习是一种基于神经网络的机器学习方法,通过多层网络结构(即深度网络)来自动从数
阅读全文
posted @ 2025-01-21 18:39 魔魔胡胡胡萝卜
阅读(46)
评论(0)
推荐(0)
编辑
<
2025年3月
>
日
一
二
三
四
五
六
23
24
25
26
27
28
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
1
2
3
4
5
公告
昵称:
魔魔胡胡胡萝卜
园龄:
2个月
粉丝:
0
关注:
0
+加关注
搜索
常用链接
我的随笔
我的评论
我的参与
最新评论
我的标签
更多链接
随笔档案
2025年2月(6)
2025年1月(7)
2024年12月(2)
阅读排行榜
1. Transformer、编码器、解码器、全连接FFN、自注意力机制、嵌入向量、残差连接层归一化(398)
2. 泛化能力、过拟合、鲁棒性、敏感度、特征依赖(378)
3. 维度情感模型(192)
4. 数据集划分;参数超参数;交叉验证(154)
5. LSTM(Long Short-Term Memory)长短时记忆结构(113)
点击右上角即可分享