会员
商店
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
LAKan的笔记
博客园
首页
新随笔
联系
订阅
管理
随笔 - 10
文章 - 1
评论 - 25
阅读 -
14936
阅读排行榜
1
2
下一页
MAPPO学习笔记(2) —— 从MAPPO论文入手
几块红布 2022-10-14 15:39
阅读(3995)
评论(19)
推荐(3)
编辑
MAPPO学习笔记(1):从PPO算法开始
几块红布 2022-06-19 02:49
阅读(3989)
评论(0)
推荐(2)
编辑
MAPPO学习笔记(3)——从MAPPO代码入手
几块红布 2024-04-01 16:52
阅读(2561)
评论(6)
推荐(2)
编辑
Longformer详解——从Self-Attention说开去
几块红布 2022-08-09 17:06
阅读(1982)
评论(0)
推荐(0)
编辑
Albert理论详解:用矩阵分解与跨层参数共享减少参数量
几块红布 2022-08-15 14:06
阅读(1011)
评论(0)
推荐(0)
编辑
1
2
下一页
公告
昵称:
几块红布
园龄:
2年9个月
粉丝:
17
关注:
1
+加关注
<
2025年3月
>
日
一
二
三
四
五
六
23
24
25
26
27
28
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
1
2
3
4
5
搜索
常用链接
我的随笔
我的评论
我的参与
最新评论
我的标签
我的标签
PPO算法
(2)
nlp
(2)
MAPPO算法
(2)
数据集相关
(2)
上班摸鱼
(2)
强化学习
(2)
cv
(1)
随笔档案
2024年4月(1)
2023年4月(1)
2022年10月(1)
2022年8月(4)
2022年6月(3)
相册
美化用(11)
阅读排行榜
1. MAPPO学习笔记(2) —— 从MAPPO论文入手(3993)
2. MAPPO学习笔记(1):从PPO算法开始(3982)
3. MAPPO学习笔记(3)——从MAPPO代码入手(2550)
4. Longformer详解——从Self-Attention说开去(1978)
5. Albert理论详解:用矩阵分解与跨层参数共享减少参数量(1011)
评论排行榜
1. MAPPO学习笔记(2) —— 从MAPPO论文入手(19)
2. MAPPO学习笔记(3)——从MAPPO代码入手(6)
推荐排行榜
1. MAPPO学习笔记(2) —— 从MAPPO论文入手(3)
2. MAPPO学习笔记(3)——从MAPPO代码入手(2)
3. MAPPO学习笔记(1):从PPO算法开始(2)
最新评论
1. Re:MAPPO学习笔记(2) —— 从MAPPO论文入手
@几块红布 我发现如果在env_core中设置动作维度为5,policy网络的输出是一个shape=(5,5)的矩阵,他似乎是直接将这里的动作维度也输入到了act函数中,可能在加入自己的环境时,pol...
--AABB的C
2. Re:MAPPO学习笔记(3)——从MAPPO代码入手
@wyiiiiii 算法流程的话详见伪代码,如果你是对其中某一块内容抱有疑问的话欢迎一起讨论呀...
--几块红布
3. Re:MAPPO学习笔记(3)——从MAPPO代码入手
@wyiiiiii 第一个问题,有关replay_buffer中存储的数据,可以参考shared_buffer.py中 line90 的insert函数,除了你上面提及到的那些之外,还存储了每个智能体...
--几块红布
4. Re:MAPPO学习笔记(3)——从MAPPO代码入手
@几块红布 哈哈首先祝up你毕业快乐!主要就是第一个评论的问题,在mappo中算法流程以及参数更新之类的问题不是很理解...
--wyiiiiii
5. Re:MAPPO学习笔记(3)——从MAPPO代码入手
@wyiiiiii 你好你好,最近事情突然很多,刚忙完毕业之类的事情,所以没上园子,您可以更详细地描述一下你的疑问吗(如果没有解决的话)...
--几块红布
点击右上角即可分享