会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
月出兮彩云归 🌙
首页
新随笔
联系
订阅
管理
随笔 - 195
文章 - 0
评论 - 31
阅读 -
88003
收藏
闪存
小组
博问
MoonOut
+ 关注
园龄:3年10个月
粉丝:37
关注:8
阅读排行榜
上一页
1
2
3
4
5
6
7
8
···
10
下一页
LaTex · overleaf | 使用技巧存档
MoonOut 2023-06-16 10:10
阅读:316
评论:1
推荐:0
编辑
RL 基础 | 如何使用 OpenAI Gym 接口,搭建自定义 RL 环境(详细版)
MoonOut 2024-11-11 22:53
阅读:311
评论:0
推荐:0
编辑
python · pandas |(已解决)AttributeError: 'DataFrame' object has no attribute 'append'
MoonOut 2024-06-23 15:39
阅读:280
评论:0
推荐:0
编辑
offline RL · PbRL | Preference Transformer:反正感觉 transformer 很强大
MoonOut 2024-03-06 12:57
阅读:280
评论:1
推荐:0
编辑
PbRL | SURF:使用半监督学习,对 labeled segment pair 进行数据增强
MoonOut 2023-11-11 20:16
阅读(273)
评论(0)
推荐(1)
编辑
时空图预测的方法论,以及 diffusion model 基本概念
MoonOut 2023-06-10 20:55
阅读:269
评论:0
推荐:0
编辑
线性代数 | 三个二次型题目
MoonOut 2022-08-22 15:51
阅读:269
评论:0
推荐:1
编辑
offline 2 online | 重要性采样,把 offline + online 数据化为 on-policy samples
MoonOut 2024-02-07 14:08
阅读(266)
评论(0)
推荐(1)
编辑
用线性二次模型建模大型数据中心,基于 MPC 进行冷却控制
MoonOut 2023-03-06 17:44
阅读:252
评论:0
推荐:0
编辑
offline RL | HIM:基于 hindsight 的 RL 是一类大 idea
MoonOut 2024-02-27 21:08
阅读(243)
评论(0)
推荐(0)
编辑
概述:基于事件的优化方法 / 事件驱动优化 / Event-Based Optimization / EBO
MoonOut 2022-05-26 21:28
阅读:242
评论:0
推荐:0
编辑
offline RL | BCQ:学习 offline dataset 的 π(a|s),直接使用 (s, π(s)) 作为 Q learning 训练数据
MoonOut 2023-11-27 21:29
阅读(239)
评论(0)
推荐(0)
编辑
RL 基础 | Policy Gradient 的推导
MoonOut 2024-03-21 16:46
阅读:231
评论:0
推荐:0
编辑
凸优化 | Lagrange 对偶:极大极小不等式的证明
MoonOut 2023-11-07 10:51
阅读(229)
评论(1)
推荐(0)
编辑
大四上 | 计算机综合课设(OS)· 答辩经验帖
MoonOut 2022-12-22 15:00
阅读:212
评论:0
推荐:0
编辑
线性代数 | Jordan 标准型的笔记
MoonOut 2022-08-22 17:48
阅读:209
评论:0
推荐:0
编辑
Multi-Fidelity RL | 多精度 simulator 中的 RL:一篇 14 年 ICRA 的古早论文
MoonOut 2023-04-03 17:26
阅读:206
评论:0
推荐:1
编辑
事件驱动优化:理论
MoonOut 2022-05-28 19:44
阅读:201
评论:0
推荐:0
编辑
offline 2 online | AWAC:基于 AWR 的 policy update + online 补充数据集
MoonOut 2024-02-05 21:50
阅读(197)
评论(0)
推荐(1)
编辑
交叉熵、KL 散度 | 定义与相互关系
MoonOut 2024-07-25 12:35
阅读:193
评论:0
推荐:0
编辑
上一页
1
2
3
4
5
6
7
8
···
10
下一页
博客园
首页
新随笔
草稿箱
联系
订阅
管理
随笔:
195
文章:
0
评论:
31
阅读:
88003
公告
昵称:
MoonOut
园龄:
3年10个月
粉丝:
37
关注:
8
+加关注
Spring Wonderland
04 March, 2025
我的标签
offline RL
(17)
PbRL
(12)
conda
(2)
MORL
(1)
随笔分类
(208)
🪔 misc & 随记(28)
🍑 SEUCSE 笔记(13)
🍇 THUDA · PhD 笔记(18)
🌮 零零散散的经验(41)
🍁 论文速读(4)
🍵 论文阅读(49)
🍅 人工智能(14)
🥝 数学频道(19)
🌺 刷题记录(18)
🌾 算法模板(4)
阅读排行榜
1. cs 保研经验贴 | 综合面试题库(12511)
2. (已解决)vscode python 代码高亮异常 - 引入的包不显示(9537)
3. 线性代数 | 等价、相似、合同(6847)
4. (已解决)C·lash 核心崩溃“failed to c·lash core, logs are not available”(4625)
5. 运筹学 | 基础向 | 线性规划的对偶理论(2383)
6. cs 保研经验贴 | 数学试题 · 自动化所特供版(2340)
7. 高等数学 | 数列 函数 级数 函数项级数之收敛性(下)(1980)
8. cs 保研经验贴 | 英语口试(1638)
9. (已解决)Adobe Creative Cloud 安装 Acrobat PDF 报错 DW071 DW003(1573)
10. Conda | 如何在 Linux 服务器安装 conda(1444)
11. 运筹学 | 基础向 | 线性规划的运输问题(1436)
12. 运筹学 | 退化的最优解 vs 无穷多最优解?(1432)
13. 科目一 | 攻略 记诵 口诀 资料 | 扣分 罚款 拘留 驾驶证 登记(1236)
14. offline RL | D4RL:最常用的 offline 数据集之一(1233)
15. Contrastive Learning 对比学习 | 何恺明大神的 SimSiam(1123)
16. (已解决)pulse secure 连接功能变灰禁用 连接面板找不到(1009)
17. 运筹学 | 基础向 | 线性规划、单纯形法(905)
18. 关于 KL 散度和变分推断的 ELBO(887)
19. RL 基础 | 如何复现 PPO,以及一些踩坑经历(856)
20. transforming 开头的 RL 数据中心冷却控制(819)
点击右上角即可分享
深色
回顶
展开
收起
1
Sibelius: Violin Concerto in D Minor, Op. 47:III. Allegro, ma non tanto
Jascha Heifetz / Chicago Symphony Orchestra
Sibelius: Violin Concerto in D Minor, Op. 47:III. Allegro, ma non tanto
- Jascha Heifetz / Chicago Symphony Orchestra
00:00
/
00:00
An audio error has occurred.