摘要: 趁老师不注意,把试卷拍了照…… 阅读全文
posted @ 2023-06-10 19:18 MoonOut 阅读(34) 评论(0) 推荐(0) 编辑
摘要: 趁老师不注意,把试卷拍了照…… 阅读全文
posted @ 2023-06-10 19:15 MoonOut 阅读(59) 评论(0) 推荐(0) 编辑
摘要: 趁老师不注意,把试卷拍了照…… 阅读全文
posted @ 2023-06-10 19:11 MoonOut 阅读(20) 评论(0) 推荐(0) 编辑
摘要: 趁老师不注意,把试卷拍了照…… 阅读全文
posted @ 2023-06-10 19:07 MoonOut 阅读(17) 评论(0) 推荐(0) 编辑
摘要: 感谢善良的知乎博客🙏🏻 阅读全文
posted @ 2023-05-31 10:59 MoonOut 阅读(121) 评论(0) 推荐(0) 编辑
摘要: subplots 子图,scatter 散点图,plot 连点成线,color 与 fontsize。 阅读全文
posted @ 2023-05-26 10:55 MoonOut 阅读(82) 评论(0) 推荐(0) 编辑
摘要: 使用 python datetime 库,实现微秒级计时。 阅读全文
posted @ 2023-05-25 21:52 MoonOut 阅读(143) 评论(0) 推荐(0) 编辑
摘要: 先复制粘贴,在粘贴时点“选择性粘贴”,点选“转置”。 阅读全文
posted @ 2023-05-14 10:03 MoonOut 阅读(40) 评论(0) 推荐(0) 编辑
摘要: 基于 14 年的 MFRL 论文,利用相邻 state-action 的空间相关性来加速学习,用 gaussian processes 建模 env dynamics(model-based)/ Q function(model-free),得到了两种跟 14 年 MFRL 很相似的算法。 阅读全文
posted @ 2023-04-16 13:21 MoonOut 阅读(115) 评论(0) 推荐(0) 编辑
摘要: RL episode 长度 = 1,先用 PPO 在 low-fidelity env 上学;维护一个 reward 的方差,如果方差足够小,就从 low-fidelity env 迁移到 high-fidelity env。 阅读全文
posted @ 2023-04-15 19:51 MoonOut 阅读(24) 评论(0) 推荐(0) 编辑
摘要: 安利一天能免费使用 10 次且好用的工具 Mathpix。 阅读全文
posted @ 2023-04-15 18:59 MoonOut 阅读(62) 评论(0) 推荐(0) 编辑
摘要: motivation:一些预算用于训 low-fidelity model,剩下预算用于 Monte Carlo 模拟,以得到结果。数学证明:近似 + 递推或迭代或归纳法。总结:目前看来,对我的工作意义不大。 阅读全文
posted @ 2023-04-15 18:56 MoonOut 阅读(118) 评论(0) 推荐(0) 编辑
摘要: 记于柳絮飞扬的癸卯年丙辰月…… 阅读全文
posted @ 2023-04-14 16:11 MoonOut 阅读(618) 评论(1) 推荐(0) 编辑
摘要: markdown 写矩阵和大公式的代码存档。 阅读全文
posted @ 2023-04-12 09:33 MoonOut 阅读(75) 评论(0) 推荐(0) 编辑
摘要: motivation:鼓励探索。主要方法:给 agent 不熟悉的 state 一个 intrinsic reward。关键问题:如何判断 agent 对某个 state 的熟悉程度。 阅读全文
posted @ 2023-04-06 21:58 MoonOut 阅读(552) 评论(0) 推荐(0) 编辑
摘要: “我们走到了南京眼,趴在桥上看长江、灯火与晚风,享受一些天真又忧愁的少年时光。” 阅读全文
posted @ 2023-04-06 16:02 MoonOut 阅读(146) 评论(0) 推荐(0) 编辑
摘要: 2022 年暑假,海投夏令营时整理的材料。 阅读全文
posted @ 2023-04-04 15:06 MoonOut 阅读(11795) 评论(0) 推荐(3) 编辑
摘要: 2022 年暑假,海投夏令营时整理的材料。 阅读全文
posted @ 2023-04-04 14:56 MoonOut 阅读(1571) 评论(0) 推荐(2) 编辑
摘要: 2022 年暑假,海投夏令营时整理的材料。 阅读全文
posted @ 2023-04-04 14:47 MoonOut 阅读(2193) 评论(0) 推荐(2) 编辑
摘要: Reinforcement learning with multi-fidelity simulators,是 14 年的 ICRA 会议的论文。师兄说是 robotics 顶会,但中稿率蛮高的。 阅读全文
posted @ 2023-04-03 17:26 MoonOut 阅读(171) 评论(0) 推荐(1) 编辑
摘要: 火焰明亮绚烂如昙花一现,但我却是极夜里沐临北斗的赶路人,在星光的鼓舞下,还有更长的路要走。 阅读全文
posted @ 2023-03-27 00:19 MoonOut 阅读(98) 评论(0) 推荐(0) 编辑
摘要: 啊…… 感觉它能 work 还是加了很多 tricks 的… 阅读全文
posted @ 2023-03-06 17:44 MoonOut 阅读(219) 评论(0) 推荐(0) 编辑
摘要: motivation:减少 RL 试错过程中的 unsafe behavior。技术路线:先模仿学习,再在 on-line learning 时强行改可能 unsafe 的 action,即 post-hoc rectification。 阅读全文
posted @ 2023-03-05 13:13 MoonOut 阅读(92) 评论(0) 推荐(0) 编辑
摘要: 当你完全不想锻炼英语阅读能力,只想快速得知论文内容…… 阅读全文
posted @ 2023-03-04 12:32 MoonOut 阅读(22) 评论(0) 推荐(0) 编辑
摘要: 主要就是 __init__, step, reset 三个方法,① __init__ 要记得定义 state action space,② step 返回 (obs, reward, done, info),③ reset 返回 obs。返回的 obs 要用 np.ndarray 表示。 阅读全文
posted @ 2023-03-03 11:03 MoonOut 阅读(322) 评论(0) 推荐(0) 编辑
摘要: 左下角“设置”→ 搜索 language → 把 python 的 language server 改成 pylance → 重装 pylance 阅读全文
posted @ 2023-03-02 21:52 MoonOut 阅读(8683) 评论(0) 推荐(1) 编辑
摘要: ① pandas 读 csv,② 基于 pytorch 的模型搭建、训练、测试。 阅读全文
posted @ 2023-03-02 15:49 MoonOut 阅读(54) 评论(1) 推荐(0) 编辑
摘要: 管理员打开 cmd,输入 netsh winsock reset,重启电脑就可以了! 阅读全文
posted @ 2023-02-20 21:10 MoonOut 阅读(3751) 评论(0) 推荐(0) 编辑
摘要: 那些湛远的天穹,红枫与梧桐的秋日,墨蓝的星月交辉的夏夜 —— 既然真真切切存在,可否带你回去? 阅读全文
posted @ 2023-02-17 22:16 MoonOut 阅读(13) 评论(0) 推荐(0) 编辑
摘要: 有用的教程与使用经验。 阅读全文
posted @ 2023-02-06 14:48 MoonOut 阅读(50) 评论(0) 推荐(0) 编辑
摘要: 果断换皮肤 😉 阅读全文
posted @ 2023-01-01 23:04 MoonOut 阅读(37) 评论(1) 推荐(0) 编辑
摘要: 科目一备考支持。同步发表在 b 站知乎了,所以为了贴合平台风格,前面写了一堆 random 引言,还贴了几个喵喵表情 😂 阅读全文
posted @ 2023-01-01 09:30 MoonOut 阅读(1086) 评论(1) 推荐(0) 编辑
摘要: 但倘若细看这些照片,仍能回想起,当时的亭台楼阁,当时的移步换景,当时被美景所触动与迷惑,不由自主按下快门…… 阅读全文
posted @ 2022-12-25 18:49 MoonOut 阅读(56) 评论(0) 推荐(0) 编辑
摘要: 随手记录我们 OS 课设的答辩经历。记于 omicron 流行的壬寅年壬子月…… 阅读全文
posted @ 2022-12-22 15:00 MoonOut 阅读(175) 评论(0) 推荐(0) 编辑
摘要: 在装服务器 python 环境,顺便整理一下 python 虚拟环境(venv)搭建全流程 阅读全文
posted @ 2022-12-22 11:47 MoonOut 阅读(177) 评论(1) 推荐(0) 编辑
摘要: 把字模代码粘进正文里了,欢迎查看 阅读全文
posted @ 2022-12-04 20:18 MoonOut 阅读(309) 评论(0) 推荐(0) 编辑
摘要: 在简单的真实场景下,列举 git branch 系列命令的使用流程 阅读全文
posted @ 2022-11-23 21:48 MoonOut 阅读(26) 评论(0) 推荐(0) 编辑
摘要: win + H 打开听写功能,即可打开语音输入,帮你快速完成文档 😉 阅读全文
posted @ 2022-11-21 16:25 MoonOut 阅读(320) 评论(0) 推荐(0) 编辑
摘要: 解决方案:运行 PulseSecureService 服务,然后就正常了! 阅读全文
posted @ 2022-11-14 16:56 MoonOut 阅读(938) 评论(0) 推荐(0) 编辑
摘要: 栖霞山称不上四大赏枫圣地的盛名,但也不乏美景。 挨家挨户吃美食,太愉悦了。 阅读全文
posted @ 2022-11-14 15:56 MoonOut 阅读(169) 评论(0) 推荐(0) 编辑