会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
月出兮彩云归 🌙
首页
新随笔
联系
订阅
管理
当前标签:LLM
LLM | 正在尝试使用 verl
MoonOut 2026-01-20 16:20
阅读:77
评论:0
推荐:0
LLM | 正在尝试使用 LLaMA-Factory
MoonOut 2026-01-10 17:22
阅读:45
评论:0
推荐:0
LLM | ARC-AGI:有趣的 benchmark
MoonOut 2026-01-07 19:57
阅读:468
评论:0
推荐:2
LLM | multi-turn 任务下的 RL 微调:RAGEN, ArCHer, GiGPO, VinePPO
MoonOut 2026-01-03 16:54
阅读:58
评论:0
推荐:0
LLM · Agent | 通过推断别人身份 + 别人对自己说话的看法,让 agent 在阿瓦隆中欺骗
MoonOut 2025-03-10 18:03
阅读:126
评论:0
推荐:0
LLM · Agent | 使用 LLM 的通识决策能力,玩星际争霸
MoonOut 2025-03-10 16:46
阅读:197
评论:0
推荐:0
LLM · Agent | 记忆模块 + 交流模块,让 agent 合作完成复杂任务
MoonOut 2025-03-10 16:22
阅读:541
评论:0
推荐:0
LLM · RL | Plan4MC:使用有向无环图 high-level planning + 基于 RL 执行 low-level policy
MoonOut 2025-03-10 15:05
阅读:279
评论:0
推荐:0
LLM · Agent | 使用 LLM agent 玩各种游戏
MoonOut 2025-03-10 13:57
阅读:594
评论:0
推荐:0
公告