会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
mengrennwpu
好学求知,稳健中流
博客园
首页
新随笔
联系
管理
订阅
01 2024 档案
LLM面面观之RLHF平替算法DPO
摘要:
此文是本qiang~针对大语言模型的DPO算法的整理,包括原理、流程及部分源码。
阅读全文
posted @
2024-01-31 12:37
mengrennwpu
阅读(3436)
评论(1)
推荐(0)
编辑
LLM面面观之LLM上下文扩展方案
摘要:
1. 背景 本qiang~这段时间调研了LLM上下文扩展的问题,并且实打实的运行了几个开源的项目,所谓实践与理论相结合嘛! 此文是本qiang~针对上下文扩展问题的总结,包括解决方案的整理概括,文中参考了多篇有意义的文章,他山之石可以攻玉。 大语言模型的扩展有诸多意义,如进行更长的会话、总结更长的文
阅读全文
posted @
2024-01-22 13:48
mengrennwpu
阅读(1086)
评论(0)
推荐(1)
编辑
公告