01 2024 档案

摘要：

此文是本qiang~针对大语言模型的DPO算法的整理，包括原理、流程及部分源码。阅读全文

posted @ 2024-01-31 12:37 mengrennwpu 阅读(3436) 评论(1) 推荐(0) 编辑

摘要：

1. 背景本qiang~这段时间调研了LLM上下文扩展的问题，并且实打实的运行了几个开源的项目，所谓实践与理论相结合嘛！此文是本qiang~针对上下文扩展问题的总结，包括解决方案的整理概括，文中参考了多篇有意义的文章，他山之石可以攻玉。大语言模型的扩展有诸多意义，如进行更长的会话、总结更长的文阅读全文

posted @ 2024-01-22 13:48 mengrennwpu 阅读(1086) 评论(0) 推荐(1) 编辑

mengrennwpu

好学求知，稳健中流

01 2024 档案

公告