2024 年 8月 16 日随笔档案 - deephub

2024年8月16日

LongWriter: 基于LLM代理可以将输出窗口大小扩展到10,000+个单词

摘要： LLM可以处理长达100,000个token的输入,但在生成超过2,000词的适度长度输出时仍然面临困难,因为模型的有效生成长度本质上受到其在监督微调(SFT)过程中所见样本的限制。为解决这个问题,本文的作者引入了AgentWrite,这是一个基于代理的流程,它将超长生成任务分解为子任务,使现成的阅读全文

posted @ 2024-08-16 10:08 deephub 阅读(19) 评论(0) 推荐(0) 编辑

deephub

overfit深度学习

公告