2024 年 4月 23 日随笔档案 - bonelee

2024年4月23日

摘要： ReAct论文解读：LLM ReAct范式，在大语言模型中结合推理和动作最近在研究如何让GPT正确做动作，比如搜索内容，发现了《SYNERGIZING REASONING AND ACTING IN LANGUAGE MODELS》这篇论文。作者提出了ReAct范式，通过将推理和动作相结合来克服L 阅读全文

posted @ 2024-04-23 17:45 bonelee 阅读(747) 评论(0) 推荐(0) 编辑

AI agent中的任务分解和调度-学术界文章汇总-【分而治之子任务分解、子任务独立智能体、强化学习、历史经验积累、自检可行性和错误反馈】

摘要： Reflexion: Language Agents withVerbal Reinforcement Learning 该文章的要点和关键技术，算法流程该文章提出了一种名为"Reflexion"的新型框架,用于通过语言反馈来强化语言智能体的学习。主要包含以下几个关键点: 框架组成: Actor模阅读全文

posted @ 2024-04-23 17:23 bonelee 阅读(482) 评论(0) 推荐(0) 编辑

ROUGE指标计算方法和示例

摘要： ROUGE（Recall-Oriented Understudy for Gisting Evaluation）指标是用于评估文本摘要质量的一种常用指标。它通过比较生成的摘要与参考摘要之间的重叠词语或短语来衡量它们之间的相似度。ROUGE指标通常包括多个子指标，如ROUGE-N（考虑n-gram重叠阅读全文

posted @ 2024-04-23 11:37 bonelee 阅读(3230) 评论(0) 推荐(0) 编辑

大模型评测指标汇总

摘要：大模型评估指标 1.基础评估指标参考klu.ai和Microsoft.com的评估指标列表如下：https://klu.ai/glossary/llm-evaluation 类别度量描述用户参与度和效用指标访问访问LLM应用程序功能的用户数提交提交提示词的用户数响应 LLM应用程序阅读全文

posted @ 2024-04-23 10:57 bonelee 阅读(7831) 评论(2) 推荐(1) 编辑

大语言模型（LLM）评价指标小汇总

摘要：大语言模型（LLM）评价指标小汇总（也许会更新） from：https://zhuanlan.zhihu.com/p/641416694 目录总之就是接了个小项目，这些天统计了一些LLM评价指标，不算很全面，很多方法的具体操作都不是很熟悉，参考论文也没找全，大家就凑合着看： 1. 榜单、论文统阅读全文

posted @ 2024-04-23 09:46 bonelee 阅读(1620) 评论(0) 推荐(0) 编辑

将者，智、信、仁、勇、严也。

Hi，我是李智华，华为-安全AI算法专家，欢迎来到安全攻防对抗的有趣世界。

公告