2024 年 6月随笔档案 - 第七子007

LLM大模型: RAG两大核心利器: M3E-embedding和bge-rerank

摘要：RAG的效果好不好，最核心依赖两点：文本embedding语义提取的好不好，rerank的排序效果好不好（包含正确答案的文本是不是排在前面）！各自使用的环节如下： 1、文本embedding的提取：理论上讲，任何transformer架构的encoder部分都可用于生成token的embedding 阅读全文

posted @ 2024-06-29 23:05 第七子007 阅读(8334) 评论(2) 推荐(1) 编辑

LLM大模型: 基于langchain+AutoGPT+向量数据库的Agent实现

摘要：钢铁侠都看过吧，男猪脚 tony 只需要语音说话给出指令，AI助手会完成所有的指令，期间完全不需要人干预了，全程自动化，看着是不是很科幻？很过瘾？现阶段，市面上所有的大模型核心功能还是问答，能准确回答用户的提问已经很不错了，那么问题来了：怎么根据用户的指令去干具体的活了？怎么判断任务已经完成了？阅读全文

posted @ 2024-06-26 23:38 第七子007 阅读(544) 评论(0) 推荐(0) 编辑

LLM大模型: RAG的langchain+向量数据库实现和评估方案

摘要：LLM大模型的核心功能之一就是聊天对话（信息检索），RAG的使用必不可少！大致的流程是：用户的query先转成embedding，去向量数据库查询最接近的top K回答；然后这query + top K的回答 + 其他context一起进入LLM，让LLM整合上述所有的信息后给出最终的回复！为了简阅读全文

posted @ 2024-06-23 12:19 第七子007 阅读(3212) 评论(2) 推荐(0) 编辑

LLM大模型: FlagEmbedding-BiEncoderModel源码解析和embedding模型评估及选择

摘要：NLP常见的任务之一是高效检索：在大规模语料库中快速检索与查询相关的段落或文档；用户输入query，要在语料库中找到语义最接近、最匹配的回答！此外，还有文本分类、情感分析等下游任务需要先把文本的embedding求出来，这些功能都能通过"双塔结构"（Bi-Encoder）实现！核心思路很简单：用两个阅读全文

posted @ 2024-06-19 18:19 第七子007 阅读(520) 评论(0) 推荐(0) 编辑

LLM大模型: RLHF-DPO原理和源码解析

摘要：1、前段时间国外某大学反向抄袭国内某团队的大模型闹得沸沸扬扬，国内被抄袭的大模型是MiniCPM，详细资料：https://github.com/OpenBMB/MiniCPM ；能被国外同行抄袭，必定有过人之处，粗略看了一下https://github.com/OpenBMB/MiniCPM/b 阅读全文

posted @ 2024-06-17 23:32 第七子007 阅读(1298) 评论(0) 推荐(0) 编辑

LLM大模型: MOE/mixtral原理和源码解析

摘要：1、古人云：闻道有先后，术业有专攻！每个人的能力范围是有限的，不可能360行，行行都精通！所以搞研究都会选一个细分领域深耕，争取在这个领域做到世界top级别的泰斗！一个团队，内部也都是在各个领域擅长的人组成，比如前端、ui、后端、算法、运维、运营等，大家互相配合，完成既定目标！本人多年前做传统的数据阅读全文

posted @ 2024-06-15 15:41 第七子007 阅读(827) 评论(0) 推荐(0) 编辑

LLM大模型: llama源码要点解读和调试（二）

摘要：1、attention机制：这算是transformer架构最大的创新点了！利用attention机制，找到token之间的相似度(或则说距离)，根据相似度调整token本身的embedding值，本质就是根据token的context调整自身的embedding值，这个思路非常符合人脑对语言和语义阅读全文

posted @ 2024-06-12 23:07 第七子007 阅读(1608) 评论(1) 推荐(0) 编辑

LLM大模型: llama源码要点解读（一）

摘要：transformer火了之后，基于transformer架构的llama也火了，可能的原因：来自meta，一线互联网大厂，质量有保证；自称70b参数的表现比chatGPT3还好（Llama 2:Open Foundation and Fine-Tuned Chat Models）！可能会成为大阅读全文

posted @ 2024-06-11 09:43 第七子007 阅读(2211) 评论(0) 推荐(0) 编辑

第七子007

06 2024 档案

公告

搜索

常用链接

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论