摘要: 解密prompt系列48. DeepSeek R1 & Kimi 1.5长思维链 - RL Scaling 春节前DeepSeek R1和Kimi1.5炸翻天了,之前大家推测的O1的实现路径,多数都集中在MCTS推理优化,以及STaR等样本自优化方案等等,结果DeepSeek和Kiim直接出手揭示了reasoning的新路线不一定在SFT和Inference Scaling,也可以在RL。也算是Post Train阶段新的Scaling方向,几个核心Take Away包括 阅读全文
posted @ 2025-02-14 20:35 风雨中的小七 阅读(442) 评论(0) 推荐(0) 编辑
摘要: 解密prompt系列47. O1 Long Thought的一些特征分析 O1之后,思维链的一个简单但之前都没进入视野的特征引起了大家的注意,那就是思考的长度对推理效果的影响,更准确来说是通过哪些思考步骤来有效延长思维长度对推理的影响。这一章我们着重讨论思考长度 阅读全文
posted @ 2025-01-22 07:41 风雨中的小七 阅读(175) 评论(0) 推荐(0) 编辑
摘要: 解密prompt系列46. LLM结构化输出代码示例和原理分析 这一章我们先结合demo看下开源和闭源对结构化输出的支持,随后会介绍Constrained Decoding和Format Restricting Instructions 两种结构化输出约束方案,最后会给出结构化输出对比自然语言输出的一些观点。 阅读全文
posted @ 2025-01-04 11:07 风雨中的小七 阅读(288) 评论(0) 推荐(1) 编辑
摘要: 解密Prompt45. 再探LLM Scalable Oversight -辩论、博弈哪家强 以上两个方向相对正交分别从Verifier和Generator两个方去尝试解决Scalable Oversight的问题,今天再聊一个相对Hybrid的方向,通过Verifier和Generator相互博弈来同时提升双方实力。这里分别介绍Anthropic的辩论法,和OpenAI的博弈法 阅读全文
posted @ 2024-12-30 08:31 风雨中的小七 阅读(201) 评论(0) 推荐(0) 编辑
摘要: 解密prompt系列44. RAG探索模式?深度思考模式? 前一阵多步RAG的风吹入了工业界,kimi推出了探索版本,各应用都推出了深度搜索,You.COM更是早就有了Genius的多步模式。其实都是类似multi-hop RAG的实现 阅读全文
posted @ 2024-12-14 09:04 风雨中的小七 阅读(295) 评论(0) 推荐(0) 编辑
摘要: 解密prompt系列43. LLM Self Critics 在模型持续提升的道路上,只提升Generator能力是不够的,需要同步提升Supervisor、Verifier的能力,才能提供有效的监督优化信号。人类提供的监督信号有几类,包括人工直接生成最优回答 阅读全文
posted @ 2024-11-25 08:07 风雨中的小七 阅读(238) 评论(0) 推荐(0) 编辑
摘要: 解密prompt系列42. LLM通往动态复杂思维链之路 想要更优的Inference Time Scaling曲线,前提是模型本身是一个很强的Generator,已经拥有足够的生成合理推理过程的能力,同时还拥有很强的Verifier模型来对推理节点进行打分决策,并且二者可以在少人类监督的条件下不断迭代优化。这一章我们先聊聊如何让大模型"自学"推理思考,从而得到思考推理能力更强的Generator。 阅读全文
posted @ 2024-11-15 07:49 风雨中的小七 阅读(499) 评论(0) 推荐(0) 编辑
摘要: 解密prompt系列41. GraphRAG真的是Silver Bullet? 这一章我们介绍GraphRAG范式,Graph RAG虽好但并非RAG的Silver Bullet,它有特定适合的问题和场景,更适合作为RAG中的一路召回,用来解决实体密集,依赖全局关系的信息召回。所以这一章我们来聊聊GraphRAG的实现和具体解决哪些问题。 阅读全文
posted @ 2024-10-27 18:49 风雨中的小七 阅读(380) 评论(0) 推荐(0) 编辑
摘要: 解密prompt系列40. LLM推理scaling Law OpenAI的O-1出现前,其实就有大佬开始分析后面OpenAI的技术路线,其中一个方向就是从Pretrain-scaling,Post-Train-scaling向Inference Scaling的转变,这一章我们挑3篇inference-scaling相关的论文来聊聊,前两篇分别从聚合策略和搜索策略来优化广度推理,最后一篇全面的分析了各类广度深度推理策略的最优使用方案。 阅读全文
posted @ 2024-10-11 21:10 风雨中的小七 阅读(522) 评论(0) 推荐(1) 编辑
摘要: 解密prompt系列39.  RAG之借助LLM优化精排环节 RAG这一章我们集中看下精排的部分。粗排和精排的主要差异其实在于效率和效果的balance。粗排和精排的主要差异其实在于效率和效果的balance。粗排模型复杂度更低,需要承上启下,用较低复杂度的模型 阅读全文
posted @ 2024-09-30 08:23 风雨中的小七 阅读(507) 评论(0) 推荐(3) 编辑
点击右上角即可分享
微信分享提示