随笔分类 - 大模型开发
摘要:目录深度学习的主要应用方向1️⃣ 计算机视觉(Computer Vision, CV)2️⃣ 语音处理(Speech AI)3️⃣ 多模态(Multimodal)4️⃣ 推荐系统5️⃣ 强化学习(RL)6️⃣ 科学与工业领域核心认知(重要) 是的,而且不止视觉处理。 你要区分清楚两个维度: 深度学习
阅读全文
摘要:目录先拆解这个岗位的核心要求,帮你看清「门槛在哪、你的优势在哪、补什么就行」关键结论:这个岗位的「门槛」是AI技术+短剧行业认知,而非「创作能力」,对你是低适配成本快速适配的3个核心动作(1-2周就能落地,能直接写进简历/面试展示)1. 选准多模态工具,深耕「技术落地」而非创作(不用全学,精2个就够
阅读全文
摘要:目录一、总体原则(先说清楚,避免踩雷)二、实验分层设计(这是关键)1️⃣ 实验单元2️⃣ 只做「单变量 + 小范围」实验❌ 不要这样✅ 正确方式(推荐顺序)三、具体 A/B 方案设计(可直接用)阶段 1:T_MIN 主锚点阈值实验实验桶设计核心假设阶段 2:K_MAX 语义发散实验阶段 3:T_MU
阅读全文
摘要:目录一、结论先行(非常重要)但它出现的原因,不是为了提升“整体准确率”,而是为了兜住 向量检索天然不擅长的那一类 query。二、你当前方案的能力边界这个架构非常合理,但它天然有 4 个盲区。三、向量检索的 4 类“硬伤场景”1️⃣ 精确词 / 结构化信息查询(ES 擅长)2️⃣ 否定 / 对比 /
阅读全文
摘要:目录一、先给你一个总判断(非常重要)二、持续提升准确度的 5 条“硬机制”1️⃣ 用「路由原因」反推哪里不准(最关键)你应该长期看什么?2️⃣ 只用 LLM 失败样本,反向喂给 MiniLM(闭环)闭环流程(强烈推荐)一、整体思路二、数据集结构(最标准的格式)1️⃣ 基本样式(JSON / CSV
阅读全文
摘要:目录一、Milvus 支持的 ANN 算法概览二、算法特点对比(工业级参考)三、选型参考四、Milvus ANN 使用流程简述五、总结一句话 明白,你想深入 Milvus 的ANN(Approximate Nearest Neighbor)算法实现细节。下面我帮你梳理得工业级完整、直接可落地理解:
阅读全文
摘要:目录 【结论】 高性能,语义不太复杂的场景 -选择MiniLM 6L/12L. 12L是12层的意思 中等性能,中等意义复杂度选择 - Sentence-BERT 语义很复杂:Qwen-embedding-large 或者 ext-embedding-3-large(效果更好,但是更贵) 向量化算法
阅读全文
摘要:目录一、补全后的完整伪代码(可直接工程化)二、这套规则“在系统里到底干了什么?”整体一句话决策流程图(文字版)每一步解决的“真实问题”三、关键变量定义 & 推荐取值(你可以直接写进配置)1️⃣ TOP_K2️⃣ T_MULTI(是否参与)3️⃣ T_MIN(是否可信)4️⃣ K_MAX(语义是否发散
阅读全文
摘要:目录1️⃣ 场景差异:去重 vs 意图缓存2️⃣ 为什么意图分类要求更高相似度3️⃣ 总结 你提到的这个差异非常典型,也是很多做 RAG + 意图分类缓存的人容易困惑的地方:为什么文档去重 / 聚类用 0.85~0.9 就够了,但意图分类缓存却要求 0.95~0.98?我们可以从本质原因来分析: 1
阅读全文
摘要:目录刚上线成熟业务增强方案 - 小模型改成 -- 2个小模型投票2个小模型投票 “‘通用大模型做冷启动’意思是:当新业务、长尾场景或数据缺乏时,我们用大模型对这些新 query 或文档进行自动标签或实体抽取,再经人工复核生成训练集,微调小模型上线。这样可以在最短时间内让小模型覆盖新业务,实现系统快速
阅读全文
摘要:目录什么是语义漂移一、场景概览二、原始情况(语义清晰)用户问题:知识库文档:Embedding 空间三、知识库扩展后(语义漂移开始)新增文档:发生的变化检索结果LLM 回答效果四、为什么叫“语义漂移”五、如何面试描述一、MiniLM 在标签化中的作用二、为什么不能完全替代人工或规则1. 语义模糊 /
阅读全文
摘要:目录识别具体方案一、总体设计原则(工程版)1️⃣ 不要“LLM 全吃”也不要“规则全吃”二、Intent:复杂 → LLM,简单 → 规则兜底Intent 的特点推荐方案具体落地三、Phase:规则优先,LLM 兜底(非常重要)Phase 的特点推荐方案(强烈)示例四、Objection:高价值、高
阅读全文
摘要:目录一句话结论(先给你定性)一、先把概念彻底拆清楚(避免混)二、Action 到底是什么?(这是关键)Action = 系统需要立即执行的操作类型三、Action 识别,用规则还是模型?——分层设计第一层:规则(Rule Engine)——必须要有典型规则 Action第二层:小模型分类(MiniL
阅读全文
摘要:目录一句话确认(可以当最终结论)一张心智模型(非常重要)三、为什么一定要这么设计(工程原因)1️⃣ 防止“SKU 反向主导话术”2️⃣ 模板数量被牢牢限制住3️⃣ 便于调销售“力度”四、那 SKU 标签到底干什么?(非常明确)SKU 标签示例(仍然是事实)五、一个完整最小例子(你现在这套的“黄金路径
阅读全文
摘要:目录Case 1:纯咨询 → 顺带销售(低干扰)对话触发结构映射系统行为示例响应逻辑Case 2:对比 + 犹豫 → 促成倾向对话触发结构映射系统行为示例响应逻辑Case 3:购买意图出现 → 推动成交对话触发结构映射系统行为示例响应逻辑Case 4:售后问题 → 保留复购机会对话触发结构映射系统行
阅读全文
摘要:目录Case 1:纯咨询 → 顺带销售(低干扰)对话触发结构映射系统行为示例响应逻辑一、设计思路二、把你的话拆成“真实运行链路”Step 1:输入Step 2:标签准备(不是实时生成)用户侧(极简)SKU 侧(离线配置)Step 3:标签匹配(规则,不是 LLM)Step 4:选择插槽(受控枚举)S
阅读全文
摘要:目录简单用户旅程设计(智能客服 + 销售能力)设计说明Agent架构设计智能客服 Agent 清单(新命名版)✅ 定位总结Objection阶段槽位选择和填充1️⃣ Objection 类型 → 模板映射2️⃣ Agent 流程3️⃣ 额外优化模版例子其他阶段的槽位模版映射1️⃣ Awareness
阅读全文
摘要:目录一、先给结论(你可以直接用)二、推荐 GPU 分层(按“生产可控性”排序)🥇 第一推荐:L40S(最适合你这个业务)为什么 L40S 是“智能销售系统”的甜点位🥈 第二推荐:A100 40GB(成熟但性价比下降)🥉 预算方案:RTX 4090(能跑,但要有心理预期)什么时候可以选 4090
阅读全文
摘要:目录一、先给结论:.cursorrules 应该“怎么来”二、.cursorrules 的定位(决定写法)三、生成 .cursorrules 的标准流程(推荐)Step 1:先明确 5 个必答问题Step 2:按“模块化规则块”组织(非常重要)Step 3:使用「命令式 + 否定式」❌ 不推荐(解释
阅读全文
摘要:目录主要的数据结构意图识别用户旅程phase说明一个售后案例贯穿intent和 phase等。Agent业务ActionFactAction实现 主要的数据结构 Intent 关注“用户心理/认知状态” Phase 关注“系统对话业务阶段” Flow 关注“具体业务流程步骤” User Journe
阅读全文

浙公网安备 33010602011771号