DeepSeek 使用技巧
推理模型与指令模型
推理模型和指令模型是两类不同的人工智能模型,分别侧重于逻辑推理和任务执行。以下是它们的简单介绍:
1. 推理模型
- 目标:解决逻辑推理、数学计算或知识推断问题,输出确定性结论。
- 特点:
- 强调逻辑链推导,适合结构化问题(如数学题、物理公式推导)。
- 输出通常为数值、分类结果或明确的推理步骤。
- 典型应用:
- 数学解题(如AlphaGeometry解几何题)。
- 科学计算(如分子结构预测)。
- 逻辑推理(如定理证明)。
- 示例模型:
- AlphaGo:通过推理策略选择最佳下棋步骤。
- Lean:交互式定理证明器。
2. 指令模型
- 目标:理解并执行用户指令,生成符合要求的动态响应或操作。
- 特点:
- 依赖自然语言输入(如“写一首诗”“生成代码”)。
- 输出多样化(文本、代码、图像等),强调与用户意图对齐。
- 典型应用:
- 对话系统(如ChatGPT)。
- 编程辅助(如GitHub Copilot生成代码)。
- 内容创作(如生成文章、设计文案)。
- 示例模型:
- GPT-4:根据指令生成文本、代码等。
- Claude:通过自然语言指令完成复杂任务。
3. 核心区别
维度 | 推理模型 | 指令模型 |
---|---|---|
目标 | 解决逻辑问题,输出确定性结论。 | 执行用户指令,生成动态响应。 |
输入 | 结构化问题(如数学题)。 | 自然语言指令(如“写一首诗”)。 |
输出 | 数值、分类结果或推理步骤。 | 多样化内容(文本、代码、图像)。 |
典型应用 | 数学解题、科学计算。 | 对话系统、编程辅助、内容创作。 |
总结
- 推理模型:擅长逻辑推导,适合解决结构化问题。
- 指令模型:擅长任务执行,适合处理开放式指令。
两者常结合使用(如用指令模型接收问题,调用推理模型生成答案),以实现更强大的AI能力。
理解大语言模型的本质
特点1:大模型在训练时是将内容token 化的,大模型所看到的和理解的世界与你不一样
特点2: 大模型知识是存在截至时间的
特点3:大模型缺乏自我认知/自我意识
特点4:记忆有限(64k/128k)
如下上传一本红楼梦,DeepSeek 会通过RAG 方式去读取,但是不会读取红楼梦的所有内容
特点5:输出长度有限(4K/8K)
可以先让大模型列出提纲,然后再按提纲分别写作
有效的7大R1 使用技巧
技巧1:提出明确的要求
技巧2: 要求特定的风格
技巧3:提供处分的任务背景信息
技巧4:主动标注自己的知识状态
技巧5:定义目标,而非过程
技巧6:提供AI不具备的知识背景
技巧7:从开放到收敛
也就是关注R1的输出结果时的推理信息,其中可能会包含自己没有考虑到的内容,最好加入到prompt 中,不要让R1 去猜测
本文来自博客园,作者:chuangzhou,转载请注明原文链接:https://www.cnblogs.com/czzz/p/18697972
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 微软正式发布.NET 10 Preview 1:开启下一代开发框架新篇章
· 没有源码,如何修改代码逻辑?
· PowerShell开发游戏 · 打蜜蜂
· 在鹅厂做java开发是什么体验
· WPF到Web的无缝过渡:英雄联盟客户端的OpenSilver迁移实战