DeepSeek 使用技巧

推理模型与指令模型
理解大语言模型的本质
有效的7大R1 使用技巧

推理模型与指令模型

推理模型和指令模型是两类不同的人工智能模型，分别侧重于逻辑推理和任务执行。以下是它们的简单介绍：

1. 推理模型

目标：解决逻辑推理、数学计算或知识推断问题，输出确定性结论。
特点：
- 强调逻辑链推导，适合结构化问题（如数学题、物理公式推导）。
- 输出通常为数值、分类结果或明确的推理步骤。
典型应用：
- 数学解题（如AlphaGeometry解几何题）。
- 科学计算（如分子结构预测）。
- 逻辑推理（如定理证明）。
示例模型：
- AlphaGo：通过推理策略选择最佳下棋步骤。
- Lean：交互式定理证明器。

2. 指令模型

目标：理解并执行用户指令，生成符合要求的动态响应或操作。
特点：
- 依赖自然语言输入（如“写一首诗”“生成代码”）。
- 输出多样化（文本、代码、图像等），强调与用户意图对齐。
典型应用：
- 对话系统（如ChatGPT）。
- 编程辅助（如GitHub Copilot生成代码）。
- 内容创作（如生成文章、设计文案）。
示例模型：
- GPT-4：根据指令生成文本、代码等。
- Claude：通过自然语言指令完成复杂任务。

3. 核心区别

维度	推理模型	指令模型
目标	解决逻辑问题，输出确定性结论。	执行用户指令，生成动态响应。
输入	结构化问题（如数学题）。	自然语言指令（如“写一首诗”）。
输出	数值、分类结果或推理步骤。	多样化内容（文本、代码、图像）。
典型应用	数学解题、科学计算。	对话系统、编程辅助、内容创作。

总结

推理模型：擅长逻辑推导，适合解决结构化问题。
指令模型：擅长任务执行，适合处理开放式指令。
两者常结合使用（如用指令模型接收问题，调用推理模型生成答案），以实现更强大的AI能力。

理解大语言模型的本质

特点1：大模型在训练时是将内容token 化的，大模型所看到的和理解的世界与你不一样

特点2：大模型知识是存在截至时间的

特点3：大模型缺乏自我认知/自我意识

特点4：记忆有限(64k/128k)

如下上传一本红楼梦，DeepSeek 会通过RAG 方式去读取，但是不会读取红楼梦的所有内容

特点5：输出长度有限(4K/8K)

可以先让大模型列出提纲，然后再按提纲分别写作

有效的7大R1 使用技巧

技巧1：提出明确的要求

技巧2: 要求特定的风格

技巧3：提供处分的任务背景信息

技巧4：主动标注自己的知识状态

技巧5：定义目标，而非过程

技巧6：提供AI不具备的知识背景

技巧7：从开放到收敛

也就是关注R1的输出结果时的推理信息，其中可能会包含自己没有考虑到的内容，最好加入到prompt 中，不要让R1 去猜测

posted @ 2025-02-04 09:27 chuangzhou 阅读(937) 评论(0) 收藏举报

刷新页面返回顶部