DeepSeek 使用技巧

推理模型与指令模型

推理模型指令模型是两类不同的人工智能模型,分别侧重于逻辑推理任务执行。以下是它们的简单介绍:


1. 推理模型

  • 目标:解决逻辑推理、数学计算或知识推断问题,输出确定性结论。
  • 特点
    • 强调逻辑链推导,适合结构化问题(如数学题、物理公式推导)。
    • 输出通常为数值、分类结果或明确的推理步骤。
  • 典型应用
    • 数学解题(如AlphaGeometry解几何题)。
    • 科学计算(如分子结构预测)。
    • 逻辑推理(如定理证明)。
  • 示例模型
    • AlphaGo:通过推理策略选择最佳下棋步骤。
    • Lean:交互式定理证明器。

2. 指令模型

  • 目标:理解并执行用户指令,生成符合要求的动态响应或操作。
  • 特点
    • 依赖自然语言输入(如“写一首诗”“生成代码”)。
    • 输出多样化(文本、代码、图像等),强调与用户意图对齐。
  • 典型应用
    • 对话系统(如ChatGPT)。
    • 编程辅助(如GitHub Copilot生成代码)。
    • 内容创作(如生成文章、设计文案)。
  • 示例模型
    • GPT-4:根据指令生成文本、代码等。
    • Claude:通过自然语言指令完成复杂任务。

3. 核心区别

维度 推理模型 指令模型
目标 解决逻辑问题,输出确定性结论。 执行用户指令,生成动态响应。
输入 结构化问题(如数学题)。 自然语言指令(如“写一首诗”)。
输出 数值、分类结果或推理步骤。 多样化内容(文本、代码、图像)。
典型应用 数学解题、科学计算。 对话系统、编程辅助、内容创作。

总结

  • 推理模型:擅长逻辑推导,适合解决结构化问题。
  • 指令模型:擅长任务执行,适合处理开放式指令。
    两者常结合使用(如用指令模型接收问题,调用推理模型生成答案),以实现更强大的AI能力。

理解大语言模型的本质

特点1:大模型在训练时是将内容token 化的,大模型所看到的和理解的世界与你不一样

特点2: 大模型知识是存在截至时间的

特点3:大模型缺乏自我认知/自我意识

特点4:记忆有限(64k/128k)

如下上传一本红楼梦,DeepSeek 会通过RAG 方式去读取,但是不会读取红楼梦的所有内容

特点5:输出长度有限(4K/8K)

可以先让大模型列出提纲,然后再按提纲分别写作

有效的7大R1 使用技巧

技巧1:提出明确的要求

技巧2: 要求特定的风格

技巧3:提供处分的任务背景信息

技巧4:主动标注自己的知识状态

技巧5:定义目标,而非过程

技巧6:提供AI不具备的知识背景

技巧7:从开放到收敛

也就是关注R1的输出结果时的推理信息,其中可能会包含自己没有考虑到的内容,最好加入到prompt 中,不要让R1 去猜测

posted @   chuangzhou  阅读(632)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 微软正式发布.NET 10 Preview 1:开启下一代开发框架新篇章
· 没有源码,如何修改代码逻辑?
· PowerShell开发游戏 · 打蜜蜂
· 在鹅厂做java开发是什么体验
· WPF到Web的无缝过渡:英雄联盟客户端的OpenSilver迁移实战
点击右上角即可分享
微信分享提示