DeepSeek使用教程
DeepSeek使用教程
建议
-
提示词的本质就是表达。
-
详情补充
- 在提问结尾加上:在回复前如果有任何问题都可以问我。
-
ds不需要提示词技巧。
-
必要背景信息
- 干什么
- 给谁干
- 要什么
- 不要什么
-
乔哈里视窗与AI沟通,组合人与AI是否知道来进行沟通
- 简单说
- 提问题
- 喂模式
- 开放聊
-
给模型目标,不需要指定思考步骤。(不需要微操)
-
万能提示模板:你是谁+(背景信息)+你的目标
-
不要定义过程
-
明确受众
- 说人话
- 我是小白,小学生等等
- 写给小白,高中生的演讲稿等等。
-
风格明确
- 用###的风格,写一篇演讲稿,要求###
-
联网搜索(时事类开启,不需要联网的不建议开启)
-
上下文记忆与清楚记忆
- 默认64k记忆长度,约3-4万字
- 输出长度4-8k,约2-4k中文字符。
- 开启新的会话,或者要求忽略之前所有的对话。
-
反馈与迭代优化
- 对回答进一步追问,优化。
- 辩证地思考、多角度考虑、从反面考虑
- 反复斟酌
-
复杂问题,分布拆解
-
避免超过200字的提示词,否则可能导致焦点偏移,有需要可以分布询问
-
避免复杂句式和模糊词语。
- 少出现不要###句式,增加理解成本
-
避免过度角色扮演,提示学科,不需要提示专家身份。
-
有用的不是提示词技巧,而是思考和表达。
-
优秀表现
- 数学
- 代码
- 写作&文案
- 文本摘要总结梗概
-
指定输出格式(如果有需要补充的信息,可以向我提问)
- 生成mermaid流程图
- 生成mermaid甘特图
- 以xmind可识别的markdown文本输出
- ppt(结合kimi的ppt工具(ppt助手))
- 生成10页雷军汽车发布会内容ppt,以文本形式给出ppt的详细内容。
- 如果生成的流程图语法有错,可以让deepseek检查并修改输出正常的流程图代码
-
简历生成和优化
-
模拟面试
- 结合相关技术栈向我提问
- 回答后评价回答如何,并给出建议或者答案。
- 继续提问。
- 针对这份简历的相关技术栈和项目内容,进行模拟面试,你作为一个java面试官向我提问,我面试的岗位是资深java工程师,在我回答后给出相应评价和建议,然后你再问下一个问题,可以开始了吗。
-
指令模型VS推理模型
部署
- 一百万token相当于70-80w的汉字
客户端调用api
- cherry studio
- deepseek github上有各种客户端推荐
第三方平台
本地部署
- 瓶颈:显存+内存
- 32B以下的都不能发挥R1特性
- ollama进行部署
- 使用cherry studio作为客户端与本地部署模型进行交互。
#70亿参数的下载命令:
ollama run deepseek-r1:7b
#下载后命令行打开:也是这个命令
ollama run deepseek-r1:7b
#可以使用ctrl+c中断下载,再执行命令就可以继续下载
#获取帮助
/?
#退出模型
/bye
#显示目前下载的模型列表
ollama list
服务器部署
- ollama下载r1满血模型,需要404GB硬盘大小。
- 与本地部署一样,下载ollama,下载对应模型,使用客户端访问。
创新
- 强化学习 RL
- 语言一致性奖励机制
- 监督微调 SFT
要点