Ai 系列 —— DeepSeek 初步介绍
DeepSeek 初步使用介绍
背景
Ai 正在慢慢在改变我们的生活,比如老一辈可能已经在用豆包
(字节跳动推出的AI聊天机器人)
前端开发,某些公司内部已在使用图生文
(设计稿生成前端代码)
网上也有许多通过 DeepSeek
生成的许多诱人的文章:普通人如何一年赚100w、看起来不起眼但利润很高的行业、普通人一辈子也可能不知道的信息差、35岁失业人员的出路在哪里...
本系列期望能通过这类 ai 工具的使用,看是否能改善工作和生活
DeepSeek 简介
DeepSeek(深度求索) 是一家专注实现AGI(通用人工智能)的中国科技公司
这里主要指该公司的Ai产品:DeepSeek。官网如下:
界面如下:
Tip: DeepSeek获四大国产GPU力挺、DeepSeek从入门到精通_余梦珑博士后.pdf
DeepSeek 使用
deepseek 官网可用性不太好,比如搜索问题,会超时服务器繁忙,请稍后再试
。以下介绍两个可免费
、方便
使用的 DeepSeek 的渠道:腾讯元宝、纳米AI。
腾讯元宝网页版
浏览器打开腾讯元宝网页版,则可直接使用 deepseek 满血版(即非阉割版)。
选择模型 DeepSeek
,以及深度思考(R1)
、联网搜索
(下文在“DeepSeek 的三种模式”会详细介绍)
然后就可以和DeepSeek对话了。
纳米Ai网页版
浏览器打开纳米Ai网页版,无需注册即可直接使用。界面如下
DeepSeek-R1-联网满血版 671B
表示:DeepSeek-R1推理模型(DeepSeek还有一个V3
模式),671B代表模型的参数规模为6710亿,是目前DeepSeek系列中最大的参数规模。
DeepSeek 背景知识
DeepSeek 的三种模型
DeepSeek有三种模式:DeepSeek-V3、DeepSeek-R1-Zero、DeepSeek-R1(DS-R1)
DeepSeek-V3
- 定位:通用型语言模型,对标OpenAI GPT-4o,采用混合专家(MoE)架构,专注于自然语言处理任务(如文案生成、多轮对话)和基础推理
- 特点:训练成本低(仅557万美元),支持FP8混合精度训练,推理速度达60字符/秒,适合高响应需求场景
DeepSeek-R1-Zero
- 定位:R1模型的中间产物,基于V3基座模型通过纯强化学习(RL)训练而成,未引入人工监督微调(SFT)
- 特点:专注于生成冷启动思维链数据(CoT),解决推理任务的可读性差和逻辑混合问题,但输出格式较原始
DeepSeek-R1(DS-R1)
- 定位:强化推理模型,对标OpenAI o1,通过多阶段训练整合冷启动数据与强化学习,擅长数学证明、代码生成等复杂任务
- 特点:支持深度思考模式,生成答案前展示推理过程,但响应速度较慢(需2-3分钟)
三种模型的关系
从V3到R1-Zero
- 纯强化学习阶段:以V3为基座,通过规则驱动的奖励机制(如准确性奖励、格式奖励)进行训练,生成R1-Zero
- 关键创新:采用GRPO算法替代传统PPO,无需额外价值模型,降低训练资源消耗
Tip:群相对策略优化(GRPO)是近端策略优化(PPO)的一种变体,它可以增强数学推理能力,同时优化 PPO 的内存使用情况(参考这里)
从R1-Zero到DS-R1
- 多阶段训练管道:
- 阶段一:利用R1-Zero生成的冷启动数据对V3进行微调,提升推理可读性
- 阶段二:引入通用指令数据(如写作、角色扮演任务)进行监督微调,增强泛化能力
- 阶段三:结合规则奖励与偏好奖励优化,最终形成DS-R1
- 知识蒸馏:DS-R1通过蒸馏技术生成轻量版(如Qwen/Llama系列),降低部署成本
维度 | DeepSeek-V3 | DeepSeek-R1-Zero | DeepSeek-R1 |
---|---|---|---|
推理能力 | 基础逻辑分析 | 冷启动数据生成 | 复杂逻辑推理(数学/代码) |
训练成本 | 557万美元(2048块GPU) | 依赖V3基座模型 | 高(需多阶段强化学习) |
响应速度 | 0.5秒/次 | 未开放使用 | 2-3分钟/次(深度思考模式) |
适用场景 | 文案生成、客服、多模态任务 | 中间产物,不直接应用 | 科研、金融量化、代码调试 |
开源支持 | 支持FP8权重本地部署 | 未开源 | MIT许可证,支持模型蒸馏 |
DeepSeek 的三种模式
DeepSeek提供给用户提供了三种模式:V3、R1和联网搜索。
基础模型(V3
)是DeepSeek的标配模式,也是大多数用户在使用时默认选择的模式。自2024年12月升级后,V3的性能得到了显著提升,其性能可以媲美业内顶尖模型如GPT-4
和Claude-3.5。V3模型适用于处理日常的百科类问题,帮助用户快速获取信息。无论是查询常见知识还是处理简单的文本生成任务,V3都能够迅速给出答案。它的优点在于高效和便捷,几乎没有使用门槛,适用于大部分场景。特别适合在用户不需要复杂推理和深度分析的情况下使用
深度思考(R1
)是DeepSeek的深度推理模型,专门用于解决需要复杂推理和深度思考的问题。这种模式处理的任务更具挑战性,例如数理逻辑推理、编程代码分析等。R1模型拥有660B的参数,并采用了后训练+RL强化学习方法,擅长从多个角度分析问题,并给出经过严密推理后的解答。R1模型在处理推理、深度思考以及复杂逻辑问题时展现了非凡的能力,因此非常适合需要高精度推理的场景,如科学研究、复杂问题求解和逻辑分析
Tip: deepseek R1开源的推理模型,性能对齐 openAi-o1
正式版
联网搜索
是DeepSeek的AI搜索功能,基于RAG(检索增强生成)技术。这种模式使DeepSeek不仅能够依赖自己的知识库,还能根据互联网实时搜索相关内容来回答问题。这意味着联网搜索不仅能够让模型回答2024年7月以后的问题,还可以利用网络上的最新信息来补充自己的回答。这对于获取最新的信息和动态非常有用,尤其是在需要了解2024年7月以后发生的事件或新兴技术领域的问题
DeepSeek 蒸馏技术
DeepSeek 的蒸馏(Distillation)是一种将大型复杂模型(教师模型)的推理能力迁移到小型高效模型(学生模型)的技术,旨在降低模型部署成本的同时保留核心性能。
通过教师模型(如 DeepSeek-R1 671B)生成高质量推理数据(如数学证明步骤、逻辑分析过程),学生模型(如 Qwen-7B)模仿这些数据完成监督微调(SFT),从而继承复杂推理能力
通俗点说
想象学校里有个超级学霸(教师模型),他能解最难的数学题,但每次考试都要带一卡车草稿纸(算力成本高)。这时候,老师想培养一个“小学霸”(学生模型),让他用更少的草稿纸(算力)也能解出大部分难题。
关键操作:
- 学霸示范:让大学霸先做题,把解题步骤详细写出来(生成推理数据)
- 学渣模仿:小学霸直接学这些步骤,不用自己从头研究(监督微调)
- 浓缩精华:老师把大学霸的“解题套路”总结成口诀(结构化知识),让小学霸背下来
以泡茶做类比:
- 大学霸像一壶浓茶,用10克茶叶泡出醇厚味道(复杂模型),但成本太高。
- 小学霸像一壶淡茶,用2克茶叶,但通过反复冲泡浓茶(蒸馏),也能保留80%的茶香
蒸馏版优点:
- 省钱:小学霸的“草稿纸”用量减少30%-70%,电费和维护成本大幅降低
- 速度快:小学霸做题不用反复验算,直接套模板,响应速度提升(比如手机也能运行)
- 灵活部署:小学霸能塞进智能手表、摄像头,甚至老款手机里
蒸馏版和满血版
如果你需要高精度和全面能力,选择满血版
;如果追求效率和轻量化,选择蒸馏版
。
如何区分蒸馏版和满血版?
可以问deepseek:一个汉字具有左右结构,左边是木,右边是乞。这个字是什么?
如果回答是杚,拼音为 gài 或 gǔ
,说明很可能是满血版
推理模型和通用模型
推理模型:专注于解决特定领域的复杂问题,适合对逻辑推理要求高的场景,但训练成本高、响应速度较慢。
通用模型:适用于广泛任务,灵活性强,训练成本较低,响应速度快,但在特定领域的深度推理能力可能不足。
维度 | 推理模型 | 通用模型 |
---|---|---|
主要目标 | 解决特定领域的复杂逻辑问题 | 处理广泛任务,适应多种场景 |
适用场景 | 科研、金融量化、代码调试 | 文案生成、客服、多模态任务 |
训练成本 | 高(需多阶段强化学习) | 较低(基于通用数据训练) |
响应速度 | 较慢(深度思考模式) | 较快(实时响应) |
灵活性 | 专注性强,适用领域有限 | 灵活性强,适用领域广泛 |
示例 | DeepSeek-R1 | DeepSeek-V3 |
推理模型
- OpenAI o系列:
o1
、o3-mini DeepSeek-R1
(开源推理模型)
通用模型:
- GPT-3/4系列:GPT-3.5、
GPT-4
、GPT-4o - Google BERT
- 传统LLM:如Claude-3.5-Sonnet
671B
在DeepSeek模型中,671B代表模型的参数规模为6710亿(67.1 billion),属于超大规模语言模型的范畴。这一参数规模体现了模型的计算能力和复杂程度。
模型规模 | 典型用途 | 硬件需求 | 性能差距 |
---|---|---|---|
1.5B-7B | 移动端/轻量级任务 | 低配GPU(如RTX3060) | 仅能处理简单任务,易出错 |
32B-70B | 企业级服务(如客服、文案生成) | 中端GPU集群 | 中等复杂度任务表现尚可 |
671B | 科研/复杂问题解决 | 千卡GPU集群 | 输出质量接近人类专家 |
说明:
- 模型规模:从轻量级(1.5B-7B)到超大规模(671B),规模越大,能力越强。
- 典型用途:不同规模的模型适用于不同场景,从移动端轻量任务到科研级复杂问题。
- 硬件需求:模型规模越大,对硬件的要求越高,从低配 GPU 到千卡 GPU 集群。
- 性能差距:规模越大的模型在处理复杂任务时表现越好,输出质量接近
人类专家
。
DeepSeek 其他渠道
笔者还尝试了如下几个网页版的 deepseek:
硅基流动
硅基流动邀请码是 A6sv2K4C
,注册后双方可以得 2000万 tokens,也就是14元。
用法如下:
注
:下图左1的💰表面只能用自己充的钱使用。下图右1的💰🎁表明可以用自己充的钱以及送的钱。如果🎁的模型回答服务器繁忙,请稍后再试
,可以使用只能充钱的模型。自己可以充1元试试。笔者当初以为最少只能充14元。
提示语 prompt
提示语是和ai交互的语言。
Tip:关于Deepseek,R1太聪明,没那么听话,所以不要给其太多条条框框。
DeepSeek官网提示库
入口在官网不起眼的地方:
4C法则
4C:Clear(清晰) + Context(上下文)+ Constraint(约束) + Consise(简洁)
清晰
:指令明确,避免模糊。
- ×无上下文示例:写一篇文章(对方也不知道写一篇什么主题的文章,篇幅多长,给谁看)
- ✅有上下文示例:写一篇关于父爱的短文,适合10岁孩子阅读,字数不超过500字
上下文
- ×无上下文示例:解释量子力学
- ✅有上下文示例:请用通俗的语言给初中生解释量子力学是什么
约束
- ×无约束示例:解释“为学日益 为道日损”
- ✅有约束示例:请用3句话解释“为学日益 为道日损”,语气正式
简介
- ×无简介示例:我希望你能在接下来的回答中,尽可能详细的描述西红柿炒蛋的详细步骤,包括但不限于准备材料、步骤和注意事项,尽量不要遗漏任何细节
- ✅有简介示例:描述西红柿炒蛋的详细步骤,包含准备材料和注意事项
PAU法
你是一名哈佛大学的物理教授,用通俗易懂的语言解释量子力学
示例法
比如你想让ai将一些语句改成正式语气,但是正式语气有许多种,ai也不知道你要的语气是什么,可以给示例:
示例1:
原句:这个产品挺好用的
正式:该产品具有良好的使用体验
示例2:
原句:这项技术很厉害
正式:该技术展现出卓越的性能
请将以下句子改成正式语气:这个计划还行
限制法
×无约束:写一篇人工智能的文章
✅有约束:写一篇关于人工智能的文章
- 字数限制:不超过200字
- 风格:通俗易懂,适合小学生
- 结构:分为3个段落
有约束:输出示例
人工智能:聪明的机器朋友
人工智能就像会学习的机器人!它通过观察和练习变得越来越聪明,就像你背乘法表一样。你见过会说话的音响吗?说“播放儿歌”,它马上唱歌,这就是AI在帮忙!
AI能做很多有趣的事:帮医生看X光片、教小狗机器人翻跟头、甚至创作童话故事。但它不会自己思考,所有本领都是人类老师教的。就像计算器算数很快,但不知道数字的意义。
未来AI可能成为超级助手,但永远需要人类指挥。我们要学好数学和科学,长大后教AI做更有用的事!记住:机器再聪明,也比不上小朋友充满好奇的心!
(全文198字,使用比喻+互动问答结构,符合儿童认知特点)
AI幻觉
AI幻觉(AI Hallucinations)是指生成式人工智能 模型在生成文本或回答问题时,尽管表面上呈现出逻 辑性和语法正确的形式,但其输出内容可能包含完全 虚构、不准确或与事实不符的信息。
你可以让ai不要编造
AI偏见
提示语中若包含明显立场或倾向,AI只告诉你想听的。
AI边界
有时你从不同角度问问题,但AI还是说类似的话
Deepseek实战示例
对普通人有用的信息差
请输出普通人一辈子也可能不知道的信息差。要求对普通人有用,控制在300字以内:
以下是普通人可能一生都未察觉的实用信息差,涉及法律、医疗、教育等关键领域:
-
法律维权低成本
劳动仲裁完全免费,小额诉讼费仅50元,高温补贴(200-300元/月)和带薪护理假(20+省份已立法)等权益常被忽视,90%的打工者从未享受。 -
医疗资源隐藏通道
国家医保谈判药(如肺癌药奥希替尼)在指定药房报销后自费部分可降至1500元/月;三甲医院国际医疗部可用普通号价格约专家号(需早晨7点抢号)。 -
教育升学捷径
港澳台联考400分可上985院校,社区大学转常春藤的2+2项目成功率比直申高3倍;东欧医学院录取门槛低于国内二本,回国考医师证通过率超70%。 -
金融套利技巧
信用卡56天免息期+货币基金组合年赚3000元;境外消费选择当地货币结算可避免1.5%手续费。 -
政策补贴盲区
个体户工商注册前可申领最高3万创业补贴;自考本科也能通过继续教育专项扣除退税4800元。 -
消费领域真相
同一奶粉品牌跨境电商版价格仅为国行版55%;4S店喷漆报价是合作修理厂的3倍以上。 -
数字陷阱破解
安卓用户外卖配送费比iOS低2元,清除浏览器Cookies可避免大数据杀熟。 -
急救误区更新
心梗发作应先嚼服300mg阿司匹林而非硝酸甘油;溺水急救直接心肺复苏存活率比控水法高3倍。
掌握这些信息差,普通人可在维权、健康、教育等关键领域减少损失,甚至实现资源优化。
A/B测试文案优化
请基于一下背景优化引导文案,生成两个用于 A/B 测试的版本
- 背景:APP首页引导新用户注册
- 目标:提升注册转化率
- 当前文案:”加入我们,发现更多精彩“
优化版本:
- 版本A:突出商品价值,激发用户兴趣
- 版本B:使用紧迫感或行动号召,增强转化驱动
代码生成
你是一名资深python数据工程师,写一段 python 代码:
- 读取 Excel(a.xlsx),解析销售数据
- 计算每个月的销售额,按时间排序
- 生成销售趋势折线图(使用 Matplotlib)
- 代码需结构清晰、带详细注释,并封装成函数
表格内基础数据样例:
订单号 日期 产品ID 产品名称 客户ID 客户名称 地区 单价 数量 总金额 支付方式 订单状态
SO-2023001 2023-01-05 P1001 无线鼠标 C001 科技公司A 北京 ¥89.00 50 ¥4450 银行转账 已完成
SO-2023002 2023-01-05 P1002 机械键盘 C002 教育机构B 上海 ¥299.00 20 ¥5980 支付宝 已发货
请返回完整代码并确保语法正确
输出:
"""
Excel销售数据分析与可视化脚本
功能:读取销售数据、计算月度销售额、生成趋势图
作者:数据工程师
日期:2025-02-25
"""
import pandas as pd
import matplotlib.pyplot as plt
from matplotlib.dates import DateFormatter
import re
def clean_currency(value):
"""清洗货币格式数据[4](@ref)
参数:
value (str): 含货币符号的字符串,如"¥4450"
返回:
float: 清洗后的数值
"""
return float(re.sub(r'[^\d.]', '', str(value)))
def process_sales_data(file_path):
"""处理销售数据核心流程[1,8](@ref)
参数:
file_path (str): Excel文件路径
返回:
pd.DataFrame: 按月聚合的销售数据
"""
# 读取Excel数据(跳过可能的空白行)
df = pd.read_excel(
file_path,
parse_dates=['日期'], # 自动解析日期列[1](@ref)
converters={'总金额': clean_currency} # 实时清洗金额数据[4](@ref)
)
# 数据校验
required_columns = ['日期', '总金额']
if not set(required_columns).issubset(df.columns):
raise ValueError("Excel缺少必要列:日期、总金额")
# 按月聚合数据
monthly_sales = (
df.resample('M', on='日期') # 按月重采样[11](@ref)
.agg({'总金额': 'sum'})
.reset_index()
.sort_values('日期') # 确保时间排序
)
# 格式化月份显示
monthly_sales['月份'] = monthly_sales['日期'].dt.strftime('%Y-%m')
return monthly_sales
def plot_sales_trend(data, output_img='sales_trend.png'):
"""生成销售趋势图[14,15](@ref)
参数:
data (pd.DataFrame): 包含日期和总金额的数据
output_img (str): 输出图片路径
"""
plt.figure(figsize=(12, 6))
# 绘制折线图
ax = plt.subplot()
ax.plot(
data['日期'],
data['总金额'],
marker='o',
linestyle='--',
color='#2c7fb8',
linewidth=2
)
# 设置图表样式
ax.set_title("月度销售趋势分析(2023)", fontsize=14, pad=20)
ax.set_xlabel("月份", fontsize=12)
ax.set_ylabel("销售额(元)", fontsize=12)
ax.grid(True, alpha=0.3)
# 设置日期格式
date_form = DateFormatter("%Y-%m")
ax.xaxis.set_major_formatter(date_form)
plt.xticks(rotation=45)
# 添加数据标签
for x, y in zip(data['日期'], data['总金额']):
ax.text(
x, y + y*0.02,
f'{y/10000:.1f}万',
ha='center',
fontsize=9,
color='#2c7fb8'
)
plt.tight_layout()
plt.savefig(output_img, dpi=300)
plt.show()
if __name__ == "__main__":
# 执行完整流程
try:
# 1. 处理数据
sales_data = process_sales_data("a.xlsx")
print("月度销售数据:")
print(sales_data[['月份', '总金额']])
# 2. 生成图表
plot_sales_trend(sales_data)
except FileNotFoundError:
print("错误:未找到文件 a.xlsx")
except Exception as e:
print(f"处理异常:{str(e)}")
ppt
用 deepseek 生成ppt大纲:
写一个ppt。我是一名经验丰富的前端工程师,写一篇面试的ppt。
我的技能是js、html、css、低代码、vue、react、小程序、项目管理、前端开发、前端性能。
将生成的大纲放到讯飞智文中(deepseek写的大纲比工具好)
视情况选择“联网扩写”:
选择蓝色风格模板,点击“开始生成”:
不到一分钟就生成了 ppt,点击下载(好像收费)
其他
你可以尝试用 deepseek 做以下事情:
- 新员工快速熟悉公司情况和行业情况
- 日常客户沟通与问题反馈处理:公司内部部署deepseek,后续客户沟通deepseek就可以自动回复,比我们可能更全面
- 项目中急需请假,如何开口:deepseek 还会给出预判:项目太着急了,你那边的事能否缓一缓
- 如何使用deepseek处理社交关系
- 使用DeepSeek处理生活中的事务:今天有N件事,能否做完,先做什么,deepseek 都能给出建议
- 市场调研
- 制作海报:与ppt类似,先用Deepseek生成文案,在用相关工具生成海报
智能体
比如你经常需要写PPT,总是调教非常麻烦,可以创建智能体
。可以通过这四个方面进行:角色、功能、技能、约束。类似这样:
# 角色
专业健康顾问,基于科学指南提供建议。
# 技能
- 数据分析:解析用户BMI、运动量。
- 营养学知识:匹配低脂食谱。
# 约束
- 不提供医疗诊断,语言通俗易懂。
DeepSeek 目前没有提供这个功能,但是腾讯元宝
中提供了,效果如下
记得在“高级设置”中设置模型:
例如:
用结构化的方式,描述智能体的角色设定、工作流程、原则。比如:
# 角色:你是一个天气预报员,可以查询天气信息。
## 技能
- 询问用户地理位置、时间天气需求
- 提供详细的天气预报:包含气温、湿度、天气状况、风速、紫外线和PM2.5值。
## 原则
- 只能提供天气信息,不回答其他问题;
- 所有数据都要从工具中获取,不能自行编造;
发布后审核即可,该智能体可以给个人用,也能公开供他人使用。
出处:https://www.cnblogs.com/pengjiali/p/18737350
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
2021-02-26 es6 快速入门 系列 —— 函数