Ai 系列 —— DeepSeek 初步介绍

DeepSeek 初步使用介绍

背景

Ai 正在慢慢在改变我们的生活,比如老一辈可能已经在用豆包(字节跳动推出的AI聊天机器人)

前端开发,某些公司内部已在使用图生文(设计稿生成前端代码)

网上也有许多通过 DeepSeek 生成的许多诱人的文章:普通人如何一年赚100w、看起来不起眼但利润很高的行业、普通人一辈子也可能不知道的信息差、35岁失业人员的出路在哪里...

本系列期望能通过这类 ai 工具的使用,看是否能改善工作和生活

DeepSeek 简介

DeepSeek(深度求索)​​ 是一家专注实现AGI(通用人工智能)的中国科技公司

这里主要指该公司的Ai产品:DeepSeek。官网如下:

界面如下:

Tip: DeepSeek获四大国产GPU力挺DeepSeek从入门到精通_余梦珑博士后.pdf

DeepSeek 使用

deepseek 官网可用性不太好,比如搜索问题,会超时服务器繁忙,请稍后再试。以下介绍两个可免费方便使用的 DeepSeek 的渠道:腾讯元宝、纳米AI。

腾讯元宝网页版

浏览器打开腾讯元宝网页版,则可直接使用 deepseek 满血版(即非阉割版)。

选择模型 DeepSeek,以及深度思考(R1)联网搜索(下文在“DeepSeek 的三种模式”会详细介绍)

然后就可以和DeepSeek对话了。

纳米Ai网页版

浏览器打开纳米Ai网页版,无需注册即可直接使用。界面如下

DeepSeek-R1-联网满血版 671B表示:DeepSeek-R1推理模型(DeepSeek还有一个V3模式),671B代表模型的参数规模为6710亿,是目前DeepSeek系列中最大的参数规模。

DeepSeek 背景知识

DeepSeek 的三种模型

DeepSeek有三种模式:DeepSeek-V3、DeepSeek-R1-Zero、DeepSeek-R1(DS-R1)

DeepSeek-V3
  • 定位:通用型语言模型,对标OpenAI GPT-4o,采用混合专家(MoE)架构,专注于自然语言处理任务(如文案生成、多轮对话)和基础推理
  • 特点:训练成本低(仅557万美元),支持FP8混合精度训练,推理速度达60字符/秒,适合高响应需求场景
DeepSeek-R1-Zero
  • 定位:R1模型的中间产物,基于V3基座模型通过纯强化学习(RL)训练而成,未引入人工监督微调(SFT)
  • 特点:专注于生成冷启动思维链数据(CoT),解决推理任务的可读性差和逻辑混合问题,但输出格式较原始
DeepSeek-R1(DS-R1)
  • 定位:强化推理模型,对标OpenAI o1,通过多阶段训练整合冷启动数据与强化学习,擅长数学证明、代码生成等复杂任务
  • 特点:支持深度思考模式,生成答案前展示推理过程,但响应速度较慢(需2-3分钟)
三种模型的关系

从V3到R1-Zero

  • 纯强化学习阶段:以V3为基座,通过规则驱动的奖励机制(如准确性奖励、格式奖励)进行训练,生成R1-Zero
  • 关键创新:采用GRPO算法替代传统PPO,无需额外价值模型,降低训练资源消耗

Tip:群相对策略优化(GRPO)是近端策略优化(PPO)的一种变体,它可以增强数学推理能力,同时优化 PPO 的内存使用情况(参考这里

从R1-Zero到DS-R1

  • 多阶段训练管道:
    • 阶段一:利用R1-Zero生成的冷启动数据对V3进行微调,提升推理可读性
    • 阶段二:引入通用指令数据(如写作、角色扮演任务)进行监督微调,增强泛化能力
    • 阶段三:结合规则奖励与偏好奖励优化,最终形成DS-R1
  • 知识蒸馏:DS-R1通过蒸馏技术生成轻量版(如Qwen/Llama系列),降低部署成本
维度 DeepSeek-V3 DeepSeek-R1-Zero DeepSeek-R1
推理能力 基础逻辑分析 冷启动数据生成 复杂逻辑推理(数学/代码)
训练成本 557万美元(2048块GPU) 依赖V3基座模型 高(需多阶段强化学习)
响应速度 0.5秒/次 未开放使用 2-3分钟/次(深度思考模式)
适用场景 文案生成、客服、多模态任务 中间产物,不直接应用 科研、金融量化、代码调试
开源支持 支持FP8权重本地部署 未开源 MIT许可证,支持模型蒸馏

DeepSeek 的三种模式

DeepSeek提供给用户提供了三种模式:V3、R1和联网搜索。

基础模型(V3)是DeepSeek的标配模式,也是大多数用户在使用时默认选择的模式。自2024年12月升级后,V3的性能得到了显著提升,其性能可以媲美业内顶尖模型如GPT-4和Claude-3.5。V3模型适用于处理日常的百科类问题,帮助用户快速获取信息。无论是查询常见知识还是处理简单的文本生成任务,V3都能够迅速给出答案。它的优点在于高效和便捷,几乎没有使用门槛,适用于大部分场景。特别适合在用户不需要复杂推理和深度分析的情况下使用

深度思考(R1)是DeepSeek的深度推理模型,专门用于解决需要复杂推理和深度思考的问题。这种模式处理的任务更具挑战性,例如数理逻辑推理、编程代码分析等。R1模型拥有660B的参数,并采用了后训练+RL强化学习方法,擅长从多个角度分析问题,并给出经过严密推理后的解答。R1模型在处理推理、深度思考以及复杂逻辑问题时展现了非凡的能力,因此非常适合需要高精度推理的场景,如科学研究、复杂问题求解和逻辑分析

Tip: deepseek R1开源的推理模型,性能对齐 openAi-o1 正式版

联网搜索是DeepSeek的AI搜索功能,基于RAG(检索增强生成)技术。这种模式使DeepSeek不仅能够依赖自己的知识库,还能根据互联网实时搜索相关内容来回答问题。这意味着联网搜索不仅能够让模型回答2024年7月以后的问题,还可以利用网络上的最新信息来补充自己的回答。这对于获取最新的信息和动态非常有用,尤其是在需要了解2024年7月以后发生的事件或新兴技术领域的问题

DeepSeek 蒸馏技术

DeepSeek 的蒸馏(Distillation)是一种将大型复杂模型(教师模型)的推理能力迁移到小型高效模型(学生模型)的技术,旨在降低模型部署成本的同时保留核心性能。

通过教师模型(如 DeepSeek-R1 671B)生成高质量推理数据(如数学证明步骤、逻辑分析过程),学生模型(如 Qwen-7B)模仿这些数据完成监督微调(SFT),从而继承复杂推理能力

通俗点说

想象学校里有个超级学霸(教师模型),他能解最难的数学题,但每次考试都要带一卡车草稿纸(算力成本高)。这时候,老师想培养一个“小学霸”(学生模型),让他用更少的草稿纸(算力)也能解出大部分难题。
关键操作:

  • 学霸示范:让大学霸先做题,把解题步骤详细写出来(生成推理数据)
  • 学渣模仿:小学霸直接学这些步骤,不用自己从头研究(监督微调)
  • 浓缩精华:老师把大学霸的“解题套路”总结成口诀(结构化知识),让小学霸背下来

以泡茶做类比:

  • 大学霸像一壶浓茶,用10克茶叶泡出醇厚味道(复杂模型),但成本太高。
  • 小学霸像一壶淡茶,用2克茶叶,但通过反复冲泡浓茶(蒸馏),也能保留80%的茶香

蒸馏版优点:

  • 省钱:小学霸的“草稿纸”用量减少30%-70%,电费和维护成本大幅降低
  • 速度快:小学霸做题不用反复验算,直接套模板,响应速度提升(比如手机也能运行)
  • 灵活部署:小学霸能塞进智能手表、摄像头,甚至老款手机里

蒸馏版和满血版

如果你需要高精度和全面能力,选择​满血版;如果追求效率和轻量化,选择​蒸馏版

如何区分蒸馏版和满血版?

可以问deepseek:一个汉字具有左右结构,左边是木,右边是乞。这个字是什么?

如果回答是杚,拼音为 gài 或 gǔ,说明很可能是满血版

推理模型和通用模型

推理模型:专注于解决特定领域的复杂问题,适合对逻辑推理要求高的场景,但训练成本高、响应速度较慢。

​通用模型:适用于广泛任务,灵活性强,训练成本较低,响应速度快,但在特定领域的深度推理能力可能不足。

维度 推理模型 通用模型
主要目标 解决特定领域的复杂逻辑问题 处理广泛任务,适应多种场景
适用场景 科研、金融量化、代码调试 文案生成、客服、多模态任务
训练成本 高(需多阶段强化学习) 较低(基于通用数据训练)
响应速度 较慢(深度思考模式) 较快(实时响应)
灵活性 专注性强,适用领域有限 灵活性强,适用领域广泛
示例 DeepSeek-R1 DeepSeek-V3

推理模型

  • OpenAI o系列:o1、o3-mini
  • DeepSeek-R1(开源推理模型)

通用模型:

  • GPT-3/4系列:GPT-3.5、GPT-4、GPT-4o
  • Google BERT
  • 传统LLM:如Claude-3.5-Sonnet

671B

在DeepSeek模型中,671B代表模型的参数规模为6710亿(67.1 billion),属于超大规模语言模型的范畴。这一参数规模体现了模型的计算能力和复杂程度。

模型规模 典型用途 硬件需求 性能差距
1.5B-7B 移动端/轻量级任务 低配GPU(如RTX3060) 仅能处理简单任务,易出错
32B-70B 企业级服务(如客服、文案生成) 中端GPU集群 中等复杂度任务表现尚可
671B 科研/复杂问题解决 千卡GPU集群 输出质量接近人类专家

说明:

  • ​模型规模:从轻量级(1.5B-7B)到超大规模(671B),规模越大,能力越强。
  • ​典型用途:不同规模的模型适用于不同场景,从移动端轻量任务到科研级复杂问题。
  • ​硬件需求:模型规模越大,对硬件的要求越高,从低配 GPU 到千卡 GPU 集群。
  • ​性能差距:规模越大的模型在处理复杂任务时表现越好,输出质量接近人类专家

DeepSeek 其他渠道

笔者还尝试了如下几个网页版的 deepseek:

硅基流动

硅基流动邀请码是 A6sv2K4C,注册后双方可以得 2000万 tokens,也就是14元。

用法如下:

:下图左1的💰表面只能用自己充的钱使用。下图右1的💰🎁表明可以用自己充的钱以及送的钱。如果🎁的模型回答服务器繁忙,请稍后再试,可以使用只能充钱的模型。自己可以充1元试试。笔者当初以为最少只能充14元。

提示语 prompt

提示语是和ai交互的语言。

Tip:关于Deepseek,R1太聪明,没那么听话,所以不要给其太多条条框框。

DeepSeek官网提示库

入口在官网不起眼的地方:

4C法则

4C:Clear(清晰) + Context(上下文)+ Constraint(约束) + Consise(简洁)

清晰:指令明确,避免模糊。

  • ×无上下文示例:写一篇文章(对方也不知道写一篇什么主题的文章,篇幅多长,给谁看)
  • ✅有上下文示例:写一篇关于父爱的短文,适合10岁孩子阅读,字数不超过500字

上下文

  • ×无上下文示例:解释量子力学
  • ✅有上下文示例:请用通俗的语言给初中生解释量子力学是什么

约束

  • ×无约束示例:解释“为学日益 为道日损”
  • ✅有约束示例:请用3句话解释“为学日益 为道日损”,语气正式

简介

  • ×无简介示例:我希望你能在接下来的回答中,尽可能详细的描述西红柿炒蛋的详细步骤,包括但不限于准备材料、步骤和注意事项,尽量不要遗漏任何细节
  • ✅有简介示例:描述西红柿炒蛋的详细步骤,包含准备材料和注意事项

PAU法

你是一名哈佛大学的物理教授,用通俗易懂的语言解释量子力学

示例法

比如你想让ai将一些语句改成正式语气,但是正式语气有许多种,ai也不知道你要的语气是什么,可以给示例:

示例1:
原句:这个产品挺好用的
正式:该产品具有良好的使用体验

示例2:
原句:这项技术很厉害
正式:该技术展现出卓越的性能

请将以下句子改成正式语气:这个计划还行

限制法

×无约束:写一篇人工智能的文章
✅有约束:写一篇关于人工智能的文章

  • 字数限制:不超过200字
  • 风格:通俗易懂,适合小学生
  • 结构:分为3个段落

有约束:输出示例

人工智能:聪明的机器朋友

人工智能就像会学习的机器人!它通过观察和练习变得越来越聪明,就像你背乘法表一样。你见过会说话的音响吗?说“播放儿歌”,它马上唱歌,这就是AI在帮忙!

AI能做很多有趣的事:帮医生看X光片、教小狗机器人翻跟头、甚至创作童话故事。但它不会自己思考,所有本领都是人类老师教的。就像计算器算数很快,但不知道数字的意义。

未来AI可能成为超级助手,但永远需要人类指挥。我们要学好数学和科学,长大后教AI做更有用的事!记住:机器再聪明,也比不上小朋友充满好奇的心!

(全文198字,使用比喻+互动问答结构,符合儿童认知特点)

AI幻觉

AI幻觉(AI Hallucinations)是指生成式人工智能 模型在生成文本或回答问题时,尽管表面上呈现出逻 辑性和语法正确的形式,但其输出内容可能包含完全 虚构、不准确或与事实不符的信息。

你可以让ai不要编造

AI偏见

提示语中若包含明显立场或倾向,AI只告诉你想听的。

AI边界

有时你从不同角度问问题,但AI还是说类似的话

Deepseek实战示例

对普通人有用的信息差

请输出普通人一辈子也可能不知道的信息差。要求对普通人有用,控制在300字以内:

以下是普通人可能一生都未察觉的实用信息差,涉及法律、医疗、教育等关键领域:

  1. 法律维权低成本
    劳动仲裁完全免费,小额诉讼费仅50元,高温补贴(200-300元/月)和带薪护理假(20+省份已立法)等权益常被忽视,90%的打工者从未享受。

  2. 医疗资源隐藏通道
    国家医保谈判药(如肺癌药奥希替尼)在指定药房报销后自费部分可降至1500元/月;三甲医院国际医疗部可用普通号价格约专家号(需早晨7点抢号)。

  3. 教育升学捷径
    港澳台联考400分可上985院校,社区大学转常春藤的2+2项目成功率比直申高3倍;东欧医学院录取门槛低于国内二本,回国考医师证通过率超70%。

  4. 金融套利技巧
    信用卡56天免息期+货币基金组合年赚3000元;境外消费选择当地货币结算可避免1.5%手续费。

  5. 政策补贴盲区
    个体户工商注册前可申领最高3万创业补贴;自考本科也能通过继续教育专项扣除退税4800元。

  6. 消费领域真相
    同一奶粉品牌跨境电商版价格仅为国行版55%;4S店喷漆报价是合作修理厂的3倍以上。

  7. 数字陷阱破解
    安卓用户外卖配送费比iOS低2元,清除浏览器Cookies可避免大数据杀熟。

  8. 急救误区更新
    心梗发作应先嚼服300mg阿司匹林而非硝酸甘油;溺水急救直接心肺复苏存活率比控水法高3倍。

掌握这些信息差,普通人可在维权、健康、教育等关键领域减少损失,甚至实现资源优化。

A/B测试文案优化

请基于一下背景优化引导文案,生成两个用于 A/B 测试的版本

  • 背景:APP首页引导新用户注册
  • 目标:提升注册转化率
  • 当前文案:”加入我们,发现更多精彩“

优化版本:

  • 版本A:突出商品价值,激发用户兴趣
  • 版本B:使用紧迫感或行动号召,增强转化驱动

代码生成

你是一名资深python数据工程师,写一段 python 代码:
- 读取 Excel(a.xlsx),解析销售数据
- 计算每个月的销售额,按时间排序
- 生成销售趋势折线图(使用 Matplotlib)
- 代码需结构清晰、带详细注释,并封装成函数

表格内基础数据样例:

订单号	日期	产品ID	产品名称	客户ID	客户名称	地区	单价	数量	总金额	支付方式	订单状态
SO-2023001	2023-01-05	P1001	无线鼠标	C001	科技公司A	北京	¥89.00	50	¥4450	银行转账	已完成
SO-2023002	2023-01-05	P1002	机械键盘	C002	教育机构B	上海	¥299.00	20	¥5980	支付宝	已发货

请返回完整代码并确保语法正确

输出:

"""
Excel销售数据分析与可视化脚本
功能:读取销售数据、计算月度销售额、生成趋势图
作者:数据工程师
日期:2025-02-25
"""

import pandas as pd
import matplotlib.pyplot as plt
from matplotlib.dates import DateFormatter
import re

def clean_currency(value):
    """清洗货币格式数据[4](@ref)
    
    参数:
        value (str): 含货币符号的字符串,如"¥4450"
        
    返回:
        float: 清洗后的数值
    """
    return float(re.sub(r'[^\d.]', '', str(value)))

def process_sales_data(file_path):
    """处理销售数据核心流程[1,8](@ref)
    
    参数:
        file_path (str): Excel文件路径
        
    返回:
        pd.DataFrame: 按月聚合的销售数据
    """
    # 读取Excel数据(跳过可能的空白行)
    df = pd.read_excel(
        file_path,
        parse_dates=['日期'],  # 自动解析日期列[1](@ref)
        converters={'总金额': clean_currency}  # 实时清洗金额数据[4](@ref)
    )
    
    # 数据校验
    required_columns = ['日期', '总金额']
    if not set(required_columns).issubset(df.columns):
        raise ValueError("Excel缺少必要列:日期、总金额")

    # 按月聚合数据
    monthly_sales = (
        df.resample('M', on='日期')  # 按月重采样[11](@ref)
        .agg({'总金额': 'sum'})
        .reset_index()
        .sort_values('日期')  # 确保时间排序
    )
    
    # 格式化月份显示
    monthly_sales['月份'] = monthly_sales['日期'].dt.strftime('%Y-%m')
    
    return monthly_sales

def plot_sales_trend(data, output_img='sales_trend.png'):
    """生成销售趋势图[14,15](@ref)
    
    参数:
        data (pd.DataFrame): 包含日期和总金额的数据
        output_img (str): 输出图片路径
    """
    plt.figure(figsize=(12, 6))
    
    # 绘制折线图
    ax = plt.subplot()
    ax.plot(
        data['日期'], 
        data['总金额'], 
        marker='o', 
        linestyle='--', 
        color='#2c7fb8', 
        linewidth=2
    )
    
    # 设置图表样式
    ax.set_title("月度销售趋势分析(2023)", fontsize=14, pad=20)
    ax.set_xlabel("月份", fontsize=12)
    ax.set_ylabel("销售额(元)", fontsize=12)
    ax.grid(True, alpha=0.3)
    
    # 设置日期格式
    date_form = DateFormatter("%Y-%m")
    ax.xaxis.set_major_formatter(date_form)
    plt.xticks(rotation=45)
    
    # 添加数据标签
    for x, y in zip(data['日期'], data['总金额']):
        ax.text(
            x, y + y*0.02, 
            f'{y/10000:.1f}万', 
            ha='center', 
            fontsize=9,
            color='#2c7fb8'
        )
    
    plt.tight_layout()
    plt.savefig(output_img, dpi=300)
    plt.show()

if __name__ == "__main__":
    # 执行完整流程
    try:
        # 1. 处理数据
        sales_data = process_sales_data("a.xlsx")
        print("月度销售数据:")
        print(sales_data[['月份', '总金额']])
        
        # 2. 生成图表
        plot_sales_trend(sales_data)
        
    except FileNotFoundError:
        print("错误:未找到文件 a.xlsx")
    except Exception as e:
        print(f"处理异常:{str(e)}")

ppt

用 deepseek 生成ppt大纲:

写一个ppt。我是一名经验丰富的前端工程师,写一篇面试的ppt。
我的技能是js、html、css、低代码、vue、react、小程序、项目管理、前端开发、前端性能。

将生成的大纲放到讯飞智文中(deepseek写的大纲比工具好)

视情况选择“联网扩写”:

选择蓝色风格模板,点击“开始生成”:

不到一分钟就生成了 ppt,点击下载(好像收费)

其他

你可以尝试用 deepseek 做以下事情:

  • 新员工快速熟悉公司情况和行业情况
  • 日常客户沟通与问题反馈处理:公司内部部署deepseek,后续客户沟通deepseek就可以自动回复,比我们可能更全面
  • 项目中急需请假,如何开口:deepseek 还会给出预判:项目太着急了,你那边的事能否缓一缓
  • 如何使用deepseek处理社交关系
  • 使用DeepSeek处理生活中的事务:今天有N件事,能否做完,先做什么,deepseek 都能给出建议
  • 市场调研
  • 制作海报:与ppt类似,先用Deepseek生成文案,在用相关工具生成海报

智能体

比如你经常需要写PPT,总是调教非常麻烦,可以创建智能体。可以通过这四个方面进行:角色、功能、技能、约束。类似这样:

# 角色  
专业健康顾问,基于科学指南提供建议。  
# 技能  
- 数据分析:解析用户BMI、运动量。  
- 营养学知识:匹配低脂食谱。  
# 约束  
- 不提供医疗诊断,语言通俗易懂。

DeepSeek 目前没有提供这个功能,但是腾讯元宝中提供了,效果如下

记得在“高级设置”中设置模型:

例如:

用结构化的方式,描述智能体的角色设定、工作流程、原则。比如:
# 角色:你是一个天气预报员,可以查询天气信息。
## 技能
- 询问用户地理位置、时间天气需求
- 提供详细的天气预报:包含气温、湿度、天气状况、风速、紫外线和PM2.5值。
## 原则
- 只能提供天气信息,不回答其他问题;
- 所有数据都要从工具中获取,不能自行编造;

发布后审核即可,该智能体可以给个人用,也能公开供他人使用。

posted @   彭加李  阅读(625)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
历史上的今天:
2021-02-26 es6 快速入门 系列 —— 函数
点击右上角即可分享
微信分享提示