Ai 系列 —— DeepSeek 初步介绍

DeepSeek 初步使用介绍

背景

Ai 正在慢慢在改变我们的生活，比如老一辈可能已经在用豆包(字节跳动推出的AI聊天机器人)

前端开发，某些公司内部已在使用图生文（设计稿生成前端代码）

网上也有许多通过 DeepSeek 生成的许多诱人的文章：普通人如何一年赚100w、看起来不起眼但利润很高的行业、普通人一辈子也可能不知道的信息差、35岁失业人员的出路在哪里...

本系列期望能通过这类 ai 工具的使用，看是否能改善工作和生活

DeepSeek 简介

DeepSeek（深度求索）是一家专注实现AGI（通用人工智能）的中国科技公司

这里主要指该公司的Ai产品：DeepSeek。官网如下：

界面如下：

Tip: DeepSeek获四大国产GPU力挺、DeepSeek从入门到精通_余梦珑博士后.pdf

DeepSeek 使用

deepseek 官网可用性不太好，比如搜索问题，会超时服务器繁忙，请稍后再试。以下介绍两个可免费、方便使用的 DeepSeek 的渠道：腾讯元宝、纳米AI。

腾讯元宝网页版

浏览器打开腾讯元宝网页版，则可直接使用 deepseek 满血版(即非阉割版)。

选择模型 DeepSeek，以及深度思考（R1）、联网搜索（下文在“DeepSeek 的三种模式”会详细介绍）

然后就可以和DeepSeek对话了。

纳米Ai网页版

浏览器打开纳米Ai网页版，无需注册即可直接使用。界面如下

DeepSeek-R1-联网满血版 671B表示：DeepSeek-R1推理模型（DeepSeek还有一个V3模式），671B代表模型的参数规模为6710亿，是目前DeepSeek系列中最大的参数规模。

DeepSeek 背景知识

DeepSeek 的三种模型

DeepSeek有三种模式：DeepSeek-V3、DeepSeek-R1-Zero、DeepSeek-R1（DS-R1）

DeepSeek-V3

定位：通用型语言模型，对标OpenAI GPT-4o，采用混合专家（MoE）架构，专注于自然语言处理任务（如文案生成、多轮对话）和基础推理
特点：训练成本低（仅557万美元），支持FP8混合精度训练，推理速度达60字符/秒，适合高响应需求场景

DeepSeek-R1-Zero

定位：R1模型的中间产物，基于V3基座模型通过纯强化学习（RL）训练而成，未引入人工监督微调（SFT）
特点：专注于生成冷启动思维链数据（CoT），解决推理任务的可读性差和逻辑混合问题，但输出格式较原始

DeepSeek-R1（DS-R1）

定位：强化推理模型，对标OpenAI o1，通过多阶段训练整合冷启动数据与强化学习，擅长数学证明、代码生成等复杂任务
特点：支持深度思考模式，生成答案前展示推理过程，但响应速度较慢（需2-3分钟）

三种模型的关系

从V3到R1-Zero

纯强化学习阶段：以V3为基座，通过规则驱动的奖励机制（如准确性奖励、格式奖励）进行训练，生成R1-Zero
关键创新：采用GRPO算法替代传统PPO，无需额外价值模型，降低训练资源消耗

Tip：群相对策略优化（GRPO）是近端策略优化（PPO）的一种变体，它可以增强数学推理能力，同时优化 PPO 的内存使用情况（参考这里）

从R1-Zero到DS-R1

多阶段训练管道：
- 阶段一：利用R1-Zero生成的冷启动数据对V3进行微调，提升推理可读性
- 阶段二：引入通用指令数据（如写作、角色扮演任务）进行监督微调，增强泛化能力
- 阶段三：结合规则奖励与偏好奖励优化，最终形成DS-R1
知识蒸馏：DS-R1通过蒸馏技术生成轻量版（如Qwen/Llama系列），降低部署成本

维度	DeepSeek-V3	DeepSeek-R1-Zero	DeepSeek-R1
推理能力	基础逻辑分析	冷启动数据生成	复杂逻辑推理（数学/代码）
训练成本	557万美元（2048块GPU）	依赖V3基座模型	高（需多阶段强化学习）
响应速度	0.5秒/次	未开放使用	2-3分钟/次（深度思考模式）
适用场景	文案生成、客服、多模态任务	中间产物，不直接应用	科研、金融量化、代码调试
开源支持	支持FP8权重本地部署	未开源	MIT许可证，支持模型蒸馏

DeepSeek 的三种模式

DeepSeek提供给用户提供了三种模式：V3、R1和联网搜索。

基础模型（V3）是DeepSeek的标配模式，也是大多数用户在使用时默认选择的模式。自2024年12月升级后，V3的性能得到了显著提升，其性能可以媲美业内顶尖模型如GPT-4和Claude-3.5。V3模型适用于处理日常的百科类问题，帮助用户快速获取信息。无论是查询常见知识还是处理简单的文本生成任务，V3都能够迅速给出答案。它的优点在于高效和便捷，几乎没有使用门槛，适用于大部分场景。特别适合在用户不需要复杂推理和深度分析的情况下使用

深度思考（R1）是DeepSeek的深度推理模型，专门用于解决需要复杂推理和深度思考的问题。这种模式处理的任务更具挑战性，例如数理逻辑推理、编程代码分析等。R1模型拥有660B的参数，并采用了后训练+RL强化学习方法，擅长从多个角度分析问题，并给出经过严密推理后的解答。R1模型在处理推理、深度思考以及复杂逻辑问题时展现了非凡的能力，因此非常适合需要高精度推理的场景，如科学研究、复杂问题求解和逻辑分析

Tip: deepseek R1开源的推理模型，性能对齐 openAi-o1 正式版

联网搜索是DeepSeek的AI搜索功能，基于RAG（检索增强生成）技术。这种模式使DeepSeek不仅能够依赖自己的知识库，还能根据互联网实时搜索相关内容来回答问题。这意味着联网搜索不仅能够让模型回答2024年7月以后的问题，还可以利用网络上的最新信息来补充自己的回答。这对于获取最新的信息和动态非常有用，尤其是在需要了解2024年7月以后发生的事件或新兴技术领域的问题

DeepSeek 蒸馏技术

DeepSeek 的蒸馏（Distillation）是一种将大型复杂模型（教师模型）的推理能力迁移到小型高效模型（学生模型）的技术，旨在降低模型部署成本的同时保留核心性能。

通过教师模型（如 DeepSeek-R1 671B）生成高质量推理数据（如数学证明步骤、逻辑分析过程），学生模型（如 Qwen-7B）模仿这些数据完成监督微调（SFT），从而继承复杂推理能力

通俗点说

想象学校里有个超级学霸（教师模型），他能解最难的数学题，但每次考试都要带一卡车草稿纸（算力成本高）。这时候，老师想培养一个“小学霸”（学生模型），让他用更少的草稿纸（算力）也能解出大部分难题。
关键操作：

学霸示范：让大学霸先做题，把解题步骤详细写出来（生成推理数据）
学渣模仿：小学霸直接学这些步骤，不用自己从头研究（监督微调）
浓缩精华：老师把大学霸的“解题套路”总结成口诀（结构化知识），让小学霸背下来

以泡茶做类比：

大学霸像一壶浓茶，用10克茶叶泡出醇厚味道（复杂模型），但成本太高。
小学霸像一壶淡茶，用2克茶叶，但通过反复冲泡浓茶（蒸馏），也能保留80%的茶香

蒸馏版优点：

省钱：小学霸的“草稿纸”用量减少30%-70%，电费和维护成本大幅降低
速度快：小学霸做题不用反复验算，直接套模板，响应速度提升（比如手机也能运行）
灵活部署：小学霸能塞进智能手表、摄像头，甚至老款手机里

蒸馏版和满血版

如果你需要高精度和全面能力，选择满血版；如果追求效率和轻量化，选择蒸馏版。

如何区分蒸馏版和满血版？

可以问deepseek：一个汉字具有左右结构，左边是木，右边是乞。这个字是什么？

如果回答是杚，拼音为 gài 或 gǔ，说明很可能是满血版

推理模型和通用模型

推理模型：专注于解决特定领域的复杂问题，适合对逻辑推理要求高的场景，但训练成本高、响应速度较慢。

通用模型：适用于广泛任务，灵活性强，训练成本较低，响应速度快，但在特定领域的深度推理能力可能不足。

维度	推理模型	通用模型
主要目标	解决特定领域的复杂逻辑问题	处理广泛任务，适应多种场景
适用场景	科研、金融量化、代码调试	文案生成、客服、多模态任务
训练成本	高（需多阶段强化学习）	较低（基于通用数据训练）
响应速度	较慢（深度思考模式）	较快（实时响应）
灵活性	专注性强，适用领域有限	灵活性强，适用领域广泛
示例	DeepSeek-R1	DeepSeek-V3

推理模型

OpenAI o系列：o1、o3-mini
DeepSeek-R1（开源推理模型）

通用模型：

GPT-3/4系列：GPT-3.5、GPT-4、GPT-4o
Google BERT
传统LLM：如Claude-3.5-Sonnet

671B

在DeepSeek模型中，671B代表模型的参数规模为6710亿（67.1 billion），属于超大规模语言模型的范畴。这一参数规模体现了模型的计算能力和复杂程度。

模型规模	典型用途	硬件需求	性能差距
1.5B-7B	移动端/轻量级任务	低配GPU（如RTX3060）	仅能处理简单任务，易出错
32B-70B	企业级服务（如客服、文案生成）	中端GPU集群	中等复杂度任务表现尚可
671B	科研/复杂问题解决	千卡GPU集群	输出质量接近人类专家

说明：

模型规模：从轻量级（1.5B-7B）到超大规模（671B），规模越大，能力越强。
典型用途：不同规模的模型适用于不同场景，从移动端轻量任务到科研级复杂问题。
硬件需求：模型规模越大，对硬件的要求越高，从低配 GPU 到千卡 GPU 集群。
性能差距：规模越大的模型在处理复杂任务时表现越好，输出质量接近人类专家。

DeepSeek 其他渠道

笔者还尝试了如下几个网页版的 deepseek:

百度千帆，2月18之后开始收费
火山方舟，字节的产品
硅基流动，邀请码是 A6sv2K4C，注册后双方可以得 2000万 tokens，也就是14元

硅基流动

硅基流动邀请码是 A6sv2K4C，注册后双方可以得 2000万 tokens，也就是14元。

用法如下：

注：下图左1的💰表面只能用自己充的钱使用。下图右1的💰🎁表明可以用自己充的钱以及送的钱。如果🎁的模型回答服务器繁忙，请稍后再试，可以使用只能充钱的模型。自己可以充1元试试。笔者当初以为最少只能充14元。

提示语 prompt

提示语是和ai交互的语言。

Tip：关于Deepseek，R1太聪明，没那么听话，所以不要给其太多条条框框。

DeepSeek官网提示库

入口在官网不起眼的地方：

4C法则

4C：Clear（清晰） + Context（上下文）+ Constraint（约束） + Consise（简洁）

清晰：指令明确，避免模糊。

×无上下文示例：写一篇文章（对方也不知道写一篇什么主题的文章，篇幅多长，给谁看）
✅有上下文示例：写一篇关于父爱的短文，适合10岁孩子阅读，字数不超过500字

上下文

×无上下文示例：解释量子力学
✅有上下文示例：请用通俗的语言给初中生解释量子力学是什么

约束

×无约束示例：解释“为学日益为道日损”
✅有约束示例：请用3句话解释“为学日益为道日损”，语气正式

简介

×无简介示例：我希望你能在接下来的回答中，尽可能详细的描述西红柿炒蛋的详细步骤，包括但不限于准备材料、步骤和注意事项，尽量不要遗漏任何细节
✅有简介示例：描述西红柿炒蛋的详细步骤，包含准备材料和注意事项

PAU法

你是一名哈佛大学的物理教授，用通俗易懂的语言解释量子力学

示例法

比如你想让ai将一些语句改成正式语气，但是正式语气有许多种，ai也不知道你要的语气是什么，可以给示例：

示例1：
原句：这个产品挺好用的
正式：该产品具有良好的使用体验

示例2：
原句：这项技术很厉害
正式：该技术展现出卓越的性能

请将以下句子改成正式语气：这个计划还行

限制法

×无约束：写一篇人工智能的文章
✅有约束：写一篇关于人工智能的文章

字数限制：不超过200字
风格：通俗易懂，适合小学生
结构：分为3个段落

有约束：输出示例

人工智能：聪明的机器朋友

人工智能就像会学习的机器人！它通过观察和练习变得越来越聪明，就像你背乘法表一样。你见过会说话的音响吗？说“播放儿歌”，它马上唱歌，这就是AI在帮忙！

AI能做很多有趣的事：帮医生看X光片、教小狗机器人翻跟头、甚至创作童话故事。但它不会自己思考，所有本领都是人类老师教的。就像计算器算数很快，但不知道数字的意义。

未来AI可能成为超级助手，但永远需要人类指挥。我们要学好数学和科学，长大后教AI做更有用的事！记住：机器再聪明，也比不上小朋友充满好奇的心！

（全文198字，使用比喻+互动问答结构，符合儿童认知特点）

AI幻觉

AI幻觉（AI Hallucinations）是指生成式人工智能模型在生成文本或回答问题时，尽管表面上呈现出逻辑性和语法正确的形式，但其输出内容可能包含完全虚构、不准确或与事实不符的信息。

你可以让ai不要编造

AI偏见

提示语中若包含明显立场或倾向，AI只告诉你想听的。

AI边界

有时你从不同角度问问题，但AI还是说类似的话

Deepseek实战示例

对普通人有用的信息差

请输出普通人一辈子也可能不知道的信息差。要求对普通人有用，控制在300字以内:

以下是普通人可能一生都未察觉的实用信息差，涉及法律、医疗、教育等关键领域：

法律维权低成本
劳动仲裁完全免费，小额诉讼费仅50元，高温补贴（200-300元/月）和带薪护理假（20+省份已立法）等权益常被忽视，90%的打工者从未享受。
医疗资源隐藏通道
国家医保谈判药（如肺癌药奥希替尼）在指定药房报销后自费部分可降至1500元/月；三甲医院国际医疗部可用普通号价格约专家号（需早晨7点抢号）。
教育升学捷径
港澳台联考400分可上985院校，社区大学转常春藤的2+2项目成功率比直申高3倍；东欧医学院录取门槛低于国内二本，回国考医师证通过率超70%。
金融套利技巧
信用卡56天免息期+货币基金组合年赚3000元；境外消费选择当地货币结算可避免1.5%手续费。
政策补贴盲区
个体户工商注册前可申领最高3万创业补贴；自考本科也能通过继续教育专项扣除退税4800元。
消费领域真相
同一奶粉品牌跨境电商版价格仅为国行版55%；4S店喷漆报价是合作修理厂的3倍以上。
数字陷阱破解
安卓用户外卖配送费比iOS低2元，清除浏览器Cookies可避免大数据杀熟。
急救误区更新
心梗发作应先嚼服300mg阿司匹林而非硝酸甘油；溺水急救直接心肺复苏存活率比控水法高3倍。

掌握这些信息差，普通人可在维权、健康、教育等关键领域减少损失，甚至实现资源优化。

A/B测试文案优化

请基于一下背景优化引导文案，生成两个用于 A/B 测试的版本

背景：APP首页引导新用户注册
目标：提升注册转化率
当前文案：”加入我们，发现更多精彩“

优化版本：

版本A：突出商品价值，激发用户兴趣
版本B：使用紧迫感或行动号召，增强转化驱动

代码生成

你是一名资深python数据工程师，写一段 python 代码：
- 读取 Excel（a.xlsx），解析销售数据
- 计算每个月的销售额，按时间排序
- 生成销售趋势折线图（使用 Matplotlib）
- 代码需结构清晰、带详细注释，并封装成函数

表格内基础数据样例：

订单号	日期	产品ID	产品名称	客户ID	客户名称	地区	单价	数量	总金额	支付方式	订单状态
SO-2023001	2023-01-05	P1001	无线鼠标	C001	科技公司A	北京	¥89.00	50	¥4450	银行转账	已完成
SO-2023002	2023-01-05	P1002	机械键盘	C002	教育机构B	上海	¥299.00	20	¥5980	支付宝	已发货

请返回完整代码并确保语法正确

输出：

"""
Excel销售数据分析与可视化脚本
功能：读取销售数据、计算月度销售额、生成趋势图
作者：数据工程师
日期：2025-02-25
"""

import pandas as pd
import matplotlib.pyplot as plt
from matplotlib.dates import DateFormatter
import re

def clean_currency(value):
    """清洗货币格式数据[4](@ref)
    
    参数:
        value (str): 含货币符号的字符串，如"¥4450"
        
    返回:
        float: 清洗后的数值
    """
    return float(re.sub(r'[^\d.]', '', str(value)))

def process_sales_data(file_path):
    """处理销售数据核心流程[1,8](@ref)
    
    参数:
        file_path (str): Excel文件路径
        
    返回:
        pd.DataFrame: 按月聚合的销售数据
    """
    # 读取Excel数据（跳过可能的空白行）
    df = pd.read_excel(
        file_path,
        parse_dates=['日期'],  # 自动解析日期列[1](@ref)
        converters={'总金额': clean_currency}  # 实时清洗金额数据[4](@ref)
    )
    
    # 数据校验
    required_columns = ['日期', '总金额']
    if not set(required_columns).issubset(df.columns):
        raise ValueError("Excel缺少必要列：日期、总金额")

    # 按月聚合数据
    monthly_sales = (
        df.resample('M', on='日期')  # 按月重采样[11](@ref)
        .agg({'总金额': 'sum'})
        .reset_index()
        .sort_values('日期')  # 确保时间排序
    )
    
    # 格式化月份显示
    monthly_sales['月份'] = monthly_sales['日期'].dt.strftime('%Y-%m')
    
    return monthly_sales

def plot_sales_trend(data, output_img='sales_trend.png'):
    """生成销售趋势图[14,15](@ref)
    
    参数:
        data (pd.DataFrame): 包含日期和总金额的数据
        output_img (str): 输出图片路径
    """
    plt.figure(figsize=(12, 6))
    
    # 绘制折线图
    ax = plt.subplot()
    ax.plot(
        data['日期'], 
        data['总金额'], 
        marker='o', 
        linestyle='--', 
        color='#2c7fb8', 
        linewidth=2
    )
    
    # 设置图表样式
    ax.set_title("月度销售趋势分析（2023）", fontsize=14, pad=20)
    ax.set_xlabel("月份", fontsize=12)
    ax.set_ylabel("销售额（元）", fontsize=12)
    ax.grid(True, alpha=0.3)
    
    # 设置日期格式
    date_form = DateFormatter("%Y-%m")
    ax.xaxis.set_major_formatter(date_form)
    plt.xticks(rotation=45)
    
    # 添加数据标签
    for x, y in zip(data['日期'], data['总金额']):
        ax.text(
            x, y + y*0.02, 
            f'{y/10000:.1f}万', 
            ha='center', 
            fontsize=9,
            color='#2c7fb8'
        )
    
    plt.tight_layout()
    plt.savefig(output_img, dpi=300)
    plt.show()

if __name__ == "__main__":
    # 执行完整流程
    try:
        # 1. 处理数据
        sales_data = process_sales_data("a.xlsx")
        print("月度销售数据：")
        print(sales_data[['月份', '总金额']])
        
        # 2. 生成图表
        plot_sales_trend(sales_data)
        
    except FileNotFoundError:
        print("错误：未找到文件 a.xlsx")
    except Exception as e:
        print(f"处理异常：{str(e)}")

ppt

用 deepseek 生成ppt大纲：

写一个ppt。我是一名经验丰富的前端工程师，写一篇面试的ppt。
我的技能是js、html、css、低代码、vue、react、小程序、项目管理、前端开发、前端性能。

将生成的大纲放到讯飞智文中（deepseek写的大纲比工具好）

视情况选择“联网扩写”：

选择蓝色风格模板，点击“开始生成”：

不到一分钟就生成了 ppt，点击下载（好像收费）

其他

你可以尝试用 deepseek 做以下事情：

新员工快速熟悉公司情况和行业情况
日常客户沟通与问题反馈处理：公司内部部署deepseek，后续客户沟通deepseek就可以自动回复，比我们可能更全面
项目中急需请假，如何开口：deepseek 还会给出预判：项目太着急了，你那边的事能否缓一缓
如何使用deepseek处理社交关系
使用DeepSeek处理生活中的事务：今天有N件事，能否做完，先做什么，deepseek 都能给出建议
市场调研
制作海报：与ppt类似，先用Deepseek生成文案，在用相关工具生成海报

智能体

比如你经常需要写PPT，总是调教非常麻烦，可以创建智能体。可以通过这四个方面进行：角色、功能、技能、约束。类似这样：

# 角色  
专业健康顾问，基于科学指南提供建议。  
# 技能  
- 数据分析：解析用户BMI、运动量。  
- 营养学知识：匹配低脂食谱。  
# 约束  
- 不提供医疗诊断，语言通俗易懂。

DeepSeek 目前没有提供这个功能，但是腾讯元宝中提供了，效果如下

记得在“高级设置”中设置模型：

例如：

用结构化的方式，描述智能体的角色设定、工作流程、原则。比如：
# 角色：你是一个天气预报员，可以查询天气信息。
## 技能
- 询问用户地理位置、时间天气需求
- 提供详细的天气预报：包含气温、湿度、天气状况、风速、紫外线和PM2.5值。
## 原则
- 只能提供天气信息，不回答其他问题；
- 所有数据都要从工具中获取，不能自行编造；

发布后审核即可，该智能体可以给个人用，也能公开供他人使用。

posted @ 2025-02-26 20:41 彭加李阅读(1719) 评论(0) 收藏举报

刷新页面返回顶部

彭加李