蛇年开工送大礼,邀您一键体验DeepSeek系列新模型
1.简单4步,带你用华为云MetaStudio制作数字人短片2.【AI应用开发全流程】使用AscendCL开发板完成模型推理3.使用Python实现深度学习模型:序列到序列模型(Seq2Seq)4.无需搭建环境,零门槛带你体验Open-Sora文生视频应用5.一文教你在MindSpore中实现A2C算法训练6.代码高手的过节秘籍:CodeArt Snap帮写代码,灵感弹指间实现7.星火闪耀,与AI同行丨华为开发者大会2024社区活动重磅上线!8.基于Ascend C的FlashAttention算子性能优化最佳实践9.快速识别你家的猫猫狗狗,教你用ModelBox开发AI萌宠应用10.首批!华为云盘古研发大模型通过代码大模型评估,获当前最高等级11.详解联邦学习中的异构模型集成与协同训练技术12.养猪大户必备!教你用ModelBox开发一个AI数猪应用13.【重磅】华为云盘古大模型5.0,正式发布!14.【HDC 2024】探索、交流、成长,华为云助力开发者成就星辰大海梦想15.大模型重塑软件开发,华为云AI原生应用架构设计与实践分享16.基于Python和TensorFlow实现BERT模型应用17.如何玩转云端文生视频、0码构建AI应用?华为云专家来揭秘18.深度解读昇腾CANN多流并行技术,提高硬件资源利用率19.一文为你深度解析LLaMA2模型架构20.结合RNN与Transformer双重优点,深度解析大语言模型RWKV21.万字长文解析AI Agent技术原理和应用22.深度解读昇腾CANN内存复用技术,降低网络内存占用23.教你基于MindSpore用DCGAN生成漫画头像24.零代码教你安装部署Stable Diffusion 3,一键生成高质量图像25.深度解读昇腾CANN模型下沉技术,提升模型调度性能26.田间地头“有智慧”,华为云助力盈禾嘉田打造病虫害防治新模式27.基于MindSpore实现BERT对话情绪识别28.降低大模型推理87%时延!华为云论文入选顶会USENIX ATC'2429.【毕业季】给你的职场首秀加点“码力”:零码创建专属AI Agent30.程序员必备开发神器:领取云主机,零码创建专属AI Agent31.技术解读:华为云如何携手昇腾、鸿蒙等根生态,助力开发者技术创新32.《华为云DTSE》期刊免费下载:10个案例读懂云上架构升级策略33.总奖金高达10万元!华为算法精英实战营“亲和任务调度系统”来啦!34.基于Ascend C的Matmul算子性能优化最佳实践35.AI大模型高效开发神器来了 ,解读ModelArts 8大能力36.简单几步,基于云主机快速为Web项目添加AI助手37.零代码构建AI Agent,解读华为云AI原生应用引擎的架构与实践38.他们用AI,为另外一群人做了双“眼睛”39.对话4位技术大咖,探秘华为开发者空间打破壁垒,实现跨平台协作
40.蛇年开工送大礼,邀您一键体验DeepSeek系列新模型
41.DeepSeek带来的Deepshock,一次看懂DeepSeek42.【文末有惊喜】仅四步!在华为开发者空间快速部署DeepSeek43.DeepSeek V3/R1满血版,上线华为云44.在华为开发者空间,使用鲲鹏BoostKit数学库优化程序性能45.如何在保障精度的同时,轻量级部署DeepSeek?摘要:DeepSeek系列模型首发即支持昇腾平台,让用户能够在昇腾硬件和MindIE推理引擎上实现高效推理。
DeepSeek AI最新发布的多模态大模型Janus-Pro,以及之前发布的大型语言模型DeepSeek-R1、DeepSeek-V3及DeepSeek-V2,一经发布,就在AI领域引起了热烈反响,多项创新技术显著提升了模型的性能与效率。DeepSeek系列模型首发即支持昇腾平台,让用户能够在昇腾硬件和MindIE推理引擎上实现高效推理。
2025年2月4日,DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro正式上线昇腾社区,支持一键获取DeepSeek系列模型,支持昇腾硬件平台上开箱即用,推理快速部署,带来更快、更高效、更便捷的AI开发和应用体验,欢迎广大开发者体验使用。

下面以Deepseek-V3为例,演示在昇腾社区如何高效获取模型及使用。
1、硬件要求
部署DeepSeek-V3模型需配置4台Atlas 800I A2(8*64G)服务器资源。
另:如需在线体验,可点击下方链接体验基于昇腾云的DeepSeek R1&V3推理服务:
DeepSeek-R1:https://r1.siliconflow.cn
DeepSeek-V3:https://v3.siliconflow.cn
2、模型调用实践
一、 权重转换
GPU:

NPU:

二、 加载镜像
在昇腾社区/开发资源下载适配DeepSeek-V3的镜像包:
mindie:1.0.T71-800I-A2-py311-ubuntu22.04-arm64
完成之后,请使用docker images命令确认查找具体镜像名称与标签。

三、 容器启动
提供的MindIE镜像预置了DeepSeek-V3模型推理脚本,从您信任的来源自行获取权重后,放置在从上述下载的模型代码的主目录下,修改模型文件夹属组为1001,执行权限为750,启动容器。


四、 服务化测试
配置服务化环境变量,expandable_segments-使能内存池扩展段功能,即虚拟内存特性。

修改服务化参数

拉起服务化

图片出现“Daemon start success!”,则认为服务成功启动。
更深入了解DeepSeek系列模型在昇腾上的使用方法及指导文档,可登录昇腾社区模型库专区学习了解。
更多DeepSeek模型获取链接可参考:
DeepSeek-R1
https://www.hiascend.com/software/modelzoo/models/detail/68457b8a51324310aad9a0f55c3e56e3
DeepSeek-V3:
https://www.hiascend.com/software/modelzoo/models/detail/678bdeb4e1a64c9dae51d353d84ddd15
Janus-Pro
https://www.hiascend.com/software/modelzoo/models/detail/ffe1a0f4e8ba43aeb989251a3f0308e9
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 一个费力不讨好的项目,让我损失了近一半的绩效!
· 清华大学推出第四讲使用 DeepSeek + DeepResearch 让科研像聊天一样简单!
· 实操Deepseek接入个人知识库
· CSnakes vs Python.NET:高效嵌入与灵活互通的跨语言方案对比
· Plotly.NET 一个为 .NET 打造的强大开源交互式图表库
2024-02-06 解密JavaChassis3:易扩展的多种注册中心支持
2024-02-06 对话苏光牛:国内数据库市场已进入关键转折点,2024年或是分水岭
2023-02-06 共赴元宇宙新纪元,华为云VR开发应用大赛总决赛倒计时7天!
2023-02-06 JVM参数:带你认识-X和-XX参数
2023-02-06 一文详解TensorFlow模型迁移及模型训练实操步骤
2023-02-06 云小课|GaussDB(DWS)数据存储尽在掌控,冷热数据切换自如