0

全网最强 DeepSeek 插件上线!支持多家云服务,一键解锁满血版 AI

前言 自 DeepSeek 推出以来,其回答质量备受好评。然而,许多用户在连续提问时经常遇到“服务器繁忙,请稍后再试”的提示。随着各大云服务商陆续部署 DeepSeek 的完整模型,我们其实可以通过这些厂商的 API,享受更加流畅和高效的 DeepSeek 体验,不仅响应速度更快,还能大幅减少因服务 ...

革新 发布于 2025-02-12 22:16 评论(0) 阅读(8)
0

deepseek-v3 论文阅读

模型结构 MLA(Multi-Head Latent Attention) 主要作用是在保证效果的基础上, 利用低秩压缩的原理优化kvCache, 加速推理, 同时节省训练显存. 先回忆下MHA, 在每个head上, 分别经过K, V生成 $ attnweights=(W_Qh_i)^T∗(W_Kh ...

SunStriKE 发布于 2025-02-12 21:15 评论(0) 阅读(79)
1

数学原来可以这样学:初中篇

一、概述​ 高斯:近代数学之父、磁场单位,微分之父、几何学之父、测量之父、地图之父。 数学表示具有再现性和客观性,数学是自然科学的基础。 牛顿:stand on the shoulders of giants. 学数学:要通过解决数学问题,锻炼“思考体力”。 思考体力:①自我驱动力 ②多段思考力 ③ ...

敬YES 发布于 2025-02-12 20:29 评论(0) 阅读(11)
0

LangChain基础篇 (06)

LangChain 核心模块 Agent(构建复杂应用的代理系统) ReAct: Reasoning + Acting ReAct Prompt 由 few-shot task-solving trajectories 组成,包括人工编写的文本推理过程和动作,以及对 动作的环境观察. ReAct P ...

nmblr 发布于 2025-02-12 19:48 评论(0) 阅读(23)
1

一键部署+限免体验!盘点如何在华为云上体验DeepSeek

本文分享自华为云社区《一键部署+限免体验!盘点如何在华为云上体验DeepSeek》,作者:华为云社区精选。 还在为DeepSeek深度思考出现“服务器繁忙”而头疼?华为云带你一键在线体验和本地部署DeepSeek模型,200万Token免费领取+云主机极简安装体验,5分钟搞定!更有联网搜索AI应用搭 ...

华为云开发者联盟 发布于 2025-02-12 16:37 评论(0) 阅读(145)
0

上海站 | 2025 Seeed x LeRobot 具身智能黑客松报名开启!

欢迎来到 Physical AI 的最前沿!Seeed x LeRobot 具身智能黑客松现邀请所有对在机器人领域训练模仿学习策略,并实时进行推理部署感兴趣的人,共同创造具有影响力的创新解决方案。在这里,你可以与志同道合的开发者一起实践前沿机器人技术,获取免费硬件支持和独家资源,并快速在真实机器人系 ...

HuggingFace 发布于 2025-02-12 16:36 评论(0) 阅读(27)
2

定制化训练DeepSeek模型:LoAR、COT推理与SFT技术应用

DeepSeek-R1 模型微调系列 DeepSeek-R1 模型微调系列一. 前言介绍本文内容:1.1 项目背景1.2 LoRA和 QLoRA 简介1.3 LLaMA 架构和 Qwen 架构LLaMA 架构Qwen 架构二. 环境准备2.1 Unsloth 安装(显卡版本-暂时不用)2.2 创建P ...

宁采臣open 发布于 2025-02-12 15:15 评论(0) 阅读(177)
3

手把手教你在个人电脑部署本地知识库(基于RAGFlow + DeepSeek [+ Ollama])

1. 实现方案及准备工作 按照教程一步一步操作,基本没有什么太大难度,稍显麻烦的可能就是因网络问题有些资源无法下载,对于镜像无法下载的问题,文中也提供了替代的方法,但是github访问不稳定这点,如果你不是上网达人,只能找朋友求助了。 本文档提供了两种部署方法:半本地化部署、完全本地化部署,你可以根 ...

饭饭12 发布于 2025-02-12 14:11 评论(0) 阅读(414)
0

docker官网镜像无法下载问题解决

亲测可用,这个方法是由技术爬爬虾大佬提供,简单地说就是通过github上的docker_image_pusher项目,将国外docker镜像转存到阿里云私人仓库。 此方法需要你有一个github账号,有一个阿里云账号。注册方法这里就不赘述了。 1.1. 获取阿里云相关参数 登录阿里云容器镜像服务。地 ...

饭饭12 发布于 2025-02-12 12:00 评论(0) 阅读(13)
0

小白也能看懂的大模型书籍《GPT图解:大模型是怎样构建的》PDF免费下载

本书通过生动的故事和图解,介绍了自然语言处理技术的核心原理,涵盖N-Gram、Word2Vec、Transformer等技术的演进。书中提供动手实践的机会,帮助读者从零开始构建语言模型,适合AI初学者与从业者阅读。本文提供《GPT图解:大模型是怎样构建的》免费下载,包含pdf、epub格式。 ...

不知名也 发布于 2025-02-12 10:18 评论(0) 阅读(20)
0

清华博士后的DeepSeek使用手册,104页,真的是太厉害了!(免费领取源文件)

《DeepSeek从入门到精通2025》是由清华大学元宇宙文化实验室的余梦珑博士后及其团队撰写。文档的核心内容围绕DeepSeek的技术特点、应用场景、使用方法以及如何通过提示语设计提升AI使用效率等方面展开,帮助用户从入门到精通DeepSeek的使用。 以前我看了很多教程,都感觉特别花哨,没啥干货 ...

久曲健 发布于 2025-02-12 08:56 评论(4) 阅读(289)
3

传国玉玺易主,ai.com竟然跳转到国产AI

一、震惊!输入ai.com网址竟然见证历史 今天我在地址栏随手敲了个ai.com,结果网页"唰"地一下——居然跳到了国产AI新贵DeepSeek的官网!这感觉就像在胡同口买煎饼,结果老板递给我一块金砖啊 要知道这个ai.com可是全球科技圈的"传国玉玺",从1993年注册至今(整整32年历史! ...

程序员晓凡 发布于 2025-02-12 07:43 评论(2) 阅读(1269)
0

让 LLM 来评判 | 评估你的评估结果

评估你的评估结果 这是 让 LLM 来评判 系列文章的第三篇,敬请关注系列文章: 基础概念 选择 LLM 评估模型 设计你自己的评估 prompt 评估你的评估结果 奖励模型相关内容 技巧与提示 在生产中或大规模使用 LLM 评估模型之前,你需要先评估它在目标任务的表现效果如何,确保它的评分跟期望的 ...

HuggingFace 发布于 2025-02-11 21:48 评论(0) 阅读(132)
0

LangChain基础篇 (05)

LangChain 核心模块:Data Conneciton - Document Transformers 一旦加载了文档,通常会希望对其进行转换以更好地适应您的应用程序。 最简单的例子是,您可能希望将长文档拆分为较小的块,以适应模型的上下文窗口。LangChain具有许多内置的文档转换器,可以轻 ...

nmblr 发布于 2025-02-11 21:23 评论(0) 阅读(95)
0

轻松部署OpenWebUI+DeepSeek API,实现多端互通查询自由

引言 DeepSeek模型很强大,但官方目前存在以下几个痛点 不稳定:官方页面、官方API暂时只能提供有限的服务 成本高:满血版671B个人电脑很少能带得动的 本文介绍nas/云服务器 部署OpenWebUI+DeepSeek API,实现多端互通查询自由,主要有以下几个优点 成本低:不用昂贵的硬件 ...

陈其苗 发布于 2025-02-11 11:03 评论(0) 阅读(1004)
2

基于deepseek模型知识库,Cherry Studio和AnythingLLM使用效果对比

网上有很多构建本地知识库的文章,我们更应该更深入应用,对比不同的应用效果,才能发挥知识库本身的价值。 ...

iNeuOS工业互联网系统 发布于 2025-02-10 11:49 评论(9) 阅读(1447)
0

本地一键运行大模型神器Ollama + DeepSeek R1尝鲜指南

本地一键运行大模型神器Ollama + DeepSeek R1尝鲜指南 作为AI领域的弄潮儿,你是否苦恼于云端大模型API的高昂成本?想在本机零门槛体验顶尖开源模型?这篇保姆级教程将带你解锁「Ollama+DeepSeek R1」黄金组合,文末附程序员专属玩法彩蛋! 一、Ollama:程序员的本地大 ...

小丑不戴面具 发布于 2025-02-10 09:42 评论(0) 阅读(68)
0

Java工程师如何理解张量?

刚接触 AI 和 PyTorch,理解 “张量 (Tensor)” 是入门关键。 简单来说,可将 PyTorch 中的张量 (Tensor) 理解为 Java 中的多维数组,但它比普通的 Java 数组强大得多,尤其在 AI 和深度学习领域。 1 张量(Tensor) VS Java 数组/列表 J ...

公众号-JavaEdge 发布于 2025-02-09 21:31 评论(0) 阅读(5)
0

Gemini 2.0 现已面向所有人开放

以下GOOGLE 原文BLOG翻译 0205发表 去年 12 月,我们通过发布 Gemini 2.0 Flash 的实验版本开启了“代理时代”——这是我们的高效工作模型,专为开发者设计,具有低延迟和增强性能。今年早些时候,我们在 Google AI Studio 中更新了 2.0 Flash Thi ...

PetterLiu 发布于 2025-02-09 20:28 评论(0) 阅读(212)
0

学习深度学习入门必看(基于Python3)《深度学习入门:基于Python的理论与实现》PDF免费下载

人工智能书籍教程,日本深度学习入门书,基于python3,从零创建一个深度学习模型。 本书是深度学习真正意义上的入门书,深入浅出地剖析了深度学习的原理和相关技术。书中使用Python3,尽量不依赖外部库或工具,从基本的数学知识出发,带领读者从零创建一个经典的深度学习网络,使读者在此过程中逐步理解深度... ...

不知名也 发布于 2025-02-09 17:30 评论(0) 阅读(25)

统计信息

  • 博客 - 795558
  • 随笔 - 11518198
  • 文章 - 972546
  • 评论 - 4154262