大模型 - 第8页 - 网站分类

如何构建和训练世界级LLM

背景如今，几乎人人都在谈论训练大型语言模型（LLM）。然而，在这股热潮背后，是普通人难以想象的复杂挑战和“凌乱的现实”。研究论文总是将结果描绘得光鲜亮丽，仿佛每一个决策都显而易见。但它们从未提及凌晨两点调试数据加载器的挣扎、损失曲线的神秘飙升，或是那些悄悄破坏你整个训练过程的隐蔽Bug。最近，Hu ...

3080 20G和3090在大模型推理场景的性能比较

使用Ollama部署Qwen3模型进行推理场景的性能实测，比较3080 20G和3090 24G的差异到底多大？ RTX 3080 20G显卡是基于3080 10G魔改的卡，目前市面比较多得被用于小规模参数的大语言模型推理场景，被认为是性价比比3090还高的推理显卡。对比显卡参数，3080 20G... ...

《AI工程》书介绍

AI工程宝典，搞懂大模型应用的秘籍宝子们，今天来给大家安利一本超实用的AI工程书！这可不是那种花里胡哨的工具书，而是从根基上帮你搞懂大语言模型（LLMs）和大多模态模型（LMMs）在具体应用中的适配框架。从搭建AI应用的各种方案，到评估应用的优劣，甚至还能用AI来评估AI输出，这本书统统给你答案。比 ...

Cursor 2.0与Composer发布

Cursor 2.0与Composer发布首先，Cursor2.0支持多智能体并行运行，最多可以同时运行八个智能体，再也不用担心文件冲突了。而且每个智能体都在自己独立的代码副本中运行，超安心！它的核心是全新的 Composer 编程模型，速度比同等级的模型快了整整四倍，简直是效率的飞跃！Compos ...

斯坦福大模型课CS336，硬核到让人怀疑人生？

斯坦福CS336从头开始构建大模型家人们，最近斯坦福的CS336课程火了，但好多同学却直呼“跟不上”“太硬核”！这门课的目标是引导学生从零开始开发自己的语言模型，听起来是不是就很厉害？它借鉴了操作系统课程的理念，让学生体验从数据收集、模型构建到训练评估的全过程。课程分5个单元、19门课，涵盖从To ...

AI辅助渗透测试小试牛刀

传统的自动化渗透测试工具在过去几十年中已成为安全评估的标准组成部分。然而，这些工具的效能主要局限于已知漏洞的广泛扫描和配置检查，其内在的局限性也日益凸显。传统自动化工具本质上是确定性的，依赖于静态签名库和预定义的规则集来识别漏洞。这种方法在面对需要上下文理解、创造性思维或业务逻辑分析的复杂场景时显 ...

手机AI“造反”了？你可能还不知道的四件大事儿

哎，自打ChatGPT火了以后，咱们是不是都觉得云上的AI特牛？啥都能聊，啥都懂。但说实话，你用着不烦吗？网一卡就“正在连接”，老担心自己的聊天记录被泄露，而且没网就彻底抓瞎。不过你可能没注意，现在有场“革命”正悄悄发生——就是把特牛的AI，直接塞进你的手机里！这可不光是为了解决卡顿和隐私问题，它带 ...

AI在产品经理工作中的整合与应用解析

导言：AI，现代企业的新核心协作者人工智能（AI）正在经历一场深刻的范式转变，从过去执行特定任务的外围工具，演变为深度集成于业务流程、与人类原生协作的核心伙伴。本报告旨在深度剖析这一转型，将所提供的图表视为一张战略蓝图，该蓝图描绘了AI在六个关键业务职能中的应用与价值。本报告的核心论点是，现代AI ...

个人 Windows 电脑本地部署运行 DeepSeek 大模型

1、大模型管理器 1.1、下载ollama 官网下载地址：https://ollama.com/download 如上图所示，下载 Windows 操作系统版本的 ollama 安装包。 1.2、安装ollama 如上图所示，以“管理员身份运行”安装包。如上图所示，允许安装包对设备进行更改。如上 ...

【打造自己的 DeepSeek】第 2 期：怎么安装自己的 DeepSeek？

上一期介绍了为什么要打造自己的 DeepSeek，本期将介绍怎么安装自己的 DeepSeek。这里要使用的工具是 Ollama。它是一个免费开源的本地大语言模型运行平台，可以帮我们把 DeepSeek 模型下载到我们自己的电脑上运行，支持 Windows、MacOS 和 Linux 三大主流操作 ...

Google Skills免费开放啦

家人们，AI圈的大事来啦！Google搞了个大动作，直接把内部的AI学习资源打包成“Google Skills”平台，向全球开放！这波操作直接把AI学习的门槛拉到超低，普通人也能轻松上车！免费用户直接用Google Cloud账号就能学，非Cloud用户花29刀就能月卡畅学。这个平台简直就是AI学习 ...

【打造自己的 DeepSeek】第 1 期：为什么要打造自己的 DeepSeek？

近些年 AI 大火，不过在国内真正火起来还是源于今年春节期间的 DeepSeek。个人认为有两方面原因：一方面是 DeepSeek 使用方便。由于众所周知的原因，国内对国外网站的访问是有诸多限制的，其中就包括各大 AI 模型的官网。而 DeepSeek 是国内研发的，可以直接访问，网页使用是 ...

构建YouTube视频总结摘要智能体

智能体 AI 平台智能体 AI 框架是一个工具包，用于创建能够通过工具使用和记忆自主或半自主地推理、计划和采取行动的智能体系统。这些框架提供了创建能够与环境交互、做出决策和执行任务的智能体所需的结构。有几个流行的智能体 AI 平台，如 LangChain、CrewAI 和 Phidata。在本教程 ...

Search-R1论文浅析与代码实现

GitHub: https://github.com/PeterGriffinJin/Search-R1 论文： link1, link2 Motivation 使用seach engine给reasoning LLM赋能 Method 在PPO的基础上，基于给定的Search Egine \(R\ ...

PPO GRPO GSPO DAPO的Loss计算与代码实现

首先看一下KL的基础公式 KL KL1: 大模型的KL一般是反向的： \[KL(\pi_\theta||\pi_{ref}) = E_{x\sim\pi_\theta(\cdot|o_{<t})}log\frac{\pi_\theta(x|o_{<t})}{\pi_{ref}(x|o_{<t})} ...

OpenAI Codex整合Z.ai GLM-4.6编程

背景 OpenAI Codex 是一个由 OpenAI 开发的人工智能模型，它能够理解自然语言（比如中文、英文）指令，并将其实时翻译成可工作的计算机代码。简单来说，你用日常语言告诉它你想要实现什么功能，它就能为你写出代码。技术基础： Codex 是基于 OpenAI 的 GPT-3（生成式预训练变换 ...

解密prompt系列62. Agent Memory一览 - MATTS & CFGM & MIRIX

最近Agent Memory的论文如雨后春笋，我们将重点分析三篇代表性工作： - CFGM：离线轨迹经验提取 - ReasoningBank：轨迹经验提取和test-time scaling结合 - MIRIX：提供完整记忆工程方案和全面记忆分类 ...

DAPO代码实现浅析

参考verl对dapo的实现，首先咱们看一下入口.sh和.py文件，在./recipe/dapo/文件夹中有以下目录 . ├── config │ ├── dapo_megatron_trainer.yaml │ └── dapo_trainer.yaml ├── dapo_ray_trainer. ...

元推理框架：自指自洽，人工智能领域的杂交水稻

ECT-OS-JiuHuaShan/https://orcid.org/0009-0006-8591-1891 基于 ECT-OS-JiuHuaShan 框架推理：将本框架喻为“人工智能领域的杂交水稻”，这一论断已通过自然辩证法数学形式化张量逻辑系统验证为绝对精准的文明级类比。现以终结性阐述展开这一 ...

DAPO浅析

论文地址 https://arxiv.org/abs/2503.14476 参考实验：DAPO + vLLM v1 + VeRL —— VOC性能比较 Motivation 没有完整的GRPO训练R1-32B的框架目标：降低错误样本的长度 (token-level loss) 训练更加稳定 (o ...