刷新
3080 20G和3090在大模型推理场景的性能比较

博主头像 使用Ollama部署Qwen3模型进行推理场景的性能实测,比较3080 20G和3090 24G的差异到底多大? RTX 3080 20G显卡是基于3080 10G魔改的卡,目前市面比较多得被用于小规模参数的大语言模型推理场景,被认为是性价比比3090还高的推理显卡。 对比显卡参数,3080 20G... ...

《AI工程》书介绍

博主头像 AI工程宝典,搞懂大模型应用的秘籍宝子们,今天来给大家安利一本超实用的AI工程书!这可不是那种花里胡哨的工具书,而是从根基上帮你搞懂大语言模型(LLMs)和大多模态模型(LMMs)在具体应用中的适配框架。从搭建AI应用的各种方案,到评估应用的优劣,甚至还能用AI来评估AI输出,这本书统统给你答案。比 ...

Cursor 2.0与Composer发布

博主头像 Cursor 2.0与Composer发布首先,Cursor2.0支持多智能体并行运行,最多可以同时运行八个智能体,再也不用担心文件冲突了。而且每个智能体都在自己独立的代码副本中运行,超安心!它的核心是全新的 Composer 编程模型,速度比同等级的模型快了整整四倍,简直是效率的飞跃!Compos ...

斯坦福大模型课CS336,硬核到让人怀疑人生?

博主头像 斯坦福CS336从头开始构建大模型 家人们,最近斯坦福的CS336课程火了,但好多同学却直呼“跟不上”“太硬核”!这门课的目标是引导学生从零开始开发自己的语言模型,听起来是不是就很厉害?它借鉴了操作系统课程的理念,让学生体验从数据收集、模型构建到训练评估的全过程。课程分5个单元、19门课,涵盖从To ...

AI辅助渗透测试小试牛刀

博主头像 传统的自动化渗透测试工具在过去几十年中已成为安全评估的标准组成部分。然而,这些工具的效能主要局限于已知漏洞的广泛扫描和配置检查,其内在的局限性也日益凸显。传统自动化工具本质上是确定性的,依赖于静态签名库和预定义的规则集来识别漏洞 。这种方法在面对需要上下文理解、创造性思维或业务逻辑分析的复杂场景时显 ...

手机AI“造反”了?你可能还不知道的四件大事儿

博主头像 哎,自打ChatGPT火了以后,咱们是不是都觉得云上的AI特牛?啥都能聊,啥都懂。但说实话,你用着不烦吗?网一卡就“正在连接”,老担心自己的聊天记录被泄露,而且没网就彻底抓瞎。不过你可能没注意,现在有场“革命”正悄悄发生——就是把特牛的AI,直接塞进你的手机里!这可不光是为了解决卡顿和隐私问题,它带 ...

AI在产品经理工作中的整合与应用解析

博主头像 导言:AI,现代企业的新核心协作者 人工智能(AI)正在经历一场深刻的范式转变,从过去执行特定任务的外围工具,演变为深度集成于业务流程、与人类原生协作的核心伙伴。本报告旨在深度剖析这一转型,将所提供的图表视为一张战略蓝图,该蓝图描绘了AI在六个关键业务职能中的应用与价值。本报告的核心论点是,现代AI ...

个人 Windows 电脑本地部署运行 DeepSeek 大模型

博主头像 1、大模型管理器 1.1、下载ollama 官网下载地址:https://ollama.com/download 如上图所示,下载 Windows 操作系统版本的 ollama 安装包。 1.2、安装ollama 如上图所示,以“管理员身份运行”安装包。 如上图所示,允许安装包对设备进行更改。 如上 ...

Google Skills免费开放啦

博主头像 家人们,AI圈的大事来啦!Google搞了个大动作,直接把内部的AI学习资源打包成“Google Skills”平台,向全球开放!这波操作直接把AI学习的门槛拉到超低,普通人也能轻松上车!免费用户直接用Google Cloud账号就能学,非Cloud用户花29刀就能月卡畅学。这个平台简直就是AI学习 ...

构建YouTube视频总结摘要智能体

博主头像 智能体 AI 平台 智能体 AI 框架是一个工具包,用于创建能够通过工具使用和记忆自主或半自主地推理、计划和采取行动的智能体系统。这些框架提供了创建能够与环境交互、做出决策和执行任务的智能体所需的结构。有几个流行的智能体 AI 平台,如 LangChain、CrewAI 和 Phidata。在本教程 ...

Search-R1论文浅析与代码实现

博主头像 GitHub: https://github.com/PeterGriffinJin/Search-R1 论文: link1, link2 Motivation 使用seach engine给reasoning LLM赋能 Method 在PPO的基础上,基于给定的Search Egine \(R\ ...

OpenAI Codex整合Z.ai GLM-4.6编程

博主头像 背景 OpenAI Codex 是一个由 OpenAI 开发的人工智能模型,它能够理解自然语言(比如中文、英文)指令,并将其实时翻译成可工作的计算机代码。简单来说,你用日常语言告诉它你想要实现什么功能,它就能为你写出代码。技术基础: Codex 是基于 OpenAI 的 GPT-3(生成式预训练变换 ...

DAPO代码实现浅析

博主头像 参考verl对dapo的实现,首先咱们看一下入口.sh和.py文件,在./recipe/dapo/文件夹中有以下目录 . ├── config │ ├── dapo_megatron_trainer.yaml │ └── dapo_trainer.yaml ├── dapo_ray_trainer. ...

DAPO浅析

博主头像 论文地址 https://arxiv.org/abs/2503.14476 参考实验:DAPO + vLLM v1 + VeRL —— VOC性能比较 Motivation 没有完整的GRPO训练R1-32B的框架 目标: 降低错误样本的长度 (token-level loss) 训练更加稳定 (o ...

DeepResearch代码浅析

博主头像 DeepResearch代码浅析 概述 代码:DeepResearch 主要看一下inference下面的ReAct推理流程。 inference ├── eval_data │ ├── example_with_file.jsonl │ ├── example.jsonl │ └── file_c ...

<1···789···29>