大模型 - 第18页 - 网站分类

大模型的“Tomcat”：一文读懂AI推理引擎（Inference Engine)

本文已收录在Github，关注我，紧跟本系列专栏文章，咱们下篇再续！魔都架构师 | 全网30W技术追随者大厂分布式系统/数据中台实战专家主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者以技术驱动创新，我们的征途是改变世 ...

Manus AI 实现PDF简历转换为HTML

Manus AI 实现PDF简历转换为HTML 背景 Manus AI是由中国团队Monica.im开发的全球首款通用型AI Agent（智能体），其诞生标志着人工智能从“对话式工具”向“自主执行者”的跨越式进化。这款产品自2025年3月发布以来，凭借“端到端任务闭环”“多智能体协同”“商业化成本优 ...

基于大模型SSE的HTTP API接口测试与评估

背景裁判模型是专用于评估智能体输出质量的辅助模型，该模型在评测中充当裁判员的角色，对评测对象输出的生成结果进行质量评估，并根据评测规则对每一条回复进行打分。裁判模型也可以评测主观问题和开放性问题，只需要用户 Query 和模型回复，即可自动对评测对象的表现进行质量评估与评价，无需人工标注，流程高度 ...

veRL代码阅读-2.Ray

看VeRL代码之前发现代码里主要使用了ray框架来进行调度和通信. 所以先对ray进行初步学习, 后续有空闲时间再细看下Ray的代码. 框架原理构成架构图如下, ray里主要分为系统层面的layer和应用层的layer. 系统层layer: GCS(Global Control Store): ...

大模型推理显存和计算量估计方法

最近做吞吐量调试涉及到输入batch_size的设置，为了把算力和显存用起来，同时不触发out of memory，需要提前估计大模型推理过程中的显存占用，我参考了MindIE官网的这个文档完成了估计：https://www.hiascend.com/document/detail/zh/mindi ...

[开源自荐]iChat(AI Chat) 开源的智能聊天工具，支持MiMo、DeepSeek 、Gemini、Grok、OpenAI、ZenMux、OpenRouter、Cloudflare（AI Gateway) 和自定义AI

[中文]｜[English] iChat 是一款开源的智能聊天工具，支持 MiMo、DeepSeek 、Gemini、Grok、OpenAI、ZenMux、OpenRouter、Cloudflare（AI Gateway）和自定义AI，使用 SwiftUI 开发，macOS 原生 AI 客服端开发 ...

电商行业商品标题分词实践

背景词根是一个关键词里面最小的组合单位，不能再被进行任何拆分的一些属性词、名词等。所有关键词都是由词根组合而来的，但有些词本身就是一个关键词。商品标题拆词词根算法是电商领域优化搜索流量、提升标题效率的核心技术。其核心逻辑是通过自然语言处理（NLP）技术将标题拆解为最小不可分割的语义单元（词根），并 ...

DeepSeek-R1源码解读

最近和开发者做了很多DeepSeek-R1模型相关的推理项目，这两天抽时间把hugging face上面的源码拉下来仔细看了一遍，在这里做一个分享。主要是解析MOE部分的代码，包括EP并行的代码实现。整体结构查看hugging face上面的modeling_deepseek.py文件和conf ...

大模型VS小模型：论国产数据库运维AI Agent的正确打开方式

作者：孙鹏，大衍（北京）科技有限公司研发工程师首先为大家推荐这个 OceanBase 开源负责人老纪的公众号 “老纪的技术唠嗑局”，会持续更新和 #数据库、#AI、#技术架构相关的各种技术内容。欢迎感兴趣的朋友们关注！暴论：通用满血大模型“不适合”用于赋能国产数据库智能诊断运维在传统数据库运 ...

nanoVLM: 最简洁、最轻量的纯 PyTorch 视觉-语言模型训练代码库

nanoVLM 是使用纯 PyTorch 训练你自己的视觉语言模型 (VLM) 的最简单方式。它是一个轻量级工具包，让你可以在免费的 Colab Notebook 上启动 VLM 训练。我们受到了 Andrej Karpathy 的 nanoGPT 的启发，为视觉领域提供了一个类似的项 ...

别再裸写 parseFrom() 了！这才是 MQTT + Protobuf 消费的正确姿势！

本文已收录在Github，关注我，紧跟本系列专栏文章，咱们下篇再续！魔都架构师 | 全网30W技术追随者大厂分布式系统/数据中台实战专家主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者以技术驱动创新，我们的征途是改变世 ...

基于Trae编写文章实践

自动补全编写段落# 实习生教学编程## AI编程在过去，实习生们需要花费大量时间和精力来完成编程任务，这不仅浪费了他们的时间，也给他们的工作带来了压力。为了解决这个问题，我们开发了一个名为“AI编程”的工具，它可以帮助实习生们更高效地完成编程任务。我们先指导实习生们编写代码，然后再使用AI编程工具 ...

基于DeepSeek V3实现前端HTML5转换Vue.js工程实践

背景以下是基于DeepSeek v3 0324版本实现前端HTML5转换Vue.js工程实践使用 Trae IDE编辑，之前Html是基于Readdy.ai生成，原始输入是UI设计图结论我们基于Trae成功转换html到Vue.js工程。更多意义是：一、技术架构升级价值组件化开发范式跃迁Vue.j ...

解决 Maven os.detected.classifier 报错：快速修复指南

本文已收录在Github，关注我，紧跟本系列专栏文章，咱们下篇再续！魔都架构师 | 全网30W技术追随者大厂分布式系统/数据中台实战专家主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者以技术驱动创新，我们的征途是改变世 ...

解锁 ChatGPT 超能力：全新「记忆」功能深度解析！

本文已收录在Github，关注我，紧跟本系列专栏文章，咱们下篇再续！魔都架构师 | 全网30W技术追随者大厂分布式系统/数据中台实战专家主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者以技术驱动创新，我们的征途是改变世 ...

如何分辨大模型的好坏？

分辨大模型的好坏是一个多维度的问题，需要从技术能力、实际效果、安全性、成本和应用适配性等多个角度综合考量。以下是一些关键的评估维度和方法：一、核心能力维度 1、基础能力：语言理解与生成：流畅度、语法准确性、上下文连贯性、能否理解复杂指令和隐含信息？知识覆盖与准确性：知识广度（涵盖多少领域？ ...

谷歌官宣的A2A协议为啥能让智能体学会“团队合作”？

本文已收录在Github，关注我，紧跟本系列专栏文章，咱们下篇再续！魔都架构师 | 全网30W技术追随者大厂分布式系统/数据中台实战专家主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者以技术驱动创新，我们的征途是改变世 ...

AI 聊天应用的 10 条高级需求

最新动态 GitHub 开源: https://github.com/experdot/pointer [MIT] 前言过去一段时间，我较为深入地使用了多款 Web 端和桌面端的大语言模型聊天工具。在日常使用中，我逐渐意识到，这些工具在基础的问答能力上已经做得不错，但在围绕对话本身的管理、组织和流 ...

华为Ascend 910B部署Qwen2.5-VL-32B方案

华为Ascend 910B部署Qwen2.5-VL-32B方案目录一、多模态大模型——Qwen2.5-VL-32B1.1 简介1.2 显存测算1.2.1 Model Memory Calculator工具测算1.2.2 按模型参数量一般测算1.3 算力测算1.3.1 单 Token 理论计算量估算 ...

Invalid context structure解决Dify框架中图像推理错误：一步步排查与修复指南

本文已收录在Github，关注我，紧跟本系列专栏文章，咱们下篇再续！魔都架构师 | 全网30W技术追随者大厂分布式系统/数据中台实战专家主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者以技术驱动创新，我们的征途是改变世 ...