刷新
DeepSeek-R1源码解读

最近和开发者做了很多DeepSeek-R1模型相关的推理项目,这两天抽时间把hugging face上面的源码拉下来仔细看了一遍,在这里做一个分享。主要是解析MOE部分的代码,包括EP并行的代码实现。 整体结构 查看hugging face上面的modeling_deepseek.py文件和conf ...

大模型VS小模型:论国产数据库运维AI Agent的正确打开方式

博主头像 作者:孙鹏,大衍(北京)科技有限公司研发工程师 首先为大家推荐这个 OceanBase 开源负责人老纪的公众号 “老纪的技术唠嗑局”,会持续更新和 #数据库、#AI、#技术架构 相关的各种技术内容。欢迎感兴趣的朋友们关注! 暴论:通用满血大模型“不适合”用于赋能国产数据库智能诊断运维 在传统数据库运 ...

基于Trae编写文章实践

博主头像 自动补全编写段落# 实习生教学编程## AI编程 在过去,实习生们需要花费大量时间和精力来完成编程任务,这不仅浪费了他们的时间,也给他们的工作带来了压力。为了解决这个问题,我们开发了一个名为“AI编程”的工具,它可以帮助实习生们更高效地完成编程任务。我们先指导实习生们编写代码,然后再使用AI编程工具 ...

基于DeepSeek V3实现前端HTML5转换Vue.js工程实践

博主头像 背景以下是基于DeepSeek v3 0324版本实现前端HTML5转换Vue.js工程实践使用 Trae IDE编辑,之前Html是基于Readdy.ai生成,原始输入是UI设计图结论 我们基于Trae成功转换html到Vue.js工程。更多意义是:一、技术架构升级价值组件化开发范式跃迁Vue.j ...

如何分辨大模型的好坏?

博主头像 分辨大模型的好坏是一个多维度的问题,需要从技术能力、实际效果、安全性、成本和应用适配性等多个角度综合考量。以下是一些关键的评估维度和方法: 一、核心能力维度 1、基础能力: 语言理解与生成: 流畅度、语法准确性、上下文连贯性、能否理解复杂指令和隐含信息? 知识覆盖与准确性: 知识广度(涵盖多少领域? ...

AI 聊天应用的 10 条高级需求

博主头像 最新动态 GitHub 开源: https://github.com/experdot/pointer [MIT] 在深度使用了一段时间 Web 端和桌面端的 LLM 聊天工具后,我发现它们的用户体验普遍还有很大的提升空间。 下面是我总结的 10 个核心改进点。 1. 全局检索(Global Sea ...

华为Ascend 910B部署Qwen2.5-VL-32B方案

博主头像 华为Ascend 910B部署Qwen2.5-VL-32B方案 目录一、多模态大模型——Qwen2.5-VL-32B1.1 简介1.2 显存测算1.2.1 Model Memory Calculator工具测算1.2.2 按模型参数量一般测算1.3 算力测算1.3.1 单 Token 理论计算量估算 ...

MCP应用场景供应链介绍

博主头像 MCP应用场景供应链介绍概要流程流程图mermaid代码graph TDA[SAP ERP] -->|库存数据| B((MCP 数据中台))C[Salesforce CRM] -->|订单数据| BD[IoT 设备] -->|物流追踪数据| BB -->|整合数据| E[(AI 决策模型)]E -- ...

将你的Dify应用转为MCP服务器

博主头像 本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续! 魔都架构师 | 全网30W技术追随者 大厂分布式系统/数据中台实战专家 主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者 以技术驱动创新,我们的征途是改变世 ...

基于DeepSeek生成互联网女皇最新AI报告2025

博主头像 "你不会因为AI而失业,但会因为使用AI的人而失业。AI是历史上最易于使用的技术之一,它使那些不懂编程的人也能'编程'。"- Jensen Huang, NVIDIA CEO"AI是一个思维伙伴、深度研究员、评论家、导师和结对程序员。这是我职业生涯中工作方式变化最快的转变。"- Shopify CE ...

<1···171819···29>