大模型 - 第24页 - 网站分类

RAG 技术深度解析：JBoltAI 如何构建企业级智能知识库

在企业数字化转型中，知识资产的高效利用成为核心竞争力。JBoltAI 通过RAG（检索增强生成）技术，构建了 “知识检索 - 语义理解 - 智能生成” 的闭环体系，帮助企业将海量非结构化数据转化为可行动的智能决策。本文以官网典型案例 —— 智能客服知识库系统为例，详解 RAG 技术的实现逻辑与行业价 ...

昇腾 msmodelslim w8a8量化代码解析

最近有很多朋友都在部署deepseek模型，而且都用到了模型量化这个功能，目的是减少显存占用、提升推理速度。上图是w8a8量化算法流程，主要包含4步： ①，使用昇腾 msmodelslim 仓库提供的量化接口对原始模型权重进行量化，生成int8格式的权重文件，以及后续在推理的时候要用到的激活值 ...

如何使用 OpenAI Agents SDK 构建 MCP

1.概述 OpenAI Agents SDK 现已支持 MCP（模型上下文协议），这是 AI 互操作性的重大变革。这使开发人员能够高效地将 AI 模型连接到外部工具和数据源。本篇博客，笔者将指导使用 OpenAI Agents SDK 构建 MCP 服务器，以增强你的 AI 应用程序。 2.内容 2 ...

基于Cline MCP实践FireCrawl

背景FireCrawl MCP是一款基于MCP协议的企业级网页爬虫服务器，由Mendable.ai开发，专为高级网页抓取设计。它整合了FireCrawl的网页抓取能力，通过MCP接口将强大的网络爬虫功能暴露给大型语言模型（LLM），如Claude、Grok、Cursor等，使智能体能够抓取网页、处理 ...

Midscene与Qwen-VL模式小试UI自动化

背景Midscene.js是一款由字节跳动Web Infra团队开发的开源、基于AI技术的UI自动化工具，其应用场景广泛且多样：1. 自动化测试功能测试：Midscene.js能够模拟用户操作，如点击按钮、输入文本等，对Web应用进行功能测试，确保应用在不同情况下都能稳定运行。冒烟测试：对于简单的站 ...

AI开发系列一：概念扫盲

大模型演变与概念人工智能人工智能是一个非常广泛的领域，涵盖了多种技术和方法，包括但不限于机器学习、自然语言处理、计算机视觉、专家系统、机器人学等。人工智能旨在创建能够模拟人类智能行为的系统或软件。它包括感知、推理、学习、决策和语言理解等多种能力，目标是让计算机能够像人类一样思考和行动。在人工 ...

让 LLM 既能“看”又能“推理”！

DeepSeek-R1 会推理，GPT-4o 会看。能否让 1 LLM既能看又能推理？ DeepSeek-R1取得很大成功，但它有个问题——无法处理图像输入。 1.1 DeepSeek模型发展自2024.12，DeepSeek已发布： DeepSeek-V3（2024.12）：视觉语言模型（VLM ...

常见的 AI 模型格式

来源：博客链接过去两年，开源 AI 社区一直在热烈讨论新 AI 模型的开发。每天都有越来越多的模型在 Hugging Face 上发布，并被用于实际应用中。然而，开发者在使用这些模型时面临的一个挑战是模型格式的多样性。在本文中，我们将探讨当下常见的 AI 模型格式，包括： GGUF PyTorc ...

vue3-webseek网页版AI问答|Vite6+DeepSeek+Arco流式ai聊天打字效果

2025 AI实战vue3+deepseek+arcoDesign仿DeepSeek/豆包网页版AI聊天助手。 vue3-web-deepseek 实战网页PC版智能AI对话，基于vite6+vue3.5+openAI对接DeepSeek-Chat聊天对话模型。实现流动式打字返回效果、支持亮色+暗黑 ...

基于Python程序访问本地部署的DeepSeek和硅基流动DeepSeek API

前排提醒： 1. 本地通过Ollama部署DeepSeek，部署版本为 deepseek-r1:1.5b，若还未进行本地部署，可以参考博客Windows系统上使用Ollama本地部署DeepSeek 2. 线上API使用的是硅基流动（siliconflow）的DeepSeek API，模型名称为 d ...

在HTML页面通过JavaScript访问DeepSeek-R1（使用硅基流动Api）

前排提醒： 1. 操作系统为Windows11 2. DeepSeek使用的是硅基流动（siliconflow）的API，模型名称为 deepseek-ai/DeepSeek-R1 第一步：在硅基流动官网的API密钥菜单（ https://cloud.siliconflow.cn/account/ ...

在HTML页面通过JavaScript访问Ollama本地部署的DeepSeek

在HTML页面通过JavaScript访问Ollama本地部署的DeepSeek，顺便解决了 HTML 页面调用 Ollama 服务的跨域问题 ...

【调研】Vision Language Model Safety

Adversarial Attacks White-box Attacks Task-specific Attacks 的目标是针对某个具体的任务（如图像描述生成、指代表达理解等），通过精心设计的对抗样本，使得模型在该任务上产生错误的输出。例如，攻击者可能希望模型生成错误的图像描述，或者在对图像进行 ...

知识蒸馏实战

蒸馏实战小实验本实验相关代码已开源至github 失败经历爱爱医数据蒸馏Qwen2.5-7B 1.用爬虫在爱爱医网站爬取1k条数据。（刚学一点爬虫，不会越过验证码，还是自己一次一次验证） 2.数据格式预处理，例如： { "instruction": "你需要基于我提供的患者病历，推理并生成完 ...

Windows系统上使用Ollama本地部署DeepSeek

前排提醒： 1. 操作系统为Windows11 2. 受限于硬件资源，本地部署的DeepSeek为DeepSeek-R1 14B Ollama安装第一步：打开浏览器，在地址栏输入网址：https://ollama.com/ ，进入Ollama官网第二步：点击上图中的“Download”按钮， ...

解密prompt系列51. R1实验的一些细节讨论

DeepSeek R1出来后业界都在争相复现R1的效果，这一章我们介绍两个复现项目SimpleRL和LogicRL，还有研究模型推理能力的Cognitive Behaviour，项目在复现R1的同时还针对R1训练策略中的几个关键点进行了讨论和消融实验，包括 ...

大模型推理能力的局限性

0 前言 LLM凭借其生成连贯文本、翻译语言甚至进行对话的能力，彻底改变人工智能领域。然而，尽管这些模型表现出色，它们在推理和理解复杂上下文方面仍然面临重大挑战。这些模型擅长识别并模仿训练数据中的模式，但当任务需要真正的理解和逻辑推理时，它们往往遇困。可能导致：长对话中的不一致难以关联分散的信 ...

MCP：AI 时代的工具接口标准？

0 前言自从 OpenAI 在 2023 年推出函数调用（Function Calling），我一直思考，咋能真正解锁 AI Agent与工具的生态系统。随基础模型越来越智能，AI Agent与外部工具、数据和 API 的交互方式却变得越来越碎片化——开发者需针对每一个系统单独编写业务逻辑，让Ag ...

基于LLM的业务流程图评审

背景产品经理绘制业务流程图，是梳理业务需求、明确业务逻辑、推动跨部门协作的核心工作之一。其核心是通过可视化方式，将复杂的业务场景拆解为清晰、有序的步骤，确保产品设计与实际业务目标对齐。以下是关键点解析：业务流程图的核心目的需求具象化：将抽象的业务需求转化为可落地的步骤（如“用户下单”需拆解为浏览商 ...

一步一步教你部署ktransformers，大内存单显卡用上Deepseek-R1

环境准备硬件环境 CPU：intel四代至强及以上，AMD参考同时期产品内存：800GB以上，内存性能越强越好，建议DDR5起步显卡：Nvidia显卡，单卡显存至少24GB（用T4-16GB显卡实测会在加载模型过程中爆显存），nvidia compute capability至少8.0（CUD ...