Fork me on GitHub

04 2025 档案

摘要:今日凌晨,通义千问团队正式开源了 Qwen3 大模型,并且一口气发布了 8 个型号,其中包括 0.6B、1.7B、4B、8B、14B、32B 以及 30B-A3B 和 235B-A22B,使用者可以根据自己的业务情况,选择合适的版本进行使用。 更让人惊喜的是,最新的 Qwen3 系列模型具备双模推理 阅读全文
posted @ 2025-04-29 16:42 磊哥|www.javacn.site 阅读(1388) 评论(0) 推荐(0)
摘要:向量数据库是大模型应用开发必备组件之一,因为它在知识库、语义搜索、检索增强生成(RAG)等人工智能应用中发挥着举足轻重的作用。但向量数据有很多,为什么要使用 Milvus 呢? 常见向量数据 常见的向量数据库有以下这些: Chroma Elasticsearch Milvus Neo4j OpenS 阅读全文
posted @ 2025-04-25 16:34 磊哥|www.javacn.site 阅读(1812) 评论(0) 推荐(1)
摘要:简单来说,“向量”Vector 是大模型(LLM)在搜索时使用的一种“技术手段”,通过向量比对,大模型能找出问题的相关答案,并且进行智能回答。 向量简介 Vector 是向量或矢量的意思,向量是数学里的概念,而矢量是物理里的概念,但二者描述的是同一件事。 定义:向量是用于表示具有大小和方向的量。 向 阅读全文
posted @ 2025-04-24 11:28 磊哥|www.javacn.site 阅读(404) 评论(0) 推荐(0)
摘要:在 Spring AI 中,流式输出(Streaming Output)是一种逐步返回 AI 模型生成结果的技术,允许服务器将响应内容分批次实时传输给客户端,而不是等待全部内容生成完毕后再一次性返回。 这种机制能显著提升用户体验,尤其适用于大模型响应较慢的场景(如生成长文本或复杂推理结果)。 技术实 阅读全文
posted @ 2025-04-23 17:03 磊哥|www.javacn.site 阅读(1437) 评论(0) 推荐(2)
摘要:最近在深度体验和使用 Spring AI 和 LangChain4j,从开始的满怀期待五五开,但最后极具痛苦的使用 LangChain4j,让我真正体验到了正规军和草台班子的区别。 Spring AI VS LangChain4j Spring AI:使用简单、写法优雅、但功能提供的较少、成熟度稍高 阅读全文
posted @ 2025-04-21 16:01 磊哥|www.javacn.site 阅读(1319) 评论(1) 推荐(4)
摘要:昨天晚上直播,我们用 RAG(Retrieval-Augmented Generation,检索增强生成)实现了数据库 AI 助手,今天我们准备换一个技术使用 function call 来实现快递 AI 助手。 执行效果 快递 AI 助手的业务逻辑很清晰,就是我通过 LLM 大语言模型的对话来查询 阅读全文
posted @ 2025-04-17 16:22 磊哥|www.javacn.site 阅读(631) 评论(0) 推荐(0)
摘要:Spring AI 前两天(4.10 日)更新了 1.0.0-M7 版本后,原来的 SimpleVectorStore 内存级别的向量数据库就不能用了,Spring AI 将其全部源码删除了。 此时我们就需要一种成本更低的解决方案来解决这个问题,如何解决呢?我们一起来看。 解决方案:Redis 向量 阅读全文
posted @ 2025-04-16 16:05 磊哥|www.javacn.site 阅读(1063) 评论(0) 推荐(0)
摘要:不知道大家有没有发现?对于添加到 MCP 服务市场的成千上万个 MCP 服务(而且这个数字每天还在增加),我们可以不写一行代码,轻松实现调用,但背后的原因究竟是啥呢? MCP 虽然用起来很方便,但搞不懂背后的实现原理,总感觉这个知识点还没完全掌握,所以接下来,我们一起来看它的实现原理。 从某个 MC 阅读全文
posted @ 2025-04-11 16:33 磊哥|www.javacn.site 阅读(1900) 评论(0) 推荐(1)
摘要:提示词(Prompt)是输入给大模型(LLM)的文本指令,用于明确地告诉大模型你想要解决的问题或完成的任务,也是大语言模型理解用户需求并生成准确答案的基础。因此 prompt 使用的好坏,直接决定了大模型生成结果的质量(是否符合预期)。 Prompt 基本使用 为了让大模型生成更符合预期的结果,我们 阅读全文
posted @ 2025-04-02 16:50 磊哥|www.javacn.site 阅读(1437) 评论(0) 推荐(0)
摘要:嵌入模型(Embedding Model)和向量数据库(Vector Database/Vector Store)是一对亲密无间的合作伙伴,也是 AI 技术栈中紧密关联的两大核心组件,两者的协同作用构成了现代语义搜索、推荐系统和 RAG(Retrieval Augmented Generation, 阅读全文
posted @ 2025-04-01 16:36 磊哥|www.javacn.site 阅读(1031) 评论(0) 推荐(0)