work hard work smart

专注于AI+Java后端开发。 不断总结,举一反三。
  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理
1 2 3 4 5 ··· 60 下一页

2026年6月25日

摘要: OpenEvals 快速入门:LLM 评估指南 什么是 OpenEvals? OpenEvals 是一个轻量级的 LLM 评估框架,使用 LLM 作为裁判(LLM-as-a-Judge)来评估模型输出质量。 特点: 开源免费 简单易用 内置多种评估提示词 支持自定义评估 安装 pip install 阅读全文

posted @ 2026-06-25 17:05 work hard work smart 阅读(6) 评论(0) 推荐(0)

摘要: DeepEval 快速入门:LLM 应用评估指南 什么是 DeepEval? DeepEval 是一个开源的 LLM 评估框架,用于测试和评估大语言模型应用的质量。它提供多种内置评估指标,支持自定义评估标准。 特点: 开源免费 安装简单 内置丰富评估指标 支持自定义评估 安装 pip install 阅读全文

posted @ 2026-06-25 16:12 work hard work smart 阅读(8) 评论(0) 推荐(0)

摘要: LangSmith 批量评估完全指南 什么是 LangSmith 批量评估? LangSmith 批量评估是 LangChain 生态系统的核心功能,用于自动化、规模化地测试和评估 LLM 应用的性能。 核心概念 将多个测试用例组织成数据集,自动化运行测试,并使用预定义的评估器对结果进行多维度打分。 阅读全文

posted @ 2026-06-25 15:52 work hard work smart 阅读(3) 评论(0) 推荐(0)

摘要: Qwen-Agent 入门指南:快速构建智能体应用 什么是 Qwen-Agent? Qwen-Agent 是阿里云通义千问团队开发的智能体开发框架,专门用于快速构建基于大语言模型的 AI 智能体(Agent)应用。它提供了开箱即用的组件和工具,让开发者能够轻松实现对话系统、工具调用、GUI 界面等功 阅读全文

posted @ 2026-06-25 11:04 work hard work smart 阅读(10) 评论(0) 推荐(0)

2026年6月24日

摘要: LangSmith 集成实战:从追踪到评估的完整指南 本文以一个基于 LangGraph 构建的多步骤 Agent 为案例,完整演示如何在 LLM 应用中集成 LangSmith,覆盖追踪调试、测试数据集构建、自动化评估、OpenEvals 评估器对接等全流程。 一、LangSmith 是什么? L 阅读全文

posted @ 2026-06-24 22:50 work hard work smart 阅读(19) 评论(0) 推荐(0)

2026年6月21日

摘要: 初识 go-zero:一款让你写后端更规范、更高效的 Go 微服务框架 前言 在 Go 语言的后端开发领域,提到 Web 框架,很多人第一个想到的是 Gin。Gin 轻量、简洁、性能好,非常适合快速搭建 API 服务。但当你从个人项目进入团队协作,或者从单服务走向微服务架构时,你会发现光有路由和中间 阅读全文

posted @ 2026-06-21 20:15 work hard work smart 阅读(18) 评论(0) 推荐(0)

2026年6月20日

摘要: RAG 中为什么需要 Rerank,以及如何使用 Rerank 在 RAG 应用中,很多人会把重点放在向量检索、全文检索、Embedding 模型和向量数据库上。 这些确实很重要,但在真实问答场景中,仅仅把相关文档“召回”出来还不够。因为召回结果里面经常会有一些看起来相关、但并不真正适合回答当前问题 阅读全文

posted @ 2026-06-20 17:54 work hard work smart 阅读(12) 评论(0) 推荐(0)

摘要: LangChain4j RAG 核心组件与组合方式 在使用 LangChain4j 构建 RAG 应用时,经常会看到一组组件名,比如 RetrievalAugmentor、QueryTransformer、QueryRouter、ContentRetriever、ContentAggregator、 阅读全文

posted @ 2026-06-20 15:28 work hard work smart 阅读(11) 评论(0) 推荐(0)

摘要: Elasticsearch 具有全文检索能力和向量检索能力。全文检索适合解决“关键词匹配、分词、相关性排序”的问题,向量检索适合解决“语义相似、意思接近但表达不同”的问题。 在实际的 AI 应用,尤其是 RAG 知识库场景中,这两种检索方式通常不会孤立使用,而是会组合起来使用: 全文检索:找到和用户 阅读全文

posted @ 2026-06-20 15:08 work hard work smart 阅读(10) 评论(0) 推荐(0)

2026年6月19日

摘要: MinerU Docker 部署指南(RAG 场景) 本文面向 RAG 系统开发者,介绍为何 MinerU 是理想的文档解析引擎,并重点讲解 Docker 部署中的关键配置改动(特别是 CUDA 版本适配问题)。本文仅涵盖安装部署,不涉及 RAG 使用细节。 一、为什么 RAG 需要 MinerU? 阅读全文

posted @ 2026-06-19 10:09 work hard work smart 阅读(19) 评论(0) 推荐(0)

2026年6月10日

摘要: 还在为 pip 命令报错而烦恼?一行 py -m pip 轻松绕过环境变量,让 Cline 立刻拥有实时天气查询能力。 为什么要用 MCP? MCP(Model Context Protocol)让 AI 助手(比如 Cline)能够直接调用外部工具——查天气、搜新闻、读写文件都不在话下。而配置一个 阅读全文

posted @ 2026-06-10 23:21 work hard work smart 阅读(24) 评论(0) 推荐(0)

2026年6月8日

摘要: 一、为什么需要图数据库? 关系型数据库通过外键和 JOIN 完全可以表达实体之间的关系,比如"作者-书籍"用一张中间表就能搞定。那为什么还要引入图数据库? 核心差异在于查询的简洁性和多层关系遍历的效率: 简单关系(如"某作者写了哪些书"):关系型数据库 JOIN 一下就行,图数据库没有明显优势 多层 阅读全文

posted @ 2026-06-08 18:05 work hard work smart 阅读(26) 评论(0) 推荐(0)

2026年6月5日

摘要: 本文以一个完整的代码示例,演示如何在 LangChain / LangGraph 项目中集成 LangFuse,实现对 LLM 调用的可观测性。全文不讲空泛理论,只看代码和效果。 一、为什么要用 LangFuse? 当你把 LLM 应用从 Demo 推向生产,一定会遇到这几个问题: 一次用户请求,L 阅读全文

posted @ 2026-06-05 14:28 work hard work smart 阅读(140) 评论(0) 推荐(0)

2026年6月1日

摘要: 摘要:大语言模型只能聊天不能做事?Function Call 技术让大模型能够调用外部函数、执行实际操作。本文深度解析其核心原理、两种实现方式和生产实践。 一、痛点:大模型的"残疾"困境 场景重现 假设你问 AI:"订单 20240115001 现在到哪了?" 传统模型的局限:无法访问外部系统,只能 阅读全文

posted @ 2026-06-01 22:17 work hard work smart 阅读(25) 评论(0) 推荐(0)

摘要: 摘要:在实际项目中,提示词(Prompt)往往冗长复杂且频繁调整。本文基于真实项目代码,深入讲解 Spring AI 的 PromptTemplate 机制,从基础变量替换到外部文件加载,全面掌握提示词模板的最佳实践。 一、为什么需要提示词模板? 硬编码提示词的痛点 在实际开发中,我们经常看到这样的 阅读全文

posted @ 2026-06-01 21:32 work hard work smart 阅读(48) 评论(0) 推荐(0)

2026年5月31日

摘要: 摘要:LangChain4j 是 Java 生态中最流行的大语言模型开发框架。本文从零开始讲解 LangChain4j 的核心概念、两种使用方式(低级 API 和高级 AI Service),涵盖对话管理、流式输出、结构化输出、工具调用等核心功能,帮助 Java 开发者快速上手 AI 应用开发。 一 阅读全文

posted @ 2026-05-31 21:13 work hard work smart 阅读(70) 评论(0) 推荐(0)

摘要: 摘要:多轮对话是大模型应用的核心需求。本文讲解 Spring AI 如何通过 ChatMemory 和 Advisor 机制实现对话短期记忆,并支持 JDBC 持久化。内容包含:短期记忆概念、Advisor 原理、内存/JDBC 两种实现、生产环境配置。 一、什么是短期记忆? 短期记忆(Short- 阅读全文

posted @ 2026-05-31 16:38 work hard work smart 阅读(36) 评论(0) 推荐(0)

2026年5月30日

摘要: 摘要:提示词工程(Prompt Engineering)是发挥大模型能力的关键技术。本文结合实际项目代码,系统讲解 Spring AI 中提示词工程的四大核心策略:角色设定、少样本学习、结构化输出和思维链推理。 一、什么是提示词工程? 提示词工程是通过精心设计的提示词(Prompt),引导大模型输出 阅读全文

posted @ 2026-05-30 22:32 work hard work smart 阅读(35) 评论(0) 推荐(0)

摘要: 摘要:ChatClient 是 Spring AI 提供的高级 API,通过链式调用和 Builder 模式,让大模型调用变得更加优雅和灵活。本文结合实际项目代码,全面讲解 ChatClient 的使用技巧和最佳实践。 一、为什么需要 ChatClient? 在使用 Spring AI 开发大模型应 阅读全文

posted @ 2026-05-30 22:07 work hard work smart 阅读(36) 评论(0) 推荐(0)

摘要: 摘要:本文详细介绍如何在 Spring Boot 项目中集成 Spring AI 和 Spring AI Alibaba,使用 DashScopeChatModel 调用通义千问等大模型,实现对话和流式输出功能。 一、什么是 DashScope? DashScope(灵积模型服务)是阿里云推出的大模 阅读全文

posted @ 2026-05-30 21:52 work hard work smart 阅读(150) 评论(0) 推荐(0)

1 2 3 4 5 ··· 60 下一页