刷新
如何在本地使用AI检索增强生成(RAG)

博主头像 在这篇博文中,我们将探讨如何使用检索增强生成(RAG)来构建更有效、更吸引人的对话式人工智能应用程序。我们将介绍 RAG 的基础知识及其优势,并逐步说明如何开发自己的 RAG 机制供本地使用。什么是 RAG? RAG(基于强化的生成)结合了自然语言处理(NLP)领域两种著名方法的优势:基于检索的模型 ...

您应该了解的三大LLM框架

博主头像 您应该了解的三大LLM框架LM 领域出现了很多库和框架。对于开发人员来说,要跟踪并为您的 LLM 项目选择最合适的库和框架是一件非常困难的事情。在本文中,我们将深入探讨整个生产 LLM 工作流程,重点介绍并批评这些技术:Unsloth.ai(用于微调)AdalFlow(用于预生产和优化)vLLM(用 ...

使用Spring AI和LLM生成Java测试代码

博主头像 背景 AIDocumentLibraryChat 项目已扩展至生成测试代码(Java 代码已通过测试)。该项目可为公开的 Github 项目生成测试代码。只需提供要测试的类的网址,该类就会被加载、分析导入,项目中的依赖类也会被加载。这样,LLM 就有机会在为测试生成模拟时考虑导入的源类。可以提供 t ...

7种大模型风险及API 管理应对策略

博主头像 概况:大模型(LLM)的发展带来的技术红利,以及企业业务逐渐向AI转型,LLM 常见的安全漏洞、网络攻击手段变化已经成为企业要迫切关注的问题,本文来探讨一下,如何通过 API 管理策略有效防范LLM的风险。 近年来,随着大型语言模型技术的迅猛发展,各行各业对AI 应用或者业务与AI的结合的热情不断高 ...

RAG系统架构介绍

博主头像 让我们直奔主题: 检索增强一代Retrieval-Augmented Generation(RAG)系统正在重塑我们处理人工智能驱动的信息的方式。作为架构师,我们需要了解这些系统的基本原理,才能有效利用它们的潜力。 什么是 RAG? RAG 系统的核心是通过将 LLM 与外部知识源整合,增强 LLM ...

Redis Quicklist 竟让内存占用狂降50%?

博主头像 0 引言 Redis 作为一种高效的内存型键值数据库,得益于其底层数据结构的精妙设计。对于 List 类型的数据,Redis 从早期的简单链表(linkedlist),到压缩列表(ziplist),再到如今的 quicklist 和 listpack,不断优化以平衡内存利用率和性能。这篇文章将深入剖 ...

MariaDB 矢量版-专为人工智能设计

博主头像 作为一名在关系型数据库系统领域拥有二十多年经验的解决方案架构师,我最近开始探索 MariaDB 的新矢量版,看看它能否解决我们面临的一些人工智能数据挑战。快速浏览一下似乎很有说服力,尤其是它如何将人工智能的魔力直接带入常规数据库设置中。不过,想通过一个简单的用例对它进行测试,看看它的实际表现如何。在 ...

别再用老旧架构了!单元化构建超强弹性和容错系统!

博主头像 0 关键收获 单元化架构提高了微服务的弹性和容错性。 可观察性对于开发和运营单元化架构至关重要。 单元路由器是单元基础架构的关键组件,它需要快速响应单元可用性和健康变化。 要成功采用单元化架构,需要全面和综合的方法来实现可观察性。 单元化架构利用与微服务相同的可观察性支柱,但需要定制以适应这种架构特 ...

单元化架构,分布式系统的新王!

博主头像 0 关键收获 单元化架构通过减少故障的爆炸半径来增加系统弹性 单元化架构是那些任何停机时间都被认为是不可接受的,或者可以显著影响最终用户的系统的一个好选择 单元化架构通过强制使用固定大小的单元作为部署单元,并倾向于扩展而不是扩展的方法,增强了微服务的可伸缩性模型 单元化架构通过将各种组件(可能是微服 ...

LLM与Gamma.ai与Napkin的PPT制作

博主头像 LLM与Gamma.ai与Napkin的PPT制作Chagpt/Claude/LLM + Gamma + Napkin 的组合好用到爆炸,制作一个分享的 PPT 就只需要几十分钟。 Gamma.aiGamma.ai平台具有一系列显著的特点,这些特点使得它在PPT制作、内容创作以及数据分析等方面表现出 ...

Java21虚拟线程:我的锁去哪儿了?

博主头像 0 前言 最近的文章中,我们详细介绍了当我们迁移到 Java 21 并将代际 ZGC 作为默认垃圾收集器时,我们的工作负载是如何受益的。虚拟线程是我们在这次迁移中兴奋采用的另一个特性。 对虚拟线程新手,它们被描述为“轻量级线程,大大减少编写、维护和观察高吞吐量并发应用程序的工作量。”威力来自在阻塞操 ...

基于扣子AI智能体生成双语播客

博主头像 一、扣子AI智能体简介在扣子平台,用户可以通过零代码或低代码的方式快速搭建基于AI大模型的各类智能体应用(被称为Bot),并将它们部署到其他网站平台上,也可以通过API将扣子平台的智能体与现有系统集成。这些智能体可以是各种类型的聊天机器人,不仅限于简单的对话功能。通过扣子的插件、工作流等机制,它们还 ...

<1···101112···24>