刷新
搭建一个大模型API服务

博主头像 搭建一个大模型API服务 本文将介绍如何使用SWIFT框架搭建一个大模型API服务,以方便后续做RAG、Agent的开发工作。 环境准备 基础环境 操作系统:Ubuntu 18.04.5 LTS (GNU/Linux 3.10.0-1127.el7.x86_64 x86_64) Anaconda3: ...

网购衣服经常不合身?试试这款虚拟服装试穿工具

博主头像 大家好,我是 Java陈序员。 可以说,现在网购已经完全融入到了我们的日常生活中。小到一根笔,大到一件衣服都能在网上买! 但是,我们在网上买衣服时,经常会因为衣服不合身而需要退换,这需要花费一定的成本。 今天,给大家介绍一款高度可控的虚拟服装试穿工具,可以让你在线体验衣服试穿的效果。 关注微信公众号 ...

无所不谈,百无禁忌,Win11本地部署无内容审查中文大语言模型CausalLM-14B

博主头像 目前流行的开源大语言模型大抵都会有内容审查机制,这并非是新鲜事,因为之前chat-gpt就曾经被“玩”坏过,如果没有内容审查,恶意用户可能通过精心设计的输入(prompt)来操纵LLM执行不当行为。内容审查可以帮助识别和过滤这些潜在的攻击,确保LLM按照既定的安全策略和道德标准运行。 但我们今天讨论 ...

【译】生成式人工智能 - 音频

博主头像 原作:马可·兰波尼 引言:在生成式人工智能领域,关注的焦点一直放在语言和图像上,但近期在音频领域也取得了许多进展。本文将为您介绍有关生成式音频模型的一切知识。 在过去的十年中,我们见证了人工智能驱动的音频生成技术取得了显著进步,包括音乐和语音合成。然而,直到最近,这些改进仍远远落后于图像和文本生成方 ...

Swift大模型微调以及批量推理验证

博主头像 微调 在深度学习和自然语言处理(NLP)领域,大规模语言模型如BERT、GPT-3等通过在大量数据上进行预训练获得了强大的语言理解和生成能力。这些预训练模型通常需要进行微调(Fine-tuning),以便在特定的下游任务上表现更好。微调可以采取不同的形式,包括full、LoRA和Q-LoRA。 Fu ...

多模态大模型总结

博主头像 Gemini、QWEN-VL、Yi-VL等模型都是多模态大模型,其中Gemini是闭源的,Pro 和 Max 版本需要微调;QWEN-VL是开源的,Pro 和 Max 版本需要微调,下一步测试效果;ChatGLM有Vision版本,但GLM4已经闭源;GPT4-Vision-Preview版本图片理... ...

开源大语言模型作为 LangChain 智能体

博主头像 概要 开源大型语言模型 (LLMs) 现已达到一种性能水平,使它们适合作为推动智能体工作流的推理引擎: Mixtral 甚至在我们的基准测试中 超过了 GPT-3.5,并且通过微调,其性能可以轻易的得到进一步增强。 引言 针对 因果语言建模 训练的大型语言模型 (LLMs) 可以处理广泛的任务,但它 ...

【译】为什么AI写作会显得枯燥无味

博主头像 原作:本·乌兰西 引子:绘画中减色混合的原理 照片由 Unsplash 上的 Lucas K 拍摄 当我还是个孩子的时候,我坐在一个有各种颜色的调色板前,努力尝试混合尽可能多的颜色。怀着兴奋的眼神,我看着鲜艳的颜色在画面上融合。随着越来越多的颜色相互融合,我困惑地盯着由此产生的聚合体。我添加的颜色越 ...

离线AI聊天清华大模型(ChatGLM3)本地搭建指南

博主头像 随着人工智能技术的飞速发展,聊天机器人成为了一个热门的研究领域。清华大学研发的ChatGLM3模型,作为其中的佼佼者,为开发者提供了强大的自然语言处理能力。本文将指导您如何在本地搭建ChatGLM3模型,实现离线AI聊天功能。 一、前置准备 在开始搭建之前,您需要准备以下物品: 一台性能良好的计算机 ...

【译】Lumiere,谷歌令人惊叹的视频突破

博主头像 原作:伊格纳西奥·德格雷戈里奥 引言:文本到视频的新境界 著名商学教授斯科特·加洛韦 (Scott Galloway) 打赌,2024 年将是谷歌的人工智能年。 现在看起来似乎正在成为现实。 今天,谷歌推出了 Lumiere,这是文本到视频领域的巨大突破,是当今生成人工智能中最艰巨的任务之一。而且就 ...

【译】关于推理、可解释性和 LLMs

博主头像 原作: 邓肯·安德森 引言:以下文章的主题我已经思考了很久,我希望能我的话能引起你的思考,并于一些更悲观的AI评论相均衡。推理和可解释性是充满细微差别的主题——我希望这篇文章能体现这一点。 去年 GPT-4 发布时,我注意到出现了一个特殊的议论:“可解释的人工智能”。 GPT-4 是第一个在推理领域 ...

句子嵌入: 交叉编码和重排序

博主头像 这个系列目的是揭开嵌入的神秘面纱,并展示如何在你的项目中使用它们。第一篇博客 介绍了如何使用和扩展开源嵌入模型,选择现有的模型,当前的评价方法,以及生态系统的发展状态。第二篇博客将会更一步深入嵌入并解释双向编码和交叉编码的区别。进一步我们将了解 检索和重排序 的理论。我们会构建一个工具,它可以来回答 ...

<1···2223