Fork me on GitHub
摘要: 最近的一项研究广泛探讨了小语言模型(slm)在现代 AI 中的作用。该研究对 slm 进行了全面分析,重点关注其功能、应用和潜在优势,特别是与大型模型相比。本研究强调了 slm 在需要效率和可解释性的领域中的重要性,同时也讨论了它们在大型模型可能不实用的特定任务中的相关性。 最近的一项研究通过两个视 阅读全文
posted @ 2024-09-28 22:50 石头木 阅读(56) 评论(0) 推荐(0) 编辑
摘要: 关于小语言模型 小语言模型(slm)是为在桌面、智能手机和可穿戴设备上进行资源高效部署而设计的。 其目标是使先进的机器智能能够为每个人所使用和负担得起,就像人类认知的普遍性一样。 小语言模型(slm)已经广泛集成到商业设备中。例如,最新的谷歌和三星智能手机内置了大型语言模型(LLM)服务,如 Gem 阅读全文
posted @ 2024-09-28 22:49 石头木 阅读(45) 评论(0) 推荐(0) 编辑
摘要: 当您有可以比较的真实数据时,评估检索-增强生成(RAG)模型要容易得多。但是如果你没有呢?这就是事情变得有点棘手的地方。然而,即使在缺乏基本事实的情况下,仍然有一些方法可以评估 RAG 系统的性能。下面,我们将介绍三种有效的策略,从零开始创建 ground truth 数据集的方法,当你确实拥有数据 阅读全文
posted @ 2024-09-26 21:19 石头木 阅读(73) 评论(0) 推荐(0) 编辑
摘要: 一些初步的想法 AI 代理的核心架构开始趋于稳定,开发人员似乎更关注实践上。 AI 代理将扩展其功能,特别是在视觉探索、网页浏览和移动操作系统集成等领域。 Salesforce 似乎正在大力推动其在 AI 代理研究方面的进步,特别是关注大型动作模型及其开发框架。 比较开发框架本质上是具有挑战性的,因 阅读全文
posted @ 2024-09-25 22:18 石头木 阅读(106) 评论(0) 推荐(0) 编辑
摘要: 校对是 Gboard 的一项新功能,它使用服务器端大型语言模型(LLM),只需点击一下就可以提供无缝的句子级和段落级更正,减轻了那些喜欢专注于打字而不是检查已提交单词的快速打字者的痛点。 校对背后的系统由四个部分组成:数据生成、指标设计、模型调优和模型服务。 数据生成过程涉及一个精心设计的错误合成框 阅读全文
posted @ 2024-09-25 22:18 石头木 阅读(33) 评论(0) 推荐(0) 编辑
摘要: 近年来,人工智能取得了显著的进步,像 GPT-4 这样的大型语言模型上了头条。然而,一个新的趋势正在出现:小型语言模型(small language models, SLMs)。这些模型虽然更紧凑和高效,但提供了重要的功能,并且越来越多地被各行业采用。以下是 21 种正在塑造 AI 未来的小型语言模 阅读全文
posted @ 2024-09-23 22:54 石头木 阅读(134) 评论(0) 推荐(0) 编辑
摘要: 规模越大并不总是越好:从 llm 到 slm 的转变 当我们想到 AI 时,经常会想到像 GPT-4 或 BERT 这样的大型模型。这些巨人被称为大型语言模型(Large Language Models, llm),由于其庞大的参数大小和广泛的训练数据,它们具有令人印象深刻的能力。然而,并不总是越大 阅读全文
posted @ 2024-09-22 19:43 石头木 阅读(35) 评论(0) 推荐(0) 编辑
摘要: https://arxiv.org/abs/2212.08410 思维链提示在基础层面上是如此成功,以至于它产生了一些被称为 x 链现象的东西。谷歌研究院探索了如何使用 llm 为现有数据集生成 CoT 数据本体,然后如何在 CoT 上微调较小的语言模型。 介绍 众所周知,思维链提示提高了大型语言模 阅读全文
posted @ 2024-09-16 22:08 石头木 阅读(38) 评论(0) 推荐(0) 编辑
摘要: 引入语义标签过滤:利用标签相似度 增强检索 传统的标签搜索缺乏灵活性。如果我们要过滤恰好包含给定标签的样本,可能会出现这样的情况,特别是对于只包含几千个样本的数据库, 可能没有任何(或只有少数)与我们的查询匹配的样本。 两种搜索的不同之处在于搜索结果的稀缺性 传统的标签搜索是如何工作的? 传统系统采 阅读全文
posted @ 2024-09-15 23:09 石头木 阅读(42) 评论(0) 推荐(0) 编辑
摘要: RAG 幻觉检测方法 未经检查的幻觉在今天的检索增强生成应用中仍然是一个大问题。本研究评估了 4 个公共 RAG 数据集中流行的幻觉检测器。使用 AUROC 和精度/召回率,我们报告了 G-eval、Ragas 和可信语言模型等方法如何能够自动标记不正确的 LLM 响应。 利用各种幻觉检测方法识别 阅读全文
posted @ 2024-09-13 21:37 石头木 阅读(82) 评论(0) 推荐(0) 编辑