大模型 - 随笔分类 - stardsd

多Token预测（Multi-Token Prediction, MTP）技术

摘要：看到DeepSeek-V3使用了多token预测（Multi-token Prediction, MTP）技术，该技术原始论文是由Meta 发在ICML 2024的一篇Poster。论文： [2404.19737] Better & Faster Large Language Models via 阅读全文

posted @ 2025-01-17 09:35 stardsd 阅读(91) 评论(0) 推荐(0) 编辑

一种基于具身化、符号嵌入、因果学习和记忆原则的通用人工智能（AGI）框架

摘要：Generalist AI (AGI) framework based on the principles of embodiment, grounding, causality and memory 图：通用 AGI 系统的功能框图。概念模型由以下部分组成：（1）核心框架、体现，提供与世界接口和交阅读全文

posted @ 2025-01-14 17:10 stardsd 阅读(12) 评论(0) 推荐(0) 编辑

LLMs的记忆能力分析及其分类

摘要：类型主要功能在LLMs中的实现方法感官记忆短暂存储感官信息以供认知系统访问。缓冲输入/输出系统；感官输入的锁存机制；仿生感官记忆技术。作为一种缓冲机制，允许认知处理组件在不同速度下工作而不丢失信息。过滤信息（例如，通过注意机制）以供长期存储。在线记忆暂时存储活跃信息以支持认知处理。阅读全文

posted @ 2025-01-14 16:48 stardsd 阅读(17) 评论(0) 推荐(0) 编辑

人工智能中的符号嵌入问题（Symbol Grounding Problem，又称符号奠基问题，符号接地问题）

摘要：符号嵌入问题（Symbol Grounding Problem）是认知科学、心灵哲学和人工智能中的一个关键问题。它探讨的是符号（或词语）是如何在一个系统中获得意义的。换句话说，抽象符号（如单词或概念）是如何代表现实世界中的对象、行为或经验的？关键概念符号表示：指的是将意义编码为抽象符号的理念，例阅读全文

posted @ 2025-01-14 15:48 stardsd 阅读(18) 评论(0) 推荐(0) 编辑

世界模型和空间智能

摘要：空间思考：多模态大型语言模型如何看待、记忆和回忆空间 VSI-Bench：我们引入了一个高质量的基准，用于评估 MLLM 的 3D、基于视频的视觉空间智能评估：我们在开源和闭源 MLLM 上对 VSI-Bench 进行了评估，发现 MLLM 表现出有竞争力的（尽管不如人类）视觉空间智能。语言分析阅读全文

posted @ 2025-01-08 17:07 stardsd 阅读(49) 评论(0) 推荐(0) 编辑

赏月斋

慎终如始宁静致远

随笔分类 - 大模型

公告

赏月斋

慎终如始 宁静致远

随笔分类 - 大模型

公告

慎终如始宁静致远