AI
刷新
AgentFounder浅析——Agent的演化历程与目标

博主头像 理论上(浅显)分析Agent与传统llm、RAG的不同以及演进历程,根据Agent的目标解读AgentFounder论文的训练策略和数据集构建 Agent的目标以及对应的技术方案 Agent的推理目标 形式化的表达: 咱们首先来分析一下最开始大模型的功能,即仅根据\(\pi\)的内部知识和问题\(q ...

GSPO

博主头像 暂时无法在飞书文档外展示此内容 Toy实验现象 问题引出 Grpo的loss函数中token-level的重要性采样的ratio会导致较大的训练梯度noise 在长序列的情况下,clip的机制会加一步累积noise的方差 token-level的IS ratio方差大,不稳定 方法设计 Sequen ...

Qwen WebAgent 系列

博主头像 GitHub地址: https://github.com/Alibaba-NLP/WebAgent# 共有5篇系列文章 为Agent(React架构)在web search(Deepsearch)提供BenchMark以及模型训练方法。 WebWalker 将原始instruct-answer的si ...

读技术之外:社会联结中的人工智能08斯诺登档案

博主头像 1. 斯诺登档案 1.1. 斯诺登文件发布于2013年,读起来很像当下的人工智能营销手册 1.1.1. 包含的所有文件、演示文稿、内部备忘录、新闻通讯和技术手册,都由美国国家安全局前承包商兼泄密者爱德华·斯诺登于2013年泄露给媒体 1.1.2. 阅读档案的过程极为震撼,其内容涵盖了诸如美国国家安全 ...

AI 改变数据库产品实践探索

博主头像 01 obloader agent 导数工具使用中的难题 在实际使用导数工具进行数据导入的过程中,用户普遍面临以下四类核心问题: 1、文本文件格式多样,易引发解析错误 上游系统提供的文本文件往往缺乏统一规范,格式复杂多变。常见的问题包括: 分隔符不明确或频繁变化(如空格、制表符、不可见字符等)。 字 ...

AI图片生成思路

博主头像 AI图片生成思路指导思路先寻找真实图片,发送到AI进行描述照片描述:這張照片的主角是四隻毛茸茸的柴犬,牠們一起棲息在一個紅磚矮牆上。狗狗的姿態與顏色:畫面從左至右,第一隻是常見的赤色柴犬,牠舒適地趴著,兩隻前腳懸在牆外,表情看起來很放鬆。第二隻是一隻黑柴,坐姿端正,直視著鏡頭。最引人注目的是中間那隻 ...

Google Veo3生成跳舞视频

博主头像 背景 Google Veo 3 是谷歌 DeepMind 于 2025 年 5 月推出的第三代 AI 视频生成模型,在视听同步、画质表现、创作控制等方面实现了显著突破, 视听协同生成 原生音频同步技术:支持文本或图像生成视频时同步创建多维度音频,包括对话、环境噪音、音效及背景音乐。例如输入 “雨天咖 ...

读技术之外:社会联结中的人工智能07情感

博主头像 1. 情感预测 1.1. 通过分析面部特征来准确评估一个人的内部感觉状态的说法,其前提是不稳定的 1.1.1. 没有可靠的证据表明能够从某人的面部特征准确预测其情绪状态 1.2. 对于全世界的军队、企业、情报机构和警察部队来说,自动化情感识别的想法既引人注目又有利可图 1.2.1. 承诺能够可靠地从 ...

Kafka监控工具 EFAK-AI 介绍

博主头像 1.概述 在大数据与人工智能深度融合的新时代,Apache Kafka 已成为企业实时数据流处理的核心引擎。然而,随着业务规模的不断扩大,Kafka 集群的监控与运维复杂度也随之攀升——指标繁多、延迟难察、告警频繁,传统监控手段难以快速定位问题与优化性能。正因如此,EFAK-AI(Eagle For ...

大模型在软件研发协同演进

博主头像 大模型在软件研发领域的应用AI时代软件工程变革与智能化发展趋势智能体能力逐渐成熟人机协同办公场景联动研发工作流,人机交互模式变革研发数字员工研发基础建设案例自动CR测试场景研发场景研发通用界面发展趋势AI不再是工具,而是你的同事:你必须知道的软件工程5大变革1.0 引言:从AI助手到AI同事的进化如 ...

读技术之外:社会联结中的人工智能06分类

博主头像 1. 分类 1.1. 塞缪尔·莫顿 1.1.1. Samuel Morton 1.1.1.1. 美国颅骨学家 1.1.1.2. 医生和自然历史学家 1.1.1.3. 费城自然科学院的成员 1.1.2. 通过比较头骨的物理特征,来“客观地”对人类进行分类和排名 1.1.3. 将世界上的人类划分为五个“ ...

数字先锋 | 强强联合,天翼云携手中国物流为行业数智转型树立央企新标杆!

博主头像 人工智能浪潮奔涌向前,各行业积极探索定制化的大模型——“行业大模型”,使其在特定应用场景中发挥更高效、更精准的赋能价值。凭借对行业知识的深刻理解和海量数据的精准训练,行业大模型能够显著提升生产效率与决策水平,推动人工智能从“通用能力”转化为“行业专属生产力”,驱动产业加速数智化跃迁。 中国物流集团有 ...

元推理:物理是对称学,化学是代谢学

博主头像 ECT-OS-JiuHuaShan/https://orcid.org/0009-0006-8591-1891 基于 ECT-OS-JiuHuaShan 框架,此定义是终极精确的。用两个精炼的命题,揭示了物理学与化学在宇宙规律层面的本质内核。 终极科学本质阐释 学科 核心本质 宇宙规律映射 元推理框 ...

读技术之外:社会联结中的人工智能05数据神话

博主头像 1. 从互联网到图网 1.1. 在人工智能研究领域,互联网被视为一种“天然的”​、可获取的资源 1.2. 随着越来越多的人将他们的图片上传到网站、照片共享服务器,最终传至社交媒体平台,掠夺数据的活动开始了 1.3. 如今的科技巨头占据强势的地位:他们拥有源源不断的图像和文本数据渠道,分享内容的人越多 ...

一文读懂AI Agent:为什么说它是大模型的下一站?

博主头像 你是否曾经幻想过,有一个数字助手能像真人一样帮你处理任务?你只需要说一句“帮我规划一个国庆旅行的行程和预算”,它就能自动查机票、订酒店、排路线,甚至给你列出注意事项? 这不再是科幻电影的场景,而是正在发生的技术革命——它的名字叫 AI Agent(智能体)。 一、什么是Agent?它不只是“工具” ...

Google Gemini 2.5 Nano banana生成东方女性

博主头像 背景Google Gemini 2.5 Nano Banana(官方名称为 Gemini 2.5 Flash Image)是谷歌于 2025 年 8 月推出的革命性 AI 图像生成与编辑模型,凭借其多模态架构、角色一致性和实时协作能力,重新定义了 AI 视觉内容创作的标准。采用统一的 Transfo ...

123···50>