蝈蝈俊 - 博客园

让DeepSeek-R1写登月金句

摘要：阿姆斯特朗登月那句“我的一小步，是人类的一大步”是非常有历史意义和象征性的，我让DeepSeek-R1参照写，也非常出彩：从航天员视角出发的 1、踏上月面第一步时（抬脚特写） "这一步，踏碎了四千年的仰望" （数字锚定从嫦娥传说到当代的时间跨度） 2、拾取月岩样本时（手套与岩石接触特写） "十阅读全文

posted @ 2025-02-01 15:56 蝈蝈俊阅读(69) 评论(0) 推荐(0) 编辑

聪明的三次重生：为什么20岁、40岁、60岁对智慧的理解截然不同？

摘要：小时候说聪明的，长大后却变得平庸了？其实我们评价聪明的体系在随年龄而转变：当10岁的小明快速背出圆周率后30位，大人夸他"真聪明"； 30岁的张经理因设计出智能仓储系统获得晋升，同事说他"有真本事"； 65岁的王师傅仅凭发动机异响就判断出故障原因，徒弟们尊称他"老师傅"。这三个"聪明"的评价背后阅读全文

posted @ 2025-02-01 15:05 蝈蝈俊阅读(31) 评论(0) 推荐(0) 编辑

DeepSeek-R1：AI界的“特斯拉革命”，为何说它改写了游戏规则？

摘要： 2016年AlphaGo战胜李世石时，人类惊叹于AI的“思考”能力。但此后，AI发展似乎陷入了一个怪圈：模型越来越庞大，训练成本动辄数亿美元，仿佛 “堆算力”成了唯一的进化密码。直到今年，DeepSeek推出的V3及R1模型，用很少的算力达到行业顶尖水平，甚至让模型自己学会了“反思”。这背后究竟藏着阅读全文

posted @ 2025-01-26 16:44 蝈蝈俊阅读(352) 评论(0) 推荐(0) 编辑

Meta AI 的“记忆层”技术详解

摘要： Meta AI 近期发表的一篇论文 "Memory Layers at Scale" 为我们提供了一个新的思路：为模型配备可学习的“记忆”模块，使其能够像人脑一样，选择性地存储和检索信息，从而在不显著增加计算成本的前提下，大幅提升模型的性能，尤其是在处理事实性知识方面。 https://ai.met 阅读全文

posted @ 2025-01-20 17:07 蝈蝈俊阅读(48) 评论(0) 推荐(0) 编辑

李飞飞：AI Agent的根本定位，工具而非主导！

摘要：人工智能的飞速发展，在为我们描绘美好未来的同时，也引发了深刻的忧虑：AI是否会有一天凌驾于人类之上？我们辛勤的工作会不会被冰冷的机器取代？面对这些疑问，1月15日，李飞飞接受海外播客 Possible 的访谈中给出了她的答案，并再次敲响警钟：“AI Agent的根本定位应该是工具而非主导者，是赋能阅读全文

posted @ 2025-01-20 13:53 蝈蝈俊阅读(74) 评论(0) 推荐(0) 编辑

DeepSeek-V3 的 MoE 架构解析：细粒度专家与高效模型扩展

摘要： DeepSeek-V3 采用的 DeepSeekMoE 架构，通过细粒度专家、共享专家和 Top-K 路由策略，实现了模型容量的高效扩展。每个 MoE 层包含 1 个共享专家和 256 个路由专家，每个 Token 选择 8 个路由专家，最多路由至 4 个节点。这种稀疏激活的机制，使得 DeepS 阅读全文

posted @ 2025-01-17 13:57 蝈蝈俊阅读(4434) 评论(0) 推荐(1) 编辑

未来已来？Agent会取代App，成为新的“超级入口”吗？

摘要：最近，关于“AI Agent 将取代 App”的观点甚嚣尘上，引发了科技圈的广泛讨论。随着人工智能技术的飞速发展，我们似乎看到了一个更加智能、更加主动的未来。那么，Agent 真的会像一些人预测的那样，彻底颠覆我们过去十几年习以为常的 App 生态吗？今天，我们就来深入探讨一下这个充满想象力的阅读全文

posted @ 2025-01-16 16:20 蝈蝈俊阅读(50) 评论(0) 推荐(0) 编辑

你的AI没那么“傻”，只是你用错了方法！

摘要：你是不是也有这种感觉？跟AI聊了半天，它给出的答案总是差强人意，甚至让你觉得它有点“人工智障”？别急着给它下定义，很可能不是AI不够聪明，而是你和它沟通的方式出了问题！想象一下，你买了一把瑞士军刀，结果只用来拧螺丝。它也能用，但明显浪费了它各种强大的功能！跟AI的互动也是同样的道理。现在，很阅读全文

posted @ 2025-01-15 13:45 蝈蝈俊阅读(28) 评论(0) 推荐(0) 编辑

解锁情绪密码：一个更全面的情绪模型

摘要：我们常常被情绪牵着鼻子走。生气、焦虑、悲伤…… 这些情绪仿佛凭空出现，让我们措手不及。我们习惯性地将情绪归咎于外界的事件，却忽视了隐藏在情绪背后的深层机制。今天，我们将介绍一个更全面的情绪模型，帮助你解锁情绪密码，更好地掌控自己的生活。情绪模型传统的ABC模型（A-事件，B-认知，C-情绪阅读全文

posted @ 2025-01-15 09:19 蝈蝈俊阅读(22) 评论(0) 推荐(0) 编辑

解读《Agent白皮书》：关于AI智能体的五个常见认知偏差

摘要：最近发布的《Agent白皮书》引发了广泛关注。 https://www.kaggle.com/whitepaper-agents 中文版 https://arthurchiao.art/blog/ai-agent-white-paper-zh/ 这份报告深入探讨了AI智能体（Agent）的概念、能力阅读全文

posted @ 2025-01-14 10:39 蝈蝈俊阅读(141) 评论(0) 推荐(0) 编辑

蝈蝈俊的技术心得

导航

公告

搜索

常用链接

我的标签

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论