2025 年 1月随笔档案 - 蝈蝈俊

DeepSeek-R1：AI界的“特斯拉革命”，为何说它改写了游戏规则？

摘要：2016年AlphaGo战胜李世石时，人类惊叹于AI的“思考”能力。但此后，AI发展似乎陷入了一个怪圈：模型越来越庞大，训练成本动辄数亿美元，仿佛 “堆算力”成了唯一的进化密码。直到今年，DeepSeek推出的V3及R1模型，用很少的算力达到行业顶尖水平，甚至让模型自己学会了“反思”。这背后究竟藏着阅读全文

posted @ 2025-01-26 16:44 蝈蝈俊阅读(340) 评论(0) 推荐(0) 编辑

Meta AI 的“记忆层”技术详解

摘要：Meta AI 近期发表的一篇论文 "Memory Layers at Scale" 为我们提供了一个新的思路：为模型配备可学习的“记忆”模块，使其能够像人脑一样，选择性地存储和检索信息，从而在不显著增加计算成本的前提下，大幅提升模型的性能，尤其是在处理事实性知识方面。 https://ai.met 阅读全文

posted @ 2025-01-20 17:07 蝈蝈俊阅读(47) 评论(0) 推荐(0) 编辑

李飞飞：AI Agent的根本定位，工具而非主导！

摘要：人工智能的飞速发展，在为我们描绘美好未来的同时，也引发了深刻的忧虑：AI是否会有一天凌驾于人类之上？我们辛勤的工作会不会被冰冷的机器取代？面对这些疑问，1月15日，李飞飞接受海外播客 Possible 的访谈中给出了她的答案，并再次敲响警钟：“AI Agent的根本定位应该是工具而非主导者，是赋能阅读全文

posted @ 2025-01-20 13:53 蝈蝈俊阅读(67) 评论(0) 推荐(0) 编辑

DeepSeek-V3 的 MoE 架构解析：细粒度专家与高效模型扩展

摘要：DeepSeek-V3 采用的 DeepSeekMoE 架构，通过细粒度专家、共享专家和 Top-K 路由策略，实现了模型容量的高效扩展。每个 MoE 层包含 1 个共享专家和 256 个路由专家，每个 Token 选择 8 个路由专家，最多路由至 4 个节点。这种稀疏激活的机制，使得 DeepS 阅读全文

posted @ 2025-01-17 13:57 蝈蝈俊阅读(3891) 评论(0) 推荐(0) 编辑

未来已来？Agent会取代App，成为新的“超级入口”吗？

摘要：最近，关于“AI Agent 将取代 App”的观点甚嚣尘上，引发了科技圈的广泛讨论。随着人工智能技术的飞速发展，我们似乎看到了一个更加智能、更加主动的未来。那么，Agent 真的会像一些人预测的那样，彻底颠覆我们过去十几年习以为常的 App 生态吗？今天，我们就来深入探讨一下这个充满想象力的阅读全文

posted @ 2025-01-16 16:20 蝈蝈俊阅读(48) 评论(0) 推荐(0) 编辑

你的AI没那么“傻”，只是你用错了方法！

摘要：你是不是也有这种感觉？跟AI聊了半天，它给出的答案总是差强人意，甚至让你觉得它有点“人工智障”？别急着给它下定义，很可能不是AI不够聪明，而是你和它沟通的方式出了问题！想象一下，你买了一把瑞士军刀，结果只用来拧螺丝。它也能用，但明显浪费了它各种强大的功能！跟AI的互动也是同样的道理。现在，很阅读全文

posted @ 2025-01-15 13:45 蝈蝈俊阅读(27) 评论(0) 推荐(0) 编辑

解锁情绪密码：一个更全面的情绪模型

摘要：我们常常被情绪牵着鼻子走。生气、焦虑、悲伤…… 这些情绪仿佛凭空出现，让我们措手不及。我们习惯性地将情绪归咎于外界的事件，却忽视了隐藏在情绪背后的深层机制。今天，我们将介绍一个更全面的情绪模型，帮助你解锁情绪密码，更好地掌控自己的生活。情绪模型传统的ABC模型（A-事件，B-认知，C-情绪阅读全文

posted @ 2025-01-15 09:19 蝈蝈俊阅读(21) 评论(0) 推荐(0) 编辑

解读《Agent白皮书》：关于AI智能体的五个常见认知偏差

摘要：最近发布的《Agent白皮书》引发了广泛关注。 https://www.kaggle.com/whitepaper-agents 中文版 https://arthurchiao.art/blog/ai-agent-white-paper-zh/ 这份报告深入探讨了AI智能体（Agent）的概念、能力阅读全文

posted @ 2025-01-14 10:39 蝈蝈俊阅读(130) 评论(0) 推荐(0) 编辑

GPT 的“思考引擎”：多头因果自注意力与前馈网络的精妙配合

摘要：今天，深入到 GPT 的“思考引擎”内部，聚焦最核心的两个部件：多头因果自注意力和前馈神经网络，看看它们是如何精妙配合，赋予 AI 理解上下文、预测未来的强大能力。依然以 “The cat sat on the” 这个例句为例，模型需要预测下一个词。在将这句话转化为“数字暗号”并穿上“小马甲”（词阅读全文

posted @ 2025-01-14 09:06 蝈蝈俊阅读(22) 评论(0) 推荐(0) 编辑

像搭积木一样理解AI背后的“思考”过程

摘要：大语言模型的预训练，就像让模型玩一个“填空”游戏，模型需要预测句子中下一个会出现的词，并通过不断学习来提高预测的准确率。 picoGPT：GPT 的“迷你版”，麻雀虽小五脏俱全，一个用纯 Python 实现的极简 GPT 模型虽然没有演示这个预训练，但是演示了推理过程，即如何基于GPT2的模型参数阅读全文

posted @ 2025-01-13 17:18 蝈蝈俊阅读(13) 评论(0) 推荐(0) 编辑

别再“硬扛”了！稳定性保障主导权切换硬核指南：运维 or QA，何时“换帅”才能止损？

摘要：相信不少朋友都有过这样的经历：线上告警突如其来，团队成员立刻紧张起来，争分夺秒地排查问题、快速止损。在稳定性保障这条道路上，谁来主导，至关重要。我曾身处美团金融团队，深知在应对大流量冲击、快速止损方面的运维主导模式的威力。那种对系统运行状态的精准把握，对预案执行的果断高效，至今历历在目。然而，最近阅读全文

posted @ 2025-01-13 11:03 蝈蝈俊阅读(27) 评论(0) 推荐(0) 编辑

BPE 分词器

摘要：LLMs模型是如何理解和生成文字的呢？这背后，一个至关重要的环节就是分词 (Tokenization)。前面我们介绍了picoGPT：GPT 的“迷你版”，麻雀虽小五脏俱全，一个用纯 Python 实现的极简 GPT 模型。它的目标是让学习者能够更轻松地理解 GPT 的内部工作原理。在这个项阅读全文

posted @ 2025-01-13 08:17 蝈蝈俊阅读(44) 评论(0) 推荐(0) 编辑

60 行 NumPy 代码带你学习GPT

摘要：对于想要理解 GPT 工作原理的同学来说，picoGPT是个很好的项目，作者 Jay Mody 不但写了《GPT in 60 Lines of NumPy》 (https://jaykmody.com/blog/gpt-from-scratch/) ，还提供了源码 https://github.co 阅读全文

posted @ 2025-01-10 10:44 蝈蝈俊阅读(55) 评论(0) 推荐(0) 编辑

副业：伪命题？还是通往自由的另一扇窗？

摘要：最近看到一个观点，认为：“副业是个伪命题”，建议大家集中资源，专注于单一目标。这种说法过于绝对，甚至有些偏激，忽略了副业的诸多可能性和价值。今天，我们就来深入探讨一下，看看副业究竟是不是“伪命题”。文章的观点: 副业是个伪命题有限的资源，一定要集中火力，打到投产比最高的那个点上不存在「鸡蛋不放阅读全文

posted @ 2025-01-09 17:00 蝈蝈俊阅读(25) 评论(0) 推荐(0) 编辑

25年了，别再迷信“神级提示词”了！真正有效的AI沟通，只需这三点

摘要：最近，你是不是还在朋友圈或者各种社群里看到有人分享各种“神级提示词”？仿佛只要掌握了这些神秘代码，就能让AI瞬间变成你的得力助手，无所不能。但我想说，醒醒吧！ 2025年了，我们真的需要重新审视与AI的交互方式了。正如最近看到宝玉的这段话所说： https://weibo.com/172785 阅读全文

posted @ 2025-01-08 15:32 蝈蝈俊阅读(99) 评论(0) 推荐(0) 编辑

黄仁勋一语道破天机：未来IT部门，就是AI员工的“HR部门”！

摘要：刚刚过去的CES，英伟达CEO黄仁勋再次以其前瞻性的洞察力，为我们描绘了一幅未来科技图景。其中一句看似简单的论断，却引发了科技圈的深刻思考：“IT部门将是AI代理的HR部门。” 这句话究竟蕴含着怎样的深意？它预示着未来企业运作模式的哪些变革？又将如何影响我们每个人的工作和生活？今天，我们就来深入解读阅读全文

posted @ 2025-01-07 17:00 蝈蝈俊阅读(164) 评论(0) 推荐(0) 编辑

当代码变成“一次性用品”？聊聊伴随AI兴起的 OTC (One Time Coding)

摘要：各位码农朋友们，最近有没有听到一个略显“随意”的编程新词—— OTC (One Time Coding)？它不像我们熟悉的软件工程那样严谨，甚至带着点“用完就扔”的洒脱。但这看似有点“野路子”的编程方式，却伴随着大语言模型的兴起，悄然走进了我们的视野。今天，我们就来好好聊聊这个有趣的现象。什阅读全文

posted @ 2025-01-07 15:24 蝈蝈俊阅读(65) 评论(0) 推荐(0) 编辑

经典Prompt分享：如何让AI像朋友一样聊天，还能避免把天聊死？

摘要：最近，我看到一个很有意思的语音聊天助手 prompt，它不仅要求 AI 像人一样对话，更厉害的是，还试图让 AI 避免我们人类自己都经常犯的沟通错误。这个 prompt 就像一份精心设计的“朋友养成指南”，目标是打造一个既亲切又健谈的 AI 伙伴。先来看看这个“朋友养成指南”的具体内容： htt 阅读全文

posted @ 2025-01-07 10:42 蝈蝈俊阅读(322) 评论(0) 推荐(0) 编辑

你还在死磕代码？醒醒吧！AI正在加速淘汰“旧式”程序员！

摘要：最近技术圈最火的莫过于各种AI编程工具了，Devin、Cursor、Windsurf... 看着它们“秀肌肉”，你是不是既感到未来已来，又隐隐有些焦虑？别慌，但也别掉以轻心。因为一个残酷的真相是：AI不会让所有程序员失业，但它一定会加速淘汰那些不懂AI、不会用AI的程序员。换句话说，未来不是“A 阅读全文

posted @ 2025-01-06 15:07 蝈蝈俊阅读(141) 评论(0) 推荐(0) 编辑

5600万的代价换来的觉醒：网红“醉鹅娘”的降本自救之路

摘要：最近听了一期关于“醉鹅娘”创业的播客，十年饮冰，难凉热血，最终做成了大网红，但背后的故事却让人警醒：负债5600万！这个数字一出来，相信不少人会倒吸一口凉气。辛辛苦苦创业十年，好不容易成了“网红”，怎么还欠了这么多钱？她的经历，不是个例，反而折射出许多创业者，乃至我们在职场中都容易陷入的认知误区阅读全文

posted @ 2025-01-06 14:17 蝈蝈俊阅读(74) 评论(0) 推荐(0) 编辑

大语言模型（LLM）如何改变金融风控？

摘要：近年来，随着科技的飞速发展，金融风险控制领域也在悄然发生变革。其中，大语言模型（LLM）无疑是推动这一变革的重要力量。作为一项具备理解、生成、多模态融合和推理决策能力的技术，LLM 正逐步渗透到金融风控的各个环节，帮助企业在复杂的风险环境中保持前瞻性和智能化的应对能力。今天，我们来聊聊 LLM 在阅读全文

posted @ 2025-01-02 11:18 蝈蝈俊阅读(150) 评论(0) 推荐(0) 编辑

蝈蝈俊的技术心得

导航

公告

搜索

常用链接

我的标签

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论

01 2025 档案