随笔 - 934, 文章 - 0, 评论 - 247, 阅读 - 344万

导航

< 2025年2月 >
26 27 28 29 30 31 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 1
2 3 4 5 6 7 8

01 2025 档案

摘要:2016年AlphaGo战胜李世石时,人类惊叹于AI的“思考”能力。但此后,AI发展似乎陷入了一个怪圈:模型越来越庞大,训练成本动辄数亿美元,仿佛 “堆算力”成了唯一的进化密码。直到今年,DeepSeek推出的V3及R1模型,用很少的算力达到行业顶尖水平,甚至让模型自己学会了“反思”。这背后究竟藏着 阅读全文

posted @ 2025-01-26 16:44 蝈蝈俊 阅读(340) 评论(0) 推荐(0) 编辑

摘要:Meta AI 近期发表的一篇论文 "Memory Layers at Scale" 为我们提供了一个新的思路:为模型配备可学习的“记忆”模块,使其能够像人脑一样,选择性地存储和检索信息,从而在不显著增加计算成本的前提下,大幅提升模型的性能,尤其是在处理事实性知识方面。 https://ai.met 阅读全文

posted @ 2025-01-20 17:07 蝈蝈俊 阅读(47) 评论(0) 推荐(0) 编辑

摘要:人工智能的飞速发展,在为我们描绘美好未来的同时,也引发了深刻的忧虑:AI是否会有一天凌驾于人类之上?我们辛勤的工作会不会被冰冷的机器取代? 面对这些疑问,1月15日,李飞飞接受海外播客 Possible 的访谈中给出了她的答案,并再次敲响警钟:“AI Agent的根本定位应该是工具而非主导者,是赋能 阅读全文

posted @ 2025-01-20 13:53 蝈蝈俊 阅读(67) 评论(0) 推荐(0) 编辑

摘要:DeepSeek-V3 采用的 DeepSeekMoE 架构,通过细粒度专家、共享专家和 Top-K 路由策略,实现了模型容量的高效扩展。 每个 MoE 层包含 1 个共享专家和 256 个路由专家,每个 Token 选择 8 个路由专家,最多路由至 4 个节点。这种稀疏激活的机制,使得 DeepS 阅读全文

posted @ 2025-01-17 13:57 蝈蝈俊 阅读(3891) 评论(0) 推荐(0) 编辑

摘要:最近,关于“AI Agent 将取代 App”的观点甚嚣尘上,引发了科技圈的广泛讨论。 随着人工智能技术的飞速发展,我们似乎看到了一个更加智能、更加主动的未来。 那么,Agent 真的会像一些人预测的那样,彻底颠覆我们过去十几年习以为常的 App 生态吗? 今天,我们就来深入探讨一下这个充满想象力的 阅读全文

posted @ 2025-01-16 16:20 蝈蝈俊 阅读(48) 评论(0) 推荐(0) 编辑

摘要:你是不是也有这种感觉?跟AI聊了半天,它给出的答案总是差强人意,甚至让你觉得它有点“人工智障”? 别急着给它下定义,很可能不是AI不够聪明,而是你和它沟通的方式出了问题! 想象一下,你买了一把瑞士军刀,结果只用来拧螺丝。它也能用,但明显浪费了它各种强大的功能! 跟AI的互动也是同样的道理。 现在,很 阅读全文

posted @ 2025-01-15 13:45 蝈蝈俊 阅读(27) 评论(0) 推荐(0) 编辑

摘要:我们常常被情绪牵着鼻子走。 生气、焦虑、悲伤…… 这些情绪仿佛凭空出现,让我们措手不及。 我们习惯性地将情绪归咎于外界的事件,却忽视了隐藏在情绪背后的深层机制。 今天,我们将介绍一个更全面的情绪模型,帮助你解锁情绪密码,更好地掌控自己的生活。 情绪模型 传统的ABC模型(A-事件,B-认知,C-情绪 阅读全文

posted @ 2025-01-15 09:19 蝈蝈俊 阅读(21) 评论(0) 推荐(0) 编辑

摘要:最近发布的《Agent白皮书》引发了广泛关注。 https://www.kaggle.com/whitepaper-agents 中文版 https://arthurchiao.art/blog/ai-agent-white-paper-zh/ 这份报告深入探讨了AI智能体(Agent)的概念、能力 阅读全文

posted @ 2025-01-14 10:39 蝈蝈俊 阅读(130) 评论(0) 推荐(0) 编辑

摘要:今天,深入到 GPT 的“思考引擎”内部,聚焦最核心的两个部件:多头因果自注意力和前馈神经网络,看看它们是如何精妙配合,赋予 AI 理解上下文、预测未来的强大能力。 依然以 “The cat sat on the” 这个例句为例,模型需要预测下一个词。在将这句话转化为“数字暗号”并穿上“小马甲”(词 阅读全文

posted @ 2025-01-14 09:06 蝈蝈俊 阅读(22) 评论(0) 推荐(0) 编辑

摘要:大语言模型的预训练,就像让模型玩一个“填空”游戏,模型需要预测句子中下一个会出现的词,并通过不断学习来提高预测的准确率。 picoGPT:GPT 的“迷你版”,麻雀虽小五脏俱全,一个用纯 Python 实现的极简 GPT 模型 虽然没有演示这个预训练,但是演示了推理过程,即如何基于GPT2的模型参数 阅读全文

posted @ 2025-01-13 17:18 蝈蝈俊 阅读(13) 评论(0) 推荐(0) 编辑

摘要:相信不少朋友都有过这样的经历:线上告警突如其来,团队成员立刻紧张起来,争分夺秒地排查问题、快速止损。在稳定性保障这条道路上,谁来主导,至关重要。 我曾身处美团金融团队,深知在应对大流量冲击、快速止损方面的运维主导模式的威力。那种对系统运行状态的精准把握,对预案执行的果断高效,至今历历在目。然而,最近 阅读全文

posted @ 2025-01-13 11:03 蝈蝈俊 阅读(27) 评论(0) 推荐(0) 编辑

摘要:LLMs模型是如何理解和生成文字的呢? 这背后,一个至关重要的环节就是分词 (Tokenization)。 前面我们介绍了picoGPT:GPT 的“迷你版”,麻雀虽小五脏俱全,一个用纯 Python 实现的极简 GPT 模型。 它的目标是让学习者能够更轻松地理解 GPT 的内部工作原理。 在这个项 阅读全文

posted @ 2025-01-13 08:17 蝈蝈俊 阅读(44) 评论(0) 推荐(0) 编辑

摘要:对于想要理解 GPT 工作原理的同学来说,picoGPT是个很好的项目,作者 Jay Mody 不但写了《GPT in 60 Lines of NumPy》 (https://jaykmody.com/blog/gpt-from-scratch/) ,还提供了源码 https://github.co 阅读全文

posted @ 2025-01-10 10:44 蝈蝈俊 阅读(55) 评论(0) 推荐(0) 编辑

摘要:最近看到一个观点,认为:“副业是个伪命题”,建议大家集中资源,专注于单一目标。这种说法过于绝对,甚至有些偏激,忽略了副业的诸多可能性和价值。今天,我们就来深入探讨一下,看看副业究竟是不是“伪命题”。 文章的观点: 副业是个伪命题 有限的资源,一定要集中火力,打到投产比最高的那个点上 不存在「鸡蛋不放 阅读全文

posted @ 2025-01-09 17:00 蝈蝈俊 阅读(25) 评论(0) 推荐(0) 编辑

摘要:最近,你是不是还在朋友圈或者各种社群里看到有人分享各种“神级提示词”? 仿佛只要掌握了这些神秘代码,就能让AI瞬间变成你的得力助手,无所不能。 但我想说,醒醒吧! 2025年了,我们真的需要重新审视与AI的交互方式了。 正如最近看到宝玉的这段话所说: https://weibo.com/172785 阅读全文

posted @ 2025-01-08 15:32 蝈蝈俊 阅读(99) 评论(0) 推荐(0) 编辑

摘要:刚刚过去的CES,英伟达CEO黄仁勋再次以其前瞻性的洞察力,为我们描绘了一幅未来科技图景。其中一句看似简单的论断,却引发了科技圈的深刻思考:“IT部门将是AI代理的HR部门。” 这句话究竟蕴含着怎样的深意?它预示着未来企业运作模式的哪些变革?又将如何影响我们每个人的工作和生活?今天,我们就来深入解读 阅读全文

posted @ 2025-01-07 17:00 蝈蝈俊 阅读(164) 评论(0) 推荐(0) 编辑

摘要:各位码农朋友们,最近有没有听到一个略显“随意”的编程新词—— OTC (One Time Coding)? 它不像我们熟悉的软件工程那样严谨,甚至带着点“用完就扔”的洒脱。 但这看似有点“野路子”的编程方式,却伴随着大语言模型的兴起,悄然走进了我们的视野。 今天,我们就来好好聊聊这个有趣的现象。 什 阅读全文

posted @ 2025-01-07 15:24 蝈蝈俊 阅读(65) 评论(0) 推荐(0) 编辑

摘要:最近,我看到一个很有意思的语音聊天助手 prompt,它不仅要求 AI 像人一样对话,更厉害的是,还试图让 AI 避免我们人类自己都经常犯的沟通错误。 这个 prompt 就像一份精心设计的“朋友养成指南”,目标是打造一个既亲切又健谈的 AI 伙伴。 先来看看这个“朋友养成指南”的具体内容: htt 阅读全文

posted @ 2025-01-07 10:42 蝈蝈俊 阅读(322) 评论(0) 推荐(0) 编辑

摘要:最近技术圈最火的莫过于各种AI编程工具了,Devin、Cursor、Windsurf... 看着它们“秀肌肉”,你是不是既感到未来已来,又隐隐有些焦虑? 别慌,但也别掉以轻心。因为一个残酷的真相是:AI不会让所有程序员失业,但它一定会加速淘汰那些不懂AI、不会用AI的程序员。 换句话说,未来不是“A 阅读全文

posted @ 2025-01-06 15:07 蝈蝈俊 阅读(141) 评论(0) 推荐(0) 编辑

摘要:最近听了一期关于“醉鹅娘”创业的播客,十年饮冰,难凉热血,最终做成了大网红,但背后的故事却让人警醒:负债5600万! 这个数字一出来,相信不少人会倒吸一口凉气。辛辛苦苦创业十年,好不容易成了“网红”,怎么还欠了这么多钱? 她的经历,不是个例,反而折射出许多创业者,乃至我们在职场中都容易陷入的认知误区 阅读全文

posted @ 2025-01-06 14:17 蝈蝈俊 阅读(74) 评论(0) 推荐(0) 编辑

摘要:近年来,随着科技的飞速发展,金融风险控制领域也在悄然发生变革。其中,大语言模型(LLM)无疑是推动这一变革的重要力量。作为一项具备理解、生成、多模态融合和推理决策能力的技术,LLM 正逐步渗透到金融风控的各个环节,帮助企业在复杂的风险环境中保持前瞻性和智能化的应对能力。 今天,我们来聊聊 LLM 在 阅读全文

posted @ 2025-01-02 11:18 蝈蝈俊 阅读(150) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示