摘要:
当一个模型在 Codeforces 拿到 3455 Elo,在 ARC-AGI-2 达到 84.6%,并在多项奥赛级别基准测试中逼近或达到金牌水准时,它已经不只是“写代码快”那么简单。 这次的主角,是 Google 旗下 Google DeepMind 推出的 Gemini 3 Deep Think 阅读全文
posted @ 2026-02-15 21:16
霍格沃兹测试开发学社
阅读(28)
评论(0)
推荐(0)
摘要:
真正适合做选择的时间,不是在最忙的时候,而是在停下来的时候。 这两天,办公软件安静了,消息提醒变少了,年度计划写完了,下一个版本的迭代还没开始。 对很多技术人来说,这是全年唯一一段真正“停下来”的时间。 没有需求评审,没有紧急修复,没有凌晨的发布窗口。 只有你自己,和刚刚过去这一年的回音。 我一直觉 阅读全文
posted @ 2026-02-15 21:15
霍格沃兹测试开发学社
阅读(14)
评论(0)
推荐(0)

浙公网安备 33010602011771号