霍格沃兹测试开发学社

2026年2月16日

摘要：年夜饭刚吃完，春晚还没开始，亲戚的追问还在路上。这一年，你被AI刷屏刷得心慌，被“淘汰论”吓得不轻，收藏了一堆“年后必学”的课程链接。但今晚，咱们不聊学习。不讲Prompt怎么写，不谈大模型怎么调，不问你报了什么课、刷了什么题。就聊一件事—— 如果AI真的在冲击岗位，你最该想明白的是什么？阅读全文

posted @ 2026-02-16 15:40 霍格沃兹测试开发学社阅读(7) 评论(0) 推荐(0)

2026年2月15日

测试开发工程师的“第二曲线”：为什么我建议你学一点LLM原理

摘要：上个月团队聚餐，几个刚入职的年轻人问我：强哥，你现在还自己写代码吗？我愣了一下，说写啊，不写代码怎么测？他们笑，说以为我现在只负责画架构图、写文档。我放下筷子，认真想了想这个问题。入行十一年，从最早的功能测试，到自动化测试，再到测试开发，工具在变，语言在变，平台在变，但有一件事没变：我在用工具，阅读全文

posted @ 2026-02-15 21:17 霍格沃兹测试开发学社阅读(7) 评论(0) 推荐(0)

Gemini 3 Deep Think 升级：Codeforces 3455 分，科研级推理能力全面开放

摘要：当一个模型在 Codeforces 拿到 3455 Elo，在 ARC-AGI-2 达到 84.6%，并在多项奥赛级别基准测试中逼近或达到金牌水准时，它已经不只是“写代码快”那么简单。这次的主角，是 Google 旗下 Google DeepMind 推出的 Gemini 3 Deep Think 阅读全文

posted @ 2026-02-15 21:16 霍格沃兹测试开发学社阅读(28) 评论(0) 推荐(0)

明天就过年了，你敢不敢问自己这3个问题？

摘要：真正适合做选择的时间，不是在最忙的时候，而是在停下来的时候。这两天，办公软件安静了，消息提醒变少了，年度计划写完了，下一个版本的迭代还没开始。对很多技术人来说，这是全年唯一一段真正“停下来”的时间。没有需求评审，没有紧急修复，没有凌晨的发布窗口。只有你自己，和刚刚过去这一年的回音。我一直觉阅读全文

posted @ 2026-02-15 21:15 霍格沃兹测试开发学社阅读(14) 评论(0) 推荐(0)

2026年2月14日

为什么测试经验第一次可以被“安装”：Skills 对 QA 工程的意义

摘要：目录测试团队的老问题：经验全在老 QA 身上 Skills 的本质：把测试经验变成可执行能力 Skills、Prompt、MCP 在测试工程中的分工一个测试类 Skill 应该长什么样为什么 Skills 适合复杂测试场景，而不是拖垮上下文测试 Skills 的作用域：个人技巧 vs 项目质阅读全文

posted @ 2026-02-14 16:18 霍格沃兹测试开发学社阅读(80) 评论(0) 推荐(0)

GPT-4o 下线 24 小时：3 类线上问题会集中爆发

摘要：从 2026-02-13 起，ChatGPT 将在产品侧退役 GPT-4o 等旧模型；但 API 暂无变化，企业客户在 Custom GPTs 里还能多用一段时间。目录发生了什么：哪些模型退役、什么时候生效为什么是现在：官方给出的理由，和背后的“质量含义” 对测试从业者有什么用：这件事本质上在阅读全文

posted @ 2026-02-14 16:17 霍格沃兹测试开发学社阅读(52) 评论(0) 推荐(0)

手把手教你用 Python 调用 GPT-4o 接口，实现 UI 自动化脚本的自动修复

摘要：说实话，做了几年 UI 自动化，最让我头疼的不是写脚本，而是维护脚本。开发今天改个 class，明天换个 id，后天直接把按钮位置挪了——你前一天跑得好好的用例，第二天就红成一片。手动一条条改定位器？改到一半开发又上线了，简直血压拉满。所以我一直在想：能不能让 AI 帮我们修脚本？ OpenA 阅读全文

posted @ 2026-02-14 16:16 霍格沃兹测试开发学社阅读(23) 评论(0) 推荐(0)

最近AI信息爆炸，但你现在最不该做的3个决定

摘要：稳住，比乱动更重要这两天，如果你刷到的是这些内容—— “AI一夜干掉程序员” “测试要被淘汰了” “不转方向就来不及了” 那你产生焦虑是正常的。打开任何平台，铺天盖地都是大模型的新能力、新突破。Claude能写完整项目了，Cursor能自动修Bug了，连测试用例AI都能生成了。作为一个在测试行阅读全文

posted @ 2026-02-14 16:15 霍格沃兹测试开发学社阅读(11) 评论(0) 推荐(0)

SWE-bench破解AI编程能力：测试的价值不在脚本，在判断

摘要：过去一年，AI编程模型的能力变化，已经不再是“写代码更像人”，而是开始真正参与工程任务。在衡量AI编程能力的众多指标中，SWE-bench正在成为一个被频繁引用的标准。包括Claude、DeepSeek、智谱GLM-4系列在内的新一代模型，越来越多地将SWE-bench作为能力验证的重要参考。但阅读全文

posted @ 2026-02-14 16:13 霍格沃兹测试开发学社阅读(32) 评论(0) 推荐(0)

GLM-5 正式发布、MiniMax M2.5 内测、DeepSeek 1M 上下文灰度：软件测试要变天了吗？

摘要：今年春节前这几天，AI 圈像是突然集体踩了油门。 2 月 11 日，三家同时出手：GLM-5 正式发布，MiniMax M2.5 开放内测，DeepSeek 灰度上线 1M 上下文。表面看是模型竞赛，实际上，是一次工程能力的集体跃迁。如果你是做软件测试的，这不是“看个热闹”的新闻。这是工具栈、测试阅读全文

posted @ 2026-02-14 16:12 霍格沃兹测试开发学社阅读(101) 评论(0) 推荐(0)

霍格沃兹测试开发学社

《Python测试开发进阶训练营》（随到随学！）
2023年第2期《Python全栈开发与自动化测试班》（开班在即）
报名联系weixin/qq：2314507862

公告

霍格沃兹测试开发学社

《Python测试开发进阶训练营》（随到随学！） 2023年第2期《Python全栈开发与自动化测试班》（开班在即） 报名联系weixin/qq：2314507862

公告

《Python测试开发进阶训练营》（随到随学！）
2023年第2期《Python全栈开发与自动化测试班》（开班在即）
报名联系weixin/qq：2314507862