会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
霍格沃兹测试开发学社
《Python测试开发进阶训练营》(随到随学!)
2023年第2期《Python全栈开发与自动化测试班》(开班在即)
报名联系weixin/qq:2314507862
博客园
首页
新随笔
联系
管理
订阅
上一页
1
2
3
4
5
6
7
···
206
下一页
2026年2月28日
吴恩达、斯坦福都在说的这件事,测试人早就懂了
摘要: 这两年,AI 行业有一个很明显的变化。 大家不再天天问“模型有多强”“参数有多大”“又破了哪个榜”,而是开始反复讨论一件以前不太性感的事: 它到底靠不靠谱?值不值得用?出了问题谁负责? 有意思的是,这些问题,测试同行一点都不陌生。 最近一段时间,吴恩达、斯坦福、谷歌云几乎在同一时间,抛出了多份报告和
阅读全文
posted @ 2026-02-28 11:00 霍格沃兹测试开发学社
阅读(16)
评论(0)
推荐(0)
2026年2月27日
测试日志里的海量ERROR?用RAG架构训练一个专属日志分析师
摘要: 作为测试或者运维,想必都有过这样的至暗时刻:系统崩溃,老板在后面盯着,你手里攥着几个GB的日志文件,用grep翻来覆去地查ERROR,结果却被淹没在无尽的上下文里。 那种感觉就像是在一座垃圾山里找一枚针,而且这座垃圾山每分钟还在变大。 传统的日志监控靠正则表达式,靠关键字告警,玩得花一点的团队可能上
阅读全文
posted @ 2026-02-27 11:21 霍格沃兹测试开发学社
阅读(11)
评论(0)
推荐(0)
再也不怕漏测!基于代码Diff的智能用例推荐实战
摘要: 每次上线前,总担心漏测那几行不起眼的代码改动?别慌,这篇文章将带你搭建一套“AI测试脑细胞”,让它像老司机一样,盯着代码Diff自动给你生成精准的测试用例。 前言:那些年,我们为了“漏测”背过的锅 两年前的一次上线,我至今记忆犹新。当时只是为了修复一个文案拼写错误,顺手重构了工具类里一个私有方法。由
阅读全文
posted @ 2026-02-27 11:20 霍格沃兹测试开发学社
阅读(14)
评论(0)
推荐(0)
OpenAI 官宣弃用 SWE-bench Verified:代码能力“金标准”为何被撤?测试工程师该关注什么
摘要: 最近模型圈出现一条重要消息。 OpenAI 宣布,不再推荐使用 SWE-bench Verified 作为代码能力评估基准。 这一基准曾被视为衡量大模型“真实工程修复能力”的重要指标,如今被官方主动弃用。与此同时,新的 SWE-bench Pro 被建议作为替代方案。 目录 发生了什么? 问题一:测
阅读全文
posted @ 2026-02-27 11:19 霍格沃兹测试开发学社
阅读(13)
评论(0)
推荐(0)
代理编程全球第一之后:GLM-5 会不会改变自动化与 Agent 测试范式?
摘要: 春节期间,国产大模型迎来密集更新。智谱发布的 GLM-5 参数规模达到 7440 亿,同时在代理编程能力测试中位列全球第一。 如果只把它当成一次“模型升级”,意义其实有限。 真正值得关注的是:当模型开始具备稳定的多步决策与工具调用能力,自动化工程体系会不会发生变化? 这篇文章从工程与测试视角,拆解
阅读全文
posted @ 2026-02-27 11:18 霍格沃兹测试开发学社
阅读(9)
评论(0)
推荐(0)
AI 说 Bug 在这,你信吗?一套方法让你用 AI 定位不再踩坑
摘要: 在测试工程中,Bug 定位是最消耗脑力也最容易卡进度的环节之一。对于复杂系统,你可能要反复在日志、代码、环境和配置中穿梭,不断猜测原因、验证假设。这个阶段往往既枯燥又费时。 最近,越来越多人尝试用 AI 来辅助 Bug 定位,从最早的提示词辅助思考,到现在工具链级别的自动推理与日志解析,AI 已经从
阅读全文
posted @ 2026-02-27 11:16 霍格沃兹测试开发学社
阅读(7)
评论(0)
推荐(0)
浩鲸科技深度测评:ToB公司的测试岗,到底值不值得去?
摘要: 最近在后台,陆续有同学问我,问的几乎都是同一个问题: “浩鲸科技 这家公司,适合作为测试工作的第一站吗?” 说实话,这个问题问得很到位。比起“能不能进”,“适不适合”才是对自己负责的思考方式。 浩鲸科技不是互联网大厂,没有字节腾讯那样的光环,但在企业服务领域深耕多年。今天这篇文章,我从测试工程师的职
阅读全文
posted @ 2026-02-27 11:15 霍格沃兹测试开发学社
阅读(3)
评论(0)
推荐(0)
2026年2月26日
Claude Skill 官方指南发布:能力模块化正在改变大模型工程结构
摘要: 最近,Anthropic 发布了一份 30 多页的 Skill 创建指南,系统讲解如何为 Claude 构建自定义能力模块。 这不是简单的 API 更新说明,而是一份偏工程体系化的能力设计手册。 当模型厂商开始教开发者“如何设计能力单元”,说明一个趋势正在形成: 大模型能力,正在进入结构化阶段。 目
阅读全文
posted @ 2026-02-26 11:44 霍格沃兹测试开发学社
阅读(44)
评论(0)
推荐(0)
2026 就业有多难?想破局,一步到位;先上课,后支付!
摘要: 一、2026 届毕业生,正在面对什么现实? 2025 年的就业环境有一个明显特征:不是岗位突然消失,而是门槛突然“工程化”了。 企业在筛人时,问的越来越少的是: 你学过什么? 你理不理解这个概念? 问得越来越多是: 你做过真实项目吗? 你能搭建自动化框架吗? 你了解测试平台和流水线吗? 你会不会用
阅读全文
posted @ 2026-02-26 11:43 霍格沃兹测试开发学社
阅读(11)
评论(0)
推荐(0)
给AI喂了100个历史Bug,它现在能帮我写断言了
摘要: 上个月,我被拉进了一个“历史遗留项目攻坚群”。这个项目有多老?老到它的单元测试覆盖率常年趴在21%,每次上线前,测试同学都要靠手工回归点得手指抽筋。组长拍着我的肩膀说:“给你两周,把覆盖率干到60%以上。” 我当时的表情,大概就和看到自己写的代码在线上炸了一样——生无可恋。 硬着头皮写了两天单元测试
阅读全文
posted @ 2026-02-26 11:42 霍格沃兹测试开发学社
阅读(14)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
7
···
206
下一页
公告