摘要:
过去一年,AI编程模型的能力变化,已经不再是“写代码更像人”,而是开始真正参与工程任务。 在衡量AI编程能力的众多指标中,SWE-bench正在成为一个被频繁引用的标准。包括Claude、DeepSeek、智谱GLM-4系列在内的新一代模型,越来越多地将SWE-bench作为能力验证的重要参考。 但 阅读全文
posted @ 2026-02-14 16:13
霍格沃兹测试开发学社
阅读(18)
评论(0)
推荐(0)
摘要:
今年春节前这几天,AI 圈像是突然集体踩了油门。 2 月 11 日,三家同时出手:GLM-5 正式发布,MiniMax M2.5 开放内测,DeepSeek 灰度上线 1M 上下文。表面看是模型竞赛,实际上,是一次工程能力的集体跃迁。 如果你是做软件测试的,这不是“看个热闹”的新闻。这是工具栈、测试 阅读全文
posted @ 2026-02-14 16:12
霍格沃兹测试开发学社
阅读(83)
评论(0)
推荐(0)
摘要:
摘要:Django的联合创始人Willison发布了他对未来 1 年、3 年和 6 年技术趋势的预测,本文是Simon 对 2026 年及未来 AI 发展的深度推演。 在 2026 年年初,Web 工具与 AI界的资深人物 Simon Willison 发布了他对未来 1 年、3 年和 6 年技术趋 阅读全文
posted @ 2026-02-14 16:11
霍格沃兹测试开发学社
阅读(57)
评论(0)
推荐(0)
摘要:
在 AI 视频领域,过去几年有一个问题一直没有被真正解决。 不是画面够不够震撼,也不是模型参数够不够大,而是一个更基础、也更工程化的问题:生成结果是否可控、是否稳定、是否能进入生产系统。 直到最近,这个问题第一次出现了明显的“异常信号”。 一个反常的现场:它不像一次正常的产品发布 2 月初,Seed 阅读全文
posted @ 2026-02-14 16:10
霍格沃兹测试开发学社
阅读(18)
评论(0)
推荐(0)
摘要:
还记得那些深夜加班编写测试脚本的日子吗?手动编写重复的测试用例、调试复杂的断言逻辑、维护日益臃肿的测试框架……这些曾是每位测试开发工程师的日常。直到我在项目中引入了GitHub Copilot,整个工作流程发生了翻天覆地的变化。 GitHub Copilot不只是另一个代码补全工具——它是一位始终在 阅读全文
posted @ 2026-02-14 16:09
霍格沃兹测试开发学社
阅读(37)
评论(0)
推荐(0)
摘要:
随着大语言模型在实际应用中的普及,如何系统化地测试和评估模型表现,已成为技术团队必须掌握的核心能力。本指南将拆解大模型测试的全流程,提供可落地的实操方案。 一、模型评估:不只是跑个分那么简单 很多人以为模型评估就是找几个公开数据集跑分,但这远远不够。有效的模型评估需要多层次、多维度设计。 第一步:构 阅读全文
posted @ 2026-02-14 16:08
霍格沃兹测试开发学社
阅读(32)
评论(0)
推荐(0)
摘要:
在2026届春招整体缩招、岗位收紧的大环境下,迅雷的校招启动显得格外值得关注——因为它依然把测试工程师,当作一个明确、独立、有成长路径的技术岗位来招,而不是“补位”或“边缘选项”。 本次春招面向2026届应届生,开放研发、测试、产品、运维等多个技术方向。尤其对想从测试切入、未来走向测试开发(SDET 阅读全文
posted @ 2026-02-14 16:06
霍格沃兹测试开发学社
阅读(16)
评论(0)
推荐(0)
摘要:
未来,你的同事可能是一个24小时在线的AI。最近,一款能像真人一样操作电脑的AI Agent——OpenClaw,正从技术圈火到职场。它不仅仅是个“玩具”,更预示着一种新职业范式的到来:“人机协同”。对求职者和在职者而言,理解并驾驭这类工具,或许正成为新的职场竞争力。 从“能看懂”,到“能动手” O 阅读全文
posted @ 2026-02-14 16:05
霍格沃兹测试开发学社
阅读(71)
评论(0)
推荐(0)

浙公网安备 33010602011771号