AI时代,性能测试岗位要消失了?

昨天星球一位同学找我问了这样一个问题:

现在AI的能力越来越强大了,AI IDE也开始自带性能分析和优化建议功能,公司最近打算将专项性能测试岗位去掉,转岗去做业务测试,是选择接受,还是跳槽看看外面的机会?

声明一下,这位同学在公司的岗位是性能测试工程师,日常工作就是围绕公司自研APP以及后台服务进行各种性能测试,为线上容量规划提供建议,并协同运维团队保障线上业务的稳定性。

我能理解这位同学面临的困扰,毕竟这几年AI的能力越来越强。22年AI只是一个问答助手,23年就进化出了多模态能力,24年智能体+工作流开始逐渐成为主流。

到了今年,伴随着思维链(Extended Thinking)能力的成熟和生态的完善,AI的能力边界被进一步扩展。从公司的角度出发,AI的能力都这么强大了,性能测试这种专项岗位,实在没必要留着。

但AI真的强大到可以替换掉性能测试岗位吗?至少目前,我不这样认为。

先简单介绍一下目前AI最新的能力:思维链。

思维链(Extended Thinking),最早是Anthropic在Claude中提出一种机制,即允许模型在回答问题之前先进行内部推理,再把必要的信息暴露出来。

从技术的角度来阐述,所谓的思维链就是:模型在显式推理(reasoning)与工具调用(tool use)之间交替进行工作,并且在多轮交互会话中,持续保留和传递之前每一步的推理状态。

简单来说,模型的思维链能力,就是思考+工具调用(Thinking in Tool Use)。

MiniMax在今年10月份发布新模型M2的时候,特别强调Interleaved Thinking能力是其设计重点之一,并在社区中反复强调了这种机制对Agent和Coding场景的重要支撑作用。https://wxa.wxs.qq.com/tmpl/or/base_tmpl.html

近几年,大模型的叙事逻辑一直在变化。从ChatBot时代的“我能回答问题”,到智能体+工作流时代的“我能调用工具”,再到MCP时代的“我有多少插件”,直到如今的思维链时代“我可以在工具和插件调用之间保持连续的上下文传递”。

对这种叙事逻辑的变化做一个总结,我们当前处在AI时代的Self Agent阶段

回到本文的主题,AI是否会取代性能测试岗位。

先说结论,至少短期三到五年内,我个人并不认为AI会取代性能测试岗位。当然,我说的性能测试岗位是指具备丰富的一线实践经验,对业务场景和系统架构有深入理解,并且能不断提升自己专业能力的同学。

为什么我会这样说,原因主要有如下几点:

1、以目前AI展现出的能力来说,应用场景基本都集中在执行阶段,即压测执行、性能监控、数据分析和出具报告。这个阶段AI带来的最大价值,是效率提升,即将人从繁琐重复的执行端解放出来。

2、从项目的角度来说,性能测试最耗时的阶段,是前期的需求明确和准备工作。无论是明确压测目标和验收指标,还是性能测试三大模型的梳理,都需要投入大量的时间精力,且这是一个长期建设的过程。

3、前期的前期的需求明确和准备工作,纯技术或者专业的技能占比不高,更多的是沟通协调。上过班的都知道,工作最耗费精力的就是沟通协调,而非专业的东西,这不是AI能解决的问题,至少目前AI不具备这个能力。

4、无论是业务流程还是系统架构,伴随着每次版本迭代都会变化,且这种变化在实际工作场景中很难及时更新和维护。这些变化对AI来说是天量的token和不确定因素,如果你无法告诉AI精准的提示,那你不能指望AI给出满意的符合预期的结果。

当然,除了上述的四点原因,还有其他的因素。比如:1-大模型目前本质上依然是概率预测机器,信息幻觉问题无法避免;2-符合自己公司业务场景的私有模型,预训练和微调依赖自有知识库的建设,这里需要大量的时间资源投入,以及巨量的标准数据来让AI学习。

AI目前没有我们想象的那么强大,但AI的未来又很值得期待,我们不能因噎废食。

作为个人来说,需要保持对AI的好奇心,将其能力应用于生活和工作中,不断提升自己的专业能力,避免被掌握AI的其他人超越。

声明:来自老张的求知思考世界,仅代表创作者观点。链接:https://eyangzhen.com/4563.html

老张的求知思考世界的头像老张的求知思考世界

相关推荐

关注我们
关注我们
购买服务
购买服务
返回顶部