每次迭代收尾,都有一项躲不掉的工作:写测试报告。
打开bug管理平台,导出 Bug 列表。61 条。打开测试用例表,45 条,执行结果 scattered 在三个 sheet 里。然后开始整理:
- 用例通过率多少?手动数通过、失败、阻塞各几个,除一下。再按模块拆开算一遍。
- Bug 关闭率多少?筛选「已关闭」数一遍,再筛「未关闭」数一遍。统计格式换了又换。
- 遗留 Bug 有哪些?翻遍 61 条记录,找出状态不是「已关闭」的,一条一条列出来。
- P0/P1 Bug 修好了没?有没有还没修复的必须阻塞上线?
- 失败用例为什么失败?失败原因、关联 Bug、实际结果,得一条条对应上。
- 阻塞用例为什么阻塞?依赖谁?什么时候能解决?
- 风险评估怎么写?遗留问题、回滚策略、监控方案,都得逐个想。
光是把这些数字凑齐、表格对齐、格式统一,至少一个小时。如果还要做 HTML 版本给领导汇报,再加半小时。
更麻烦的是,写到一半常发现数据对不上,漏了一条未执行用例、Bug 状态看错了、通过率算错了,从头再来一遍。
写报告不难,难的是把零散的数据整理成一份让人信服的报告。
有没有更快的方式
上周试了一个方法:把测试用例执行结果和 Bug 数据一起丢给 AI,让它直接生成完整报告。
结果:5 分钟出了一份 3000 字的结构化测试报告,含用例统计、缺陷分析、风险评估、上线建议,还带 HTML 可视化版本。
这个 Skill 是什么
test-report-writer,测试报告生成 Skill。
它的核心能力很简单:你把测试执行数据和 Bug 数据丢给它,它自动整理成一份完整、专业、可直接提交的测试报告。
报告结构是固定的 8 大模块:
- 基本信息 : 项目、版本、测试周期、环境、迭代范围
- 测试概况 :一句话结论 + 关键指标速览
- 测试范围 : 已测/未测模块、需求覆盖度
- 用例执行统计 : 分模块通过率、失败/阻塞/未执行用例清单
- 缺陷分析 : 严重程度分布、模块分布、人员分布、P0/P1 完整信息、遗留 Bug 清单
- 风险评估 : 高/中优先级遗留问题、上线风险及应急方案、发布后监控项
- 结论与建议 :Go/No-Go/Go with risk、必须完成项、上线 checklist
- 附录 :用例明细、Bug 清单、相关文档链接
三种报告类型可选:
| 类型 | 适用场景 |
|---|---|
| 测试总结报告 | 常规迭代收尾,全面总结 |
| 回归测试报告 | 版本回归验证,对比历史数据 |
| 发布验收报告 | 上线前最终验收,给出明确结论 |
能解决什么问题
问题一:数据整理耗时
以前:从测试平台导出数据,手动透视、筛选、算比例,至少 30 分钟。
现在:上传文件,Skill 自动解析字段、计算通过率/关闭率/缺陷密度等 8 项指标,直接输出表格。
问题二:报告结构不统一
以前:每次报告格式不一样,有的有风险评估,有的没有;有的写了上线 checklist,有的忘了。
现在:8 大模块固定结构,不会漏。根据输入数据完整度自动分三档输出:完整版(8 模块)、标准版(6 模块)、精简版(基础统计+结论)。
问题三:关键信息遗漏
以前:写报告时容易漏掉「未执行用例的原因」「遗留 Bug 是否允许带伤上线」「回滚触发条件」这些领导最关心的问题。
现在:Skill 在生成报告时会主动追问这些信息,不会产出空洞的报告。P1 Bug 必须列影响范围和修复计划,未关闭 Bug 必须注明遗留原因和带伤上线评估。
问题四:汇报版本制作麻烦
以前:Markdown 报告写好了,发给领导不够直观,还得手动做 PPT 或截图。
现在:Skill 内置 HTML 生成脚本,一键把 Markdown 转成暗色主题的可视化报告页,带指标卡片和进度条,直接截图发群或投屏汇报。
实操:AIO 平台测试报告 5 分钟生成
以 AIO 平台 v2.3 迭代为例,演示完整流程。
第一步:准备数据
从bug管理平台导出两份文件:
- 测试用例执行结果:45 条回归用例,含模块、标题、执行结果(通过/失败/阻塞/未执行)
- Bug 数据:61 条 Bug,含标题、优先级、状态、负责人、模块
第二步:上传并触发
在 WorkBuddy 里上传两份文件,说:「帮我写一份 AIO 平台 v2.3 的测试总结报告」
Skill 自动识别字段,发现数据中有「失败用例 6 条、阻塞 1 条、未执行 4 条」,开始追问:
- 测试环境是什么?(答:预发布环境,CentOS 7.9,MySQL 8.0)
- 版本迭代范围?(答:需求评审优化、AI 生成增强、Token 统计等 10 个功能点)
- 失败用例的失败原因?(逐条说明:状态下拉框空白、解析后变量名乱码、日期查询无数据等)
- 阻塞用例的依赖和预计时间?(答:定时调度配置异常,预计 5/30 修复)
- 未执行用例的原因和计划时间?(答:回收站数据被清理、附件上传限速等,逐条给出计划)
- 遗留 Bug 是否允许带伤上线?(逐条评估:Bug#52 定时执行影响记录准确性,否;Bug#44 表格无法进详情页,是,可 hotfix)
- 上线风险和应急方案?(列出 4 项风险,含回滚策略、降级方案、热修复预案、负责人和响应时间)
第三步:报告输出
5 分钟后,报告生成。核心数据:
| 指标 | 数值 |
|---|---|
| 用例通过率 | 75.6%(34/45) |
| 失败用例 | 6 条(含原因、关联 Bug) |
| 阻塞用例 | 1 条(依赖运维配置,预计 5/30 修复) |
| 未执行用例 | 4 条(含原因和补测计划) |
| Bug 总数 | 61 |
| 已修复 | 39(63.9%) |
| 未关闭 | 22(含 2 个必须修复项) |
| P0 Bug | 1 个(已修复,待验证) |
发布结论:Go with risk
第四步:HTML 可视化
运行内置脚本:
python scripts/report_to_html.py 报告.md 报告.html
生成暗色主题 HTML 页面,顶部 6 张指标卡片(通过率进度条、Bug 数颜色预警、发布结论标签),表格自动美化,直接截图发群。
适合什么场景
迭代收尾写测试报告 : 上传执行结果和 Bug 数据,5 分钟出完整报告,直接提交或发送。
版本回归验证 : 对比本轮与历史数据,输出回归报告,重点看新增 Bug 和复现 Bug。
上线前验收 : 生成发布验收报告,含 checklist、遗留问题分级、Go/No-Go 建议,给发布决策提供依据。
多项目并行管理 : 统一报告格式,横向对比不同项目的质量水位。
能力边界
这个 Skill 做的是数据整理和报告结构化,不是技术判断。
它能自动计算通过率、缺陷密度、关闭率,整理失败/阻塞/未执行用例清单,生成风险评估模板。但它不能判断「这个 Bug 是否影响上线」,这需要测试负责人结合业务上下文做最终决策。
它能输出「Go with risk」的建议,但发布决策权在人不在 AI。
怎么使用
方式一:WorkBuddy 内使用(推荐)
1从测试平台导出「测试执行结果」和「Bug 列表」。
2上传文件,说:
- 「帮我写一份测试总结报告」
- 「生成回归测试报告」
- 「写上线前的验收报告」
3回答 Skill 的追问(环境、失败原因、遗留 Bug 评估、应急方案等)。
4拿报告。Markdown 版直接复制,HTML 版一键生成。
方式二:任意 AI 工具中使用
复制 SKILL.md 中的 Prompt 模板到 Claude / ChatGPT / DeepSeek / Cursor 等工具,粘贴测试数据即可。模板已包含完整的 8 大模块结构和字段要求。
总结
测试报告是测试工作的最后一环,也是最容易被敷衍的环节。
很多人做法是:打开 Excel 数一遍、写两行文字、发群里——这周的质量工作就算汇报了。但领导真正想看的不是「通过率 75.6%」这个数字,而是:
- 为什么有 6 条失败?影响多大?什么时候能修好?
- 22 条未关闭 Bug 里,哪些必须修、哪些可以带伤上线?
- 如果上线后出问题,回滚策略是什么?谁负责?多久能响应?
这些信息散落在 61 条 Bug 和 45 条用例里,手工整理至少要一个小时。
这个 Skill 把整理过程自动化了。上传文件,回答几个追问,5 分钟,报告出来。8 大模块、8 项指标、3 种报告类型,结构固定、格式统一、关键信息不遗漏。
把时间从整理数据,转移到判断和决策上。如果你也在写测试报告上花太多时间,试试把数据丢给 Skill,5 分钟搞定。
添加文末微信可免费领取skill。
开源测试平台Testhub官网地址(内测中)
地址:https://testhub.aisky.cloud/
联系微信:
声明:来自AI应用案例库,仅代表创作者观点。链接:https://eyangzhen.com/8452.html