Agent skill

performance-test-generator

基于NFR性能要求,生成性能测试场景和关键性能指标(KPI)。L3级别专用,当性能需求明确后使用。

Stars 5
Forks 1

Install this agent skill to your Project

npx add-skill https://github.com/tikazyq/agentic-spec-forge/tree/main/AGENTIC_SPEC_FORGE/spec_stage_skill/implementation_planning/performance-test-generator

SKILL.md

performance-test-generator: 性能测试生成器

描述

基于CRAFT L3的NFR性能要求,生成性能测试场景、性能指标定义和验收条件。确保应用性能达到需求。

适用场景

  • WORKFLOW_STEP_5 Task S5-2: 创建test_suites.md中的性能测试章节(L3专用)
  • WORKFLOW_STEP_5 Task S5-3: Self-Reflection分析性能测试覆盖
  • L3项目: 有明确性能需求的系统(响应时间、吞吐量、并发等)

输入

  • requirements/(特别是NFR中的性能需求)
  • goal_breakdown.md(关键业务GOAL)
  • design/architecture.md(架构设计,含可扩展性考虑)
  • design/technology.md(技术栈,数据库/缓存等性能相关)
  • 业务量预测(日活用户/并发数/数据量等)

输出

  • 性能测试计划报告(markdown)
  • KPI定义(响应时间/吞吐量/并发数/资源使用等)
  • 性能测试场景(Given-When-Then格式)
  • 性能验收条件(P99响应时间≤200ms等)
  • 测试工具建议(JMeter/Gatling/LoadRunner等)

执行策略

第1步: 提取性能NFR 从requirements/NFR中识别性能需求,分类为:

  • 响应时间: P50/P95/P99百分位数(如P99<200ms)
  • 吞吐量: QPS/TPS(如1000 QPS)
  • 并发: 最大并发用户数(如10000并发)
  • 资源: CPU/内存/磁盘使用限制
  • 可用性: 可用性要求(如99.9%)

第2步: 性能指标映射 根据应用类型定义关键KPI:

应用类型 关键指标 基准值 压力值
Web应用 页面加载时间 <1s <3s
API 响应时间(P99) <200ms <500ms
数据库 查询时间 <100ms <300ms
缓存 命中率 >90% >80%

第3步: 业务量预测 根据需求确定测试规模:

  • 日活用户(DAU) → 并发用户数 = DAU × 峰值系数 / 3600
  • 业务操作 → QPS = 日操作数 / 86400 × 峰值系数
  • 数据量 → 存储/查询性能影响

第4步: 关键路径KPI定义 为核心业务流程定义KPI:

  • 登录: P99响应时间 ≤ 500ms
  • 查询: P99响应时间 ≤ 200ms
  • 下单: P99响应时间 ≤ 1000ms
  • 支付: P99响应时间 ≤ 2000ms

第5步: 性能测试场景

  • 基准测试: 正常负载(50%峰值)
  • 压力测试: 突增负载(100%峰值)
  • 耐久性测试: 长时间运行(8小时)
  • 尖峰测试: 瞬间峰值(150%峰值)

第6步: L1/L2/L3分级

  • L1: 仅基准测试,关键路径KPI
  • L2: 基准+压力测试,主要路径KPI
  • L3: 完整测试(基准/压力/耐久/尖峰),所有路径KPI

第7步: 测试工具选择

工具 适用场景 特点
JMeter 通用性能测试 开源、支持多协议
Gatling API性能测试 高吞吐、实时报告
LoadRunner 企业级测试 功能完整、成本高
Locust Python脚本测试 灵活、易扩展

价值

  • SPEC组织: 将性能需求转化为可量化的测试目标
  • DevOps/QA: 系统化的性能测试覆盖和持续监控
  • Dev: 明确的性能约束,指导优化方向

验收标准(L3)

  • 覆盖所有NFR性能要求
  • 关键路径KPI明确定义
  • 给定-当-那 格式清晰规范
  • 验收条件可量化可自动化
  • 包含基准/压力/耐久性测试

Expand your agent's capabilities with these related and highly-rated skills.

tikazyq/agentic-spec-forge

code-review

执行代码审查流程(提交PR→自查→同行审查→反馈修改→合并),覆盖功能正确性、代码质量、测试完整性、安全合规四大维度。当提交Pull Request、进行结对编程、执行代码走查、需要知识共享时使用。支持L1/L2/L3三级审查深度。

5 1
Explore
tikazyq/agentic-spec-forge

code-quality

执行代码质量门禁检查(测试通过→覆盖率→Lint→GOAL追溯→可提交),验证单元测试覆盖率≥80%、集成测试通过率≥95%、代码规范零错误。当完成代码实现、准备提交代码、需要质量验证、进行提交前自检时使用。确保代码可合并。

5 1
Explore
tikazyq/agentic-spec-forge

tdd-cycle

执行 TDD 红绿重构循环(RED→GREEN→REFACTOR→REPEAT),通过先写失败测试、最小代码实现、保持绿色重构的节奏驱动开发。当启动功能开发、需要测试驱动节奏、进行迭代编码、追求高测试覆盖率时使用。提供检查清单和节奏控制。

5 1
Explore
tikazyq/agentic-spec-forge

refactoring

执行代码重构(识别坏味道→选择手法→小步修改→运行测试),在保持外部行为不变前提下改进内部结构。当TDD进入REFACTOR阶段、发现代码坏味道、需要消除重复代码、优化代码结构时使用。支持提取方法、类、参数对象等重构手法。

5 1
Explore
tikazyq/agentic-spec-forge

arch-options-compare

比较多个架构方案(单体/微服务等),从SOLID原则、成本、复杂度等维度评分,生成对比表和推荐方案。当需要向客户解释架构选择或ADR决策时使用。

5 1
Explore
tikazyq/agentic-spec-forge

dev-tech-view-supplement

根据设计补充Dev视角的技术细节(数据库/API/通信协议),帮助Dev快速进入实施。当L1/L2设计缺乏技术细节、或准备向Dev交付前使用。

5 1
Explore

Didn't find tool you were looking for?

Be as detailed as possible for better results