AgentSkillsCN

evaluation-plan

维护评估指标与阈值;在调整评估指标、测量方法,或修改评估的验收标准时使用。

SKILL.md
--- frontmatter
name: evaluation-plan
description: Pflege Evaluationsmetriken und Schwellenwerte; verwenden bei Aenderungen an Metriken, Messmethoden oder Akzeptanzkriterien fuer Evaluation.

Skill: evaluation-plan

Zweck

Halte die Evaluation nachvollziehbar und messbar fuer die Case Study.

Wann anwenden

  • Wenn neue Metriken oder Schwellenwerte definiert werden.
  • Wenn Messmethoden angepasst werden muessen.

Vorgehen (Schritt-fuer-Schritt)

  1. Lies docs/04_evaluation/EVALUATION_PLAN.md.
  2. Aktualisiere Metriken, Messmethoden und Akzeptanzschwellen.
  3. Verknuepfe Metriken mit relevanten NFRs, falls vorhanden.

Lernperspektive

  • Warum so? Evaluation macht Fortschritt und Qualitaet messbar.
  • Alternativen: ad-hoc Demo-Feedback ohne klare Kriterien.
  • Warum nicht hier? Ohne Kriterien ist Lernfortschritt schwer belegbar.

Repo-Referenzen

  • docs/04_evaluation/EVALUATION_PLAN.md
  • docs/01_requirements/NFR.en.md

Qualitaetscheck

  • Metriken sind messbar definiert.
  • Schwellenwerte sind konsistent mit NFRs.
  • Keine untestbaren Aussagen.

Phasenbezug

PhaseAufgabeStatus
Phase 4Evaluationsplan definierenerledigt