Add rollout_criteria/README.md

2026-02-19 13:16:05 +00:00 · 2026-02-19 13:16:05 +00:00 · 709f797aa1
commit 709f797aa1
1 changed files with 158 additions and 0 deletions
--- a/rollout_criteria/README.md
+++ b/rollout_criteria/README.md
@ -0,0 +1,158 @@
 # Rollout-Kriterien für Gate‑V1 im CI‑System
 ## Purpose
 Festlegung der Rollout-Kriterien und Entscheidungslogik für den Gate‑V1‑Step im Continuous Integration (CI).
 **Problemstellung:** Fehlende standardisierte Entscheidungskriterien bei der Integration von Gate‑V1 in automatisierte CI‑Pipelines.
 **Ziele:**
 - Operationelle Einführung von Gate‑V1 als CI‑Step
 - Definition von Bewertungs- und Eskalationslogik (PASS, WARN, REVIEW)
 - Dokumentation der stabilen Rollout-Phasen und Schwellenwerte
 ## Kontext & Hintergrund
 Die Gate‑V1‑Komponente wertet Metriken aus den Policy-Berechnungen aus und erzeugt daraus ein `gate_result.json`.
 **Gruppierung:**
 - pro CI‑Run
 - pro Policy‑Set
 **Trace-Metadaten / zusätzliche Tags:**
 - policy_hash zur Nachverfolgbarkeit der Policy-Konfiguration
 **Domänenkontext:**
 - CI‑Workflows
 - kontinuierliche Qualitätssicherung
 - automatisierte Policy‑Validierung
 **Outlier-Definition:**
 - Methode: Schwellenwertbasiert
 - Beschreibung: Runs mit Unknown‑Rate > 1 % werden als Ausreißer und REVIEW‑Fälle markiert.
 - Metrik: Unknown‑Rate
 **Motivation:**
 - Transparente, nachvollziehbare Entscheidungen in CI‑Pipelines
 - Konsistentes Evaluationsverhalten über mehrere Runs hinweg
 - Reduktion des log‑basierten manuellen Prüfaufwands
 ## Methode / Spezifikation
 **Übersicht:**
 - Der Gate‑V1‑Step erhält `policy_constants.json` und den daraus berechneten `policy_hash`.
 - Er erzeugt ein `gate_result.json` mit Outcome, Hash, Count‑Metriken und Top‑Reasons.
 - Er ergänzt den CI‑Lauf um einen kompakten PR‑Kommentar mit diesen Daten.
 **Algorithmen / Verfahren:**
 - Ermitteln der Unknown‑, WARN‑ und Sichtbarkeitsraten aus Policy‑Ergebnissen.
 - Zuweisung eines Outcomes (PASS, WARN, REVIEW) anhand fester Schwellen.
 - Speichern der Resultate in `gate_result.json`.
 - Posten eines standardisierten CI‑Kommentars mit Hash, Outcome und Begründung.
 ## Input / Output
 ### Input-Anforderungen
 **Hardware:**
 **Software:**
 - CI‑Umgebung mit JSON‑Support
 - Zugriff auf Policy‑Auswertungsartefakte
 **Konfiguration:**
 - Bereitstellung von `policy_constants.json`
 - Berechnung eines stabilen `policy_hash`
 ### Erwartete Rohdaten
 **Felder pro Run:**
 - policy_hash
 - outcome
 - unknown_rate
 - visibility
 - top_reasons
 **Formatbeispiele:**
 - {"policy_hash": "abcd1234", "outcome": "PASS", "unknown_rate": 0.009, "visibility": 0.995, "top_reasons": ["Sichtbarkeit ≥99%", "Unknown ≤1%"]}
 **Trace-Daten:**
 - Format: JSON
 - Hinweis: Keine Zusatzfelder oder Telemetrie; minimalistische Struktur für diff‑basierte Vergleiche.
 ### Analyse-Ausgaben
 **Pro Gruppe / pro Governor:**
 - Unknown‑Rate
 - Visibility‑Wert
 - Warn‑Rate
 - Trace-Muster: Stabilität des `policy_hash` über wiederholte Runs prüfen.
 ## Workflow / Nutzung
 **Analyse-Workflow:**
 - Ausführen des Gate‑V1‑Steps in der CI‑Pipeline.
 - Erzeugen des `gate_result.json`.
 - Kommentieren des PRs mit kompaktem Ergebnisblock.
 - Bewerten der Resultate über mehrere Runs.
 ### Trace-Template-Anforderungen
 **Ziel:** Stabilität und Nachvollziehbarkeit der CI‑Ergebnisse.
 **Erforderliche Tags & Metadaten:**
 - policy_hash
 - outcome
 - Counts‑Metriken (Unknown, Visibility, etc.)
 **trace-cmd-Setup:**
 - Keine zusätzlichen Tracepunkte im comment‑only‑Modus.
 **Run-Design für Contributors:**
 - Mindestens zwei Run‑Kategorien (Baseline, Degradiert).
 - Kein Parameter‑Tuning während der Validierung.
 ## Interpretation & erwartete Ergebnisse
 **Kernbefunde:**
 - PASS bei stabiler Unknown‑Rate ≤1 % und Sichtbarkeit ≥99 %.
 - REVIEW bei erhöhter Unknown‑Rate.
 - Byte‑stabile Resultate zwischen Runs sind Indikator funktionaler Stabilität.
 **Implikationen für Experimente:**
 - Gate‑V1 kann reproduzierbare und erklärbare CI‑Entscheidungen liefern.
 - Die Unknown‑Kategorie dient als Trigger für manuelle Prüfung.
 **Planungsziel:**
 - Ziel: Schrittweiser Rollout des Gate‑Mechanismus mit sicherer Eskalationslogik.
 - Vorgehen:
  - Phase 1: comment‑only
  - Phase 2: WARN‑Gate bei definierten Kriterien
  - Option 3: blockend mit harten Bedingungen
 ## Limitationen & Fallstricke
 **Datenbezogene Limitationen:**
 - Abhängigkeit von Genauigkeit der Policy‑Metriken.
 - Keine Datenvalidierung außerhalb der definierten Counts.
 **Kausalität & Generalisierbarkeit:**
 - Bewertungen gelten nur für getestete Policy‑Konfigurationen.
 **Praktische Fallstricke:**
 - Falsche Unknown‑Klassifizierung kann zu unnötigen REVIEWs führen.
 - Hash‑Änderungen ohne sichtbare Policy‑Differenz erschweren Vergleichbarkeit.
 ## Nächste Schritte & Erweiterungen
 **Geplante Experimente:**
 - Einführung des WARN‑Gates nach stabilen 40 Runs.
 **Analyseziele:**
 - Quantifizierung der Unknown‑Rate‑Verteilung über längere Zeiträume.
 **Regression & Modellierung:**
 - Beobachtung der Outcome‑Verteilung über Policy‑Versionen hinweg.
 **Community-Beiträge:**
 - Best Practices für comment‑only Gates in CI‑Umgebungen dokumentieren.