Add run_analysis/README.md

2026-03-03 11:21:15 +00:00 · 2026-03-03 11:21:15 +00:00 · 8802481c78
commit 8802481c78
1 changed files with 204 additions and 0 deletions
--- a/run_analysis/README.md
+++ b/run_analysis/README.md
@ -0,0 +1,204 @@
+# Analyse der Runs #6–#10 zur Definition der Near‑Expiry‑Schwelle
+
+## Purpose
+
+Auswertung der Runs #6–#10 zur Identifikation stabiler Timing-Muster und Definition einer datenbasierten Near‑Expiry‑Schwelle.
+
+**Problemstellung:** Untersuchung negativer Zeitdifferenzen (Δt<0) zwischen Gate‑Read und Index‑Visibility unter verschiedenen Bedingungen (pinned/unpinned), um deterministische Fehlerquellen zu erkennen.
+
+**Ziele:**
+- Überprüfung der Stabilität zwischen pinned und unpinned Runs
+- Quantifizierung und Klassifizierung der Δt<0‑Fälle
+- Ableitung einer Schwelle für Near‑Expiry‑Definition (<24h)
+
+## Kontext & Hintergrund
+
+Fünf Runs (#6–#10) unter identischer Instrumentierung und Exit‑Regel v1. Jeder Run zeichnet Metriken für pinned und unpinned Kontexte auf.
+
+**Gruppierung:**
+- pinned
+- unpinned
+
+**Trace-Metadaten / zusätzliche Tags:**
+- corr_id zur Identifikation einzelner Fälle
+- expires_at_dist_hours als Distanz bis Ablaufzeit
+- Lag‑Vorzeichen aus Differenz (t_gate_read − t_index_visible)
+
+**Domänenkontext:**
+- Verteilte Systeme mit zeitkritischen Sichtbarkeitsfenstern
+- Fehleranalyse durch Latenzsignale in synchronisierten Prozessen
+
+**Outlier-Definition:**
+- Methode: Schwellenbasiert
+- Beschreibung: Fälle werden als Ausreißer markiert, wenn expires_at_dist_hours > 24h bei Δt<0 auftritt.
+- Metrik: expires_at_dist_hours
+
+**Motivation:**
+- Stabilisierung von Systemtimings durch präzise Definition von Near‑Expiry‑Zonen
+- Schaffung einer reproduzierbaren Baseline für A/B‑Tests
+
+## Methode / Spezifikation
+
+**Übersicht:**
+- Vergleich von pinned und unpinned Runs hinsichtlich Δt<0‑Fällen
+- Konsolidierung der Einzelereignisse über die Runs #6–#10
+- Analyse des Verteilungsverhaltens von expires_at_dist_hours
+
+**Algorithmen / Verfahren:**
+- Zählen der Δt<0‑Fälle pro Run und Stratum
+- Prüfen des Vorzeichens von (t_gate_read − t_index_visible)
+- Zuordnung nach expires_at_dist_hours
+- Ableitung der Near‑Expiry‑Schwelle basierend auf Häufigkeitsverteilung
+
+### Bootstrap-Übersicht
+
+Nicht angewandt
+
+**Zielgrößen:**
+### Resampling-Setup
+
+**Resampling-Schema:**
+**Konfidenzintervalle:**
+- Niveau: 0.95
+
+### Abgeleitete Effektgrößen
+
+**Risk Difference (Differenz der Raten):**
+- Definition: Vergleich der Δt<0‑Inzidenz zwischen pinned und unpinned Runs.
+- Bootstrap: Nicht durchgeführt, da Stichprobenumfang gering.
+
+**Risk Ratio:**
+- Definition: Quotient aus unpinned‑Δt<0‑Rate zu pinned‑Δt<0‑Rate über Runs #6–#10.
+- Bootstrap: Nicht angewandt.
+
+### C-State-Kontrolle
+
+**Ziel:** Minimierung von Timing‑Drift durch stabile Prozessbedingungen.
+
+**Vorgehen:**
+- Alle Runs unter identischer Prozess‑ und Regelkonfiguration
+- Keine Änderungen der Instrumentierung oder Exit‑Regel
+
+## Input / Output
+
+### Input-Anforderungen
+
+**Hardware:**
+- Standardisierte Umgebung pro Run, konstant gehalten
+
+**Software:**
+- Instrumentierung für Gate‑ und Index‑Timing‑Messungen
+- Datenlogging für corr_id und expires_at_dist_hours
+
+**Konfiguration:**
+- Exit‑Regel v1 unverändert in allen Runs
+
+### Erwartete Rohdaten
+
+**Felder pro Run:**
+- run_id
+- stratum
+- corr_id
+- t_gate_read
+- t_index_visible
+- expires_at_dist_hours
+
+**Formatbeispiele:**
+- run: #8, stratum: unpinned, corr_id: U8-A, expires_at_dist_hours: 12.1, sign: negativ
+
+**Trace-Daten:**
+- Format: Tabellarisch pro Run mit konsolidierter Δt‑Zählung
+- Hinweis: Δt<0 markiert Vorzeichenwechsel in Sichtbarkeitszeitpunkt
+
+### Analyse-Ausgaben
+
+**Pro Gruppe / pro Governor:**
+- warn rate ≈ 0.06 (pinned)
+- unknown rate ≈ 0.00 (pinned)
+- Δt<0-Fälle: 0 (pinned), 1–2 (unpinned)
+
+**Vergleichsausgaben:**
+- pinned vs unpinned
+  - Δ: +15–20 Prozentpunkte Δt<0‑Inzidenz
+  - RR: >5x
+
+- C-State-Korrelation: Nicht signifikant oder konstant über Runs.
+- Trace-Muster: Unpinned zeigt konsistentes negatives Lag‑Vorzeichen über alle Runs.
+
+## Workflow / Nutzung
+
+**Analyse-Workflow:**
+- Importiere Run‑Logs #6–#10
+- Filtere nach Δt<0‑Fällen
+- Klassifiziere pro Stratum (pinned/unpinned)
+- Berechne expires_at_dist_hours‑Verteilung
+- Setze Near‑Expiry‑Grenze bei <24h
+- Überführe Schwelle in A/B‑Test‑Design
+
+### Trace-Template-Anforderungen
+
+**Ziel:** Konsistente Erfassung von Timing‑Differenzen zur Erkennung strukturierter Latenzmuster.
+
+**Erforderliche Tags & Metadaten:**
+- corr_id
+- expires_at_dist_hours
+- t_gate_read
+- t_index_visible
+
+**trace-cmd-Setup:**
+- Verwende identische Sampling‑Intervalle und Log‑Frequenz pro Run
+
+**Run-Design für Contributors:**
+- Keine Regeländerung zwischen Runs innerhalb der Baseline
+- Separate Kennzeichnung für pinned und unpinned Sessions
+
+## Interpretation & erwartete Ergebnisse
+
+**Kernbefunde:**
+- Δt<0‑Fälle treten ausschließlich im unpinned‑Stratum auf.
+- 6 von 7 Δt<0‑Fällen liegen unter 24h expires_at_dist_hours.
+- Kein einziger Fall mit positivem Lag‑Vorzeichen.
+
+**Implikationen für Experimente:**
+- Die Near‑Expiry‑Schwelle <24h wird als stabile Entscheidungsbasis übernommen.
+- Baseline‑Runs #6–#10 liefern konsistentes Muster für weitere Tests.
+
+**Planungsziel:**
+- Ziel: Definition einer datenbasierten Schwelle für Near‑Expiry‑Regeln.
+- Vorgehen:
+  - Empirische Aggregation von Δt<0‑Fällen über Serien‑Runs
+  - Auswahl konservativer Schwelle zur Minimierung von False Positives
+
+## Limitationen & Fallstricke
+
+**Datenbezogene Limitationen:**
+- Kleine Stichprobe (nur 7 Δt<0‑Fälle)
+- Kein separates Validierungsset außerhalb Runs #6–#10
+
+**Bootstrap-spezifische Limitationen:**
+- Keine Bootstrap‑Verfahren angewandt, daher keine Konfidenzintervalle
+
+**Kausalität & Generalisierbarkeit:**
+- Kausalität nur innerhalb identischer Regelkonfigurationen prüfbar
+- Ergebnisse gelten nicht für geänderte Instrumentierungsvarianten
+
+**Praktische Fallstricke:**
+- Verwechslung von Lag‑Vorzeichen durch Messlatenz möglich
+- Beobachtungszone 24–48h darf Entscheidungslogik nicht beeinflussen
+
+## Nächste Schritte & Erweiterungen
+
+**Geplante Experimente:**
+- A/B‑Test mit Near‑Expiry‑Schwelle <24h vs. Kontrollgruppe ohne Schwelle
+
+**Analyseziele:**
+- Überprüfung der Reproduzierbarkeit des Lag‑Musters
+- Test auf Stabilität der Warn‑Rate bei neuen Runs
+
+**Regression & Modellierung:**
+- Erweiterung zur Trendanalyse über mehrere Baselines
+- Modellierung der Lag‑Verteilung über expires_at_dist_hours
+
+**Community-Beiträge:**
+- Dokumentation der Near‑Expiry‑Heuristik im internen Knowledge‑Repo
+- Veröffentlichung der Run‑Datenstruktur für Replikationsstudien