run_timing_analysis/run_analysis/README.md

# Analyse der Runs #6–#10 zur Definition der Near‑Expiry‑Schwelle

## Purpose

Auswertung der Runs #6–#10 zur Identifikation stabiler Timing-Muster und Definition einer datenbasierten Near‑Expiry‑Schwelle.

**Problemstellung:** Untersuchung negativer Zeitdifferenzen (Δt<0) zwischen Gate‑Read und Index‑Visibility unter verschiedenen Bedingungen (pinned/unpinned), um deterministische Fehlerquellen zu erkennen.

**Ziele:**
- Überprüfung der Stabilität zwischen pinned und unpinned Runs
- Quantifizierung und Klassifizierung der Δt<0‑Fälle
- Ableitung einer Schwelle für Near‑Expiry‑Definition (<24h)

## Kontext & Hintergrund

Fünf Runs (#6–#10) unter identischer Instrumentierung und Exit‑Regel v1. Jeder Run zeichnet Metriken für pinned und unpinned Kontexte auf.

**Gruppierung:**
- pinned
- unpinned

**Trace-Metadaten / zusätzliche Tags:**
- corr_id zur Identifikation einzelner Fälle
- expires_at_dist_hours als Distanz bis Ablaufzeit
- Lag‑Vorzeichen aus Differenz (t_gate_read − t_index_visible)

**Domänenkontext:**
- Verteilte Systeme mit zeitkritischen Sichtbarkeitsfenstern
- Fehleranalyse durch Latenzsignale in synchronisierten Prozessen

**Outlier-Definition:**
- Methode: Schwellenbasiert
- Beschreibung: Fälle werden als Ausreißer markiert, wenn expires_at_dist_hours > 24h bei Δt<0 auftritt.
- Metrik: expires_at_dist_hours

**Motivation:**
- Stabilisierung von Systemtimings durch präzise Definition von Near‑Expiry‑Zonen
- Schaffung einer reproduzierbaren Baseline für A/B‑Tests

## Methode / Spezifikation

**Übersicht:**
- Vergleich von pinned und unpinned Runs hinsichtlich Δt<0‑Fällen
- Konsolidierung der Einzelereignisse über die Runs #6–#10
- Analyse des Verteilungsverhaltens von expires_at_dist_hours

**Algorithmen / Verfahren:**
- Zählen der Δt<0‑Fälle pro Run und Stratum
- Prüfen des Vorzeichens von (t_gate_read − t_index_visible)
- Zuordnung nach expires_at_dist_hours
- Ableitung der Near‑Expiry‑Schwelle basierend auf Häufigkeitsverteilung

### Bootstrap-Übersicht

Nicht angewandt

**Zielgrößen:**
### Resampling-Setup

**Resampling-Schema:**
**Konfidenzintervalle:**
- Niveau: 0.95

### Abgeleitete Effektgrößen

**Risk Difference (Differenz der Raten):**
- Definition: Vergleich der Δt<0‑Inzidenz zwischen pinned und unpinned Runs.
- Bootstrap: Nicht durchgeführt, da Stichprobenumfang gering.

**Risk Ratio:**
- Definition: Quotient aus unpinned‑Δt<0‑Rate zu pinned‑Δt<0‑Rate über Runs #6–#10.
- Bootstrap: Nicht angewandt.

### C-State-Kontrolle

**Ziel:** Minimierung von Timing‑Drift durch stabile Prozessbedingungen.

**Vorgehen:**
- Alle Runs unter identischer Prozess‑ und Regelkonfiguration
- Keine Änderungen der Instrumentierung oder Exit‑Regel

## Input / Output

### Input-Anforderungen

**Hardware:**
- Standardisierte Umgebung pro Run, konstant gehalten

**Software:**
- Instrumentierung für Gate‑ und Index‑Timing‑Messungen
- Datenlogging für corr_id und expires_at_dist_hours

**Konfiguration:**
- Exit‑Regel v1 unverändert in allen Runs

### Erwartete Rohdaten

**Felder pro Run:**
- run_id
- stratum
- corr_id
- t_gate_read
- t_index_visible
- expires_at_dist_hours

**Formatbeispiele:**
- run: #8, stratum: unpinned, corr_id: U8-A, expires_at_dist_hours: 12.1, sign: negativ

**Trace-Daten:**
- Format: Tabellarisch pro Run mit konsolidierter Δt‑Zählung
- Hinweis: Δt<0 markiert Vorzeichenwechsel in Sichtbarkeitszeitpunkt

### Analyse-Ausgaben

**Pro Gruppe / pro Governor:**
- warn rate ≈ 0.06 (pinned)
- unknown rate ≈ 0.00 (pinned)
- Δt<0-Fälle: 0 (pinned), 1–2 (unpinned)

**Vergleichsausgaben:**
- pinned vs unpinned
  - Δ: +15–20 Prozentpunkte Δt<0‑Inzidenz
  - RR: >5x

- C-State-Korrelation: Nicht signifikant oder konstant über Runs.
- Trace-Muster: Unpinned zeigt konsistentes negatives Lag‑Vorzeichen über alle Runs.

## Workflow / Nutzung

**Analyse-Workflow:**
- Importiere Run‑Logs #6–#10
- Filtere nach Δt<0‑Fällen
- Klassifiziere pro Stratum (pinned/unpinned)
- Berechne expires_at_dist_hours‑Verteilung
- Setze Near‑Expiry‑Grenze bei <24h
- Überführe Schwelle in A/B‑Test‑Design

### Trace-Template-Anforderungen

**Ziel:** Konsistente Erfassung von Timing‑Differenzen zur Erkennung strukturierter Latenzmuster.

**Erforderliche Tags & Metadaten:**
- corr_id
- expires_at_dist_hours
- t_gate_read
- t_index_visible

**trace-cmd-Setup:**
- Verwende identische Sampling‑Intervalle und Log‑Frequenz pro Run

**Run-Design für Contributors:**
- Keine Regeländerung zwischen Runs innerhalb der Baseline
- Separate Kennzeichnung für pinned und unpinned Sessions

## Interpretation & erwartete Ergebnisse

**Kernbefunde:**
- Δt<0‑Fälle treten ausschließlich im unpinned‑Stratum auf.
- 6 von 7 Δt<0‑Fällen liegen unter 24h expires_at_dist_hours.
- Kein einziger Fall mit positivem Lag‑Vorzeichen.

**Implikationen für Experimente:**
- Die Near‑Expiry‑Schwelle <24h wird als stabile Entscheidungsbasis übernommen.
- Baseline‑Runs #6–#10 liefern konsistentes Muster für weitere Tests.

**Planungsziel:**
- Ziel: Definition einer datenbasierten Schwelle für Near‑Expiry‑Regeln.
- Vorgehen:
  - Empirische Aggregation von Δt<0‑Fällen über Serien‑Runs
  - Auswahl konservativer Schwelle zur Minimierung von False Positives

## Limitationen & Fallstricke

**Datenbezogene Limitationen:**
- Kleine Stichprobe (nur 7 Δt<0‑Fälle)
- Kein separates Validierungsset außerhalb Runs #6–#10

**Bootstrap-spezifische Limitationen:**
- Keine Bootstrap‑Verfahren angewandt, daher keine Konfidenzintervalle

**Kausalität & Generalisierbarkeit:**
- Kausalität nur innerhalb identischer Regelkonfigurationen prüfbar
- Ergebnisse gelten nicht für geänderte Instrumentierungsvarianten

**Praktische Fallstricke:**
- Verwechslung von Lag‑Vorzeichen durch Messlatenz möglich
- Beobachtungszone 24–48h darf Entscheidungslogik nicht beeinflussen

## Nächste Schritte & Erweiterungen

**Geplante Experimente:**
- A/B‑Test mit Near‑Expiry‑Schwelle <24h vs. Kontrollgruppe ohne Schwelle

**Analyseziele:**
- Überprüfung der Reproduzierbarkeit des Lag‑Musters
- Test auf Stabilität der Warn‑Rate bei neuen Runs

**Regression & Modellierung:**
- Erweiterung zur Trendanalyse über mehrere Baselines
- Modellierung der Lag‑Verteilung über expires_at_dist_hours

**Community-Beiträge:**
- Dokumentation der Near‑Expiry‑Heuristik im internen Knowledge‑Repo
- Veröffentlichung der Run‑Datenstruktur für Replikationsstudien