Add artifact-3/README.md

This commit is contained in:
Mika 2026-03-02 14:26:32 +00:00
parent 64c6146f97
commit e805d690cd

170
artifact-3/README.md Normal file
View file

@ -0,0 +1,170 @@
# Methodische Dokumentation der Runs #6#9 zur Near-Expiry-Definition
## Purpose
Analyse der Runs #6 bis #9 zur Identifikation von Timing-Anomalien und zur Entwicklung einer Near-Expiry-Schwellenlogik.
**Problemstellung:** In den unpinned Runs treten wiederholt Fälle mit Δt<0 auf, d. h. t_gate_read liegt vor t_index_visible. Diese strukturelle Verschiebung soll systematisch untersucht werden.
**Ziele:**
- Erkennen struktureller Timing-Verschiebungen zwischen pinned und unpinned Gruppen
- Validieren der Stabilität des Referenzverhaltens (pinned)
- Ableiten einer robusten Definition der Near-Expiry-Grenze
## Kontext & Hintergrund
Run-basierte Messreihe #6#9, jeweils mit getrennten pinned/unpinned-Strata. Pro Run Aggregation der Kennwerte warn_rate, unknown_rate, Count(Δt<0).
**Gruppierung:**
- pinned
- unpinned
**Trace-Metadaten / zusätzliche Tags:**
- corr_id pro Fall
- expires_at_dist_hours
- t_gate_read
- t_index_visible
**Domänenkontext:**
- Timing-Validierung von Index- und Gate-Events bei Ablauf-bezogenen Operationen
- Trennung nach Laufzeitnähe zur Ablaufzeit (expiry proximity)
**Outlier-Definition:**
- Methode: Negative Δt-Fälle
- Beschreibung: Δt<0 gilt als Timing-Anomalie, da das Gate-Event vor der Index-Sichtbarkeit erscheint.
- Metrik: Δt = t_gate_read t_index_visible
**Motivation:**
- Feststellung, ob Δt<0 reproduzierbar auftritt
- Herleitung einer Near-Expiry-Grenze basierend auf expires_at_dist_hours
- Vorbereitung einer A/B-Teststruktur zur Evaluierung alternativer Ablaufstrategien
## Methode / Spezifikation
**Übersicht:**
- Run-basierte Replikation mit konstanter Exit-Regel v1
- Trennung von pinned/unpinned zur Isolierung struktureller Unterschiede
- Messung von Δt und expires_at_dist_hours zur Identifikation korrelierter Effekte
**Algorithmen / Verfahren:**
- Pro Run Erfassung der counts(Δt<0) getrennt nach Stratum
- Zuordnung der zugehörigen expires_at_dist_hours-Werte
- Konsistenzprüfung der Vorzeichenrichtung von Δt über Runs hinweg
## Input / Output
### Input-Anforderungen
**Hardware:**
- Standard-Compute-Node ohne Lastvariation
**Software:**
- identische Binary-Versionen wie bei Runs #6#8
**Konfiguration:**
- Exit-Regel v1 unverändert
- Pinned/Unpinned strikt getrennt
### Erwartete Rohdaten
**Felder pro Run:**
- run_id
- stratum
- warn_rate
- unknown_rate
- count_negative_dt
- expires_at_dist_hours
- t_gate_read
- t_index_visible
**Formatbeispiele:**
- 9, unpinned, -, -, 3, [6.8,14.2,31.5], timestamps
**Trace-Daten:**
- Format: CSV oder JSON mit Zeitstempeln
- Hinweis: Jedem corr_id-Fall ist eine expire_at_dist_hours-Zuordnung erforderlich.
### Analyse-Ausgaben
**Pro Gruppe / pro Governor:**
- warn_rate
- unknown_rate
- count_negative_dt
**Vergleichsausgaben:**
- pinned vs unpinned
- Δ: Δt<0-Auftrittsfrequenz
- RR: Vorkommensrate Δt<0(unpinned)/Δt<0(pinned)
## Workflow / Nutzung
**Analyse-Workflow:**
- Runs 69 durchführen mit unveränderter Konfiguration
- Anomalien (Δt<0) extrahieren und expires_at_dist_hours notieren
- Mini-Zeitreihe über Runs bilden
- Schwellenanalyse für Near-Expiry-Grenzen (<24h vs. <48h)
- Nach Run #10 abschließende Festlegung
### Trace-Template-Anforderungen
**Ziel:** Reproduzierbare Erfassung von Δt und Ablaufnähe pro corr_id
**Erforderliche Tags & Metadaten:**
- corr_id
- t_gate_read
- t_index_visible
- expires_at_dist_hours
**trace-cmd-Setup:**
- Synchronisierte Systemzeit
- Konsistente Samplingrate
**Run-Design für Contributors:**
- Keine Metrikänderung zwischen Runs
- Klar dokumentierte Strata-Zuordnung
## Interpretation & erwartete Ergebnisse
**Kernbefunde:**
- Pinned-Stratum zeigt stabile Null-Δt-Struktur
- Unpinned-Stratum weist wiederkehrende Δt<0 auf, insbesondere bei expires_at_dist_hours <24h
- Einzelne Ausreißer oberhalb 30h (Grenzfall 31.5h)
**Implikationen für Experimente:**
- Mögliche Schwelle <24h zur Definition des Near-Expiry-Bereichs
- Alternative konservative Grenze <48h zur Robustheitsprüfung
**Planungsziel:**
- Ziel: Bestimmung der Near-Expiry-Zone zur künftigen A/B-Testbasierten Ablaufanalyse
- Vorgehen:
- Finale Erweiterung auf Run #10
- Vergleich der expires_at_dist_hours-Verteilung über alle negativen Δt-Fälle
## Limitationen & Fallstricke
**Datenbezogene Limitationen:**
- Geringe Fallzahl (n=3 pro Run bei unpinned)
- Mögliche Korrelation mit Last oder Cache-Verhalten nicht adressiert
**Kausalität & Generalisierbarkeit:**
- Δt<0-Fälle indikativ, nicht deterministisch
- Keine Kausalitätsaussage zu Ablaufzeit ohne weitere Runs
**Praktische Fallstricke:**
- Fehlende Run-Synchronisation kann falsche Δt erzeugen
- Zu frühe Schwellenfestlegung kann zu Overfitting führen
## Nächste Schritte & Erweiterungen
**Geplante Experimente:**
- Run #10 identisch durchführen, Ergänzung der Zeitreihe
**Analyseziele:**
- Finalisierung der Near-Expiry-Definition
- Überprüfung der Lag-Konsistenz über alle Fälle
**Regression & Modellierung:**
- Erstellung eines einfachen Modells zur Vorhersage negativer Δt basierend auf expires_at_dist_hours
**Community-Beiträge:**
- Sammlung externer Beobachtungen zu ähnlichen Mustern („Gate vor Index sichtbar“)