| .. | ||
| README.md | ||
Methodische Dokumentation der Runs #6–#9 zur Near-Expiry-Definition
Purpose
Analyse der Runs #6 bis #9 zur Identifikation von Timing-Anomalien und zur Entwicklung einer Near-Expiry-Schwellenlogik.
Problemstellung: In den unpinned Runs treten wiederholt Fälle mit Δt<0 auf, d. h. t_gate_read liegt vor t_index_visible. Diese strukturelle Verschiebung soll systematisch untersucht werden.
Ziele:
- Erkennen struktureller Timing-Verschiebungen zwischen pinned und unpinned Gruppen
- Validieren der Stabilität des Referenzverhaltens (pinned)
- Ableiten einer robusten Definition der Near-Expiry-Grenze
Kontext & Hintergrund
Run-basierte Messreihe #6–#9, jeweils mit getrennten pinned/unpinned-Strata. Pro Run Aggregation der Kennwerte warn_rate, unknown_rate, Count(Δt<0).
Gruppierung:
- pinned
- unpinned
Trace-Metadaten / zusätzliche Tags:
- corr_id pro Fall
- expires_at_dist_hours
- t_gate_read
- t_index_visible
Domänenkontext:
- Timing-Validierung von Index- und Gate-Events bei Ablauf-bezogenen Operationen
- Trennung nach Laufzeitnähe zur Ablaufzeit (expiry proximity)
Outlier-Definition:
- Methode: Negative Δt-Fälle
- Beschreibung: Δt<0 gilt als Timing-Anomalie, da das Gate-Event vor der Index-Sichtbarkeit erscheint.
- Metrik: Δt = t_gate_read − t_index_visible
Motivation:
- Feststellung, ob Δt<0 reproduzierbar auftritt
- Herleitung einer Near-Expiry-Grenze basierend auf expires_at_dist_hours
- Vorbereitung einer A/B-Teststruktur zur Evaluierung alternativer Ablaufstrategien
Methode / Spezifikation
Übersicht:
- Run-basierte Replikation mit konstanter Exit-Regel v1
- Trennung von pinned/unpinned zur Isolierung struktureller Unterschiede
- Messung von Δt und expires_at_dist_hours zur Identifikation korrelierter Effekte
Algorithmen / Verfahren:
- Pro Run Erfassung der counts(Δt<0) getrennt nach Stratum
- Zuordnung der zugehörigen expires_at_dist_hours-Werte
- Konsistenzprüfung der Vorzeichenrichtung von Δt über Runs hinweg
Input / Output
Input-Anforderungen
Hardware:
- Standard-Compute-Node ohne Lastvariation
Software:
- identische Binary-Versionen wie bei Runs #6–#8
Konfiguration:
- Exit-Regel v1 unverändert
- Pinned/Unpinned strikt getrennt
Erwartete Rohdaten
Felder pro Run:
- run_id
- stratum
- warn_rate
- unknown_rate
- count_negative_dt
- expires_at_dist_hours
- t_gate_read
- t_index_visible
Formatbeispiele:
- 9, unpinned, -, -, 3, [6.8,14.2,31.5], timestamps
Trace-Daten:
- Format: CSV oder JSON mit Zeitstempeln
- Hinweis: Jedem corr_id-Fall ist eine expire_at_dist_hours-Zuordnung erforderlich.
Analyse-Ausgaben
Pro Gruppe / pro Governor:
- warn_rate
- unknown_rate
- count_negative_dt
Vergleichsausgaben:
- pinned vs unpinned
- Δ: Δt<0-Auftrittsfrequenz
- RR: Vorkommensrate Δt<0(unpinned)/Δt<0(pinned)
Workflow / Nutzung
Analyse-Workflow:
- Runs 6–9 durchführen mit unveränderter Konfiguration
- Anomalien (Δt<0) extrahieren und expires_at_dist_hours notieren
- Mini-Zeitreihe über Runs bilden
- Schwellenanalyse für Near-Expiry-Grenzen (<24h vs. <48h)
- Nach Run #10 abschließende Festlegung
Trace-Template-Anforderungen
Ziel: Reproduzierbare Erfassung von Δt und Ablaufnähe pro corr_id
Erforderliche Tags & Metadaten:
- corr_id
- t_gate_read
- t_index_visible
- expires_at_dist_hours
trace-cmd-Setup:
- Synchronisierte Systemzeit
- Konsistente Samplingrate
Run-Design für Contributors:
- Keine Metrikänderung zwischen Runs
- Klar dokumentierte Strata-Zuordnung
Interpretation & erwartete Ergebnisse
Kernbefunde:
- Pinned-Stratum zeigt stabile Null-Δt-Struktur
- Unpinned-Stratum weist wiederkehrende Δt<0 auf, insbesondere bei expires_at_dist_hours <24h
- Einzelne Ausreißer oberhalb 30h (Grenzfall 31.5h)
Implikationen für Experimente:
- Mögliche Schwelle <24h zur Definition des Near-Expiry-Bereichs
- Alternative konservative Grenze <48h zur Robustheitsprüfung
Planungsziel:
- Ziel: Bestimmung der Near-Expiry-Zone zur künftigen A/B-Testbasierten Ablaufanalyse
- Vorgehen:
- Finale Erweiterung auf Run #10
- Vergleich der expires_at_dist_hours-Verteilung über alle negativen Δt-Fälle
Limitationen & Fallstricke
Datenbezogene Limitationen:
- Geringe Fallzahl (n=3 pro Run bei unpinned)
- Mögliche Korrelation mit Last oder Cache-Verhalten nicht adressiert
Kausalität & Generalisierbarkeit:
- Δt<0-Fälle indikativ, nicht deterministisch
- Keine Kausalitätsaussage zu Ablaufzeit ohne weitere Runs
Praktische Fallstricke:
- Fehlende Run-Synchronisation kann falsche Δt erzeugen
- Zu frühe Schwellenfestlegung kann zu Overfitting führen
Nächste Schritte & Erweiterungen
Geplante Experimente:
- Run #10 identisch durchführen, Ergänzung der Zeitreihe
Analyseziele:
- Finalisierung der Near-Expiry-Definition
- Überprüfung der Lag-Konsistenz über alle Fälle
Regression & Modellierung:
- Erstellung eines einfachen Modells zur Vorhersage negativer Δt basierend auf expires_at_dist_hours
Community-Beiträge:
- Sammlung externer Beobachtungen zu ähnlichen Mustern („Gate vor Index sichtbar“)