# Near‑Expiry‑Regel – Datenbasierte Definition und Schwellenwertanalyse ## Purpose Analyse der Run‑Timings #6–#10 zur Ableitung der Near‑Expiry‑Regel in einem mehrstufigen System. **Problemstellung:** Negative Time‑Lags (Δt<0) treten gehäuft bei unpinned‑Runs auf. Ziel ist, eine quantitative Grenze für Near‑Expiry‑Fälle zu bestimmen, um deterministisch entscheiden zu können. **Ziele:** - Definition der Near‑Expiry‑Schwelle basierend auf empirischen Δt‑Musteranalysen. - Validierung der Stabilität über fünf Runs mit konstanter Instrumentierung. - Vorbereitung auf A/B‑Test mit klarer Entscheidungsregel. ## Kontext & Hintergrund Konsolidierte Run‑Daten #6–#10 aus Systemmessungen, getrennt nach pinned und unpinned Strata. **Gruppierung:** - Run‑Nummer (#6–#10) - Stratum: pinned vs. unpinned **Trace-Metadaten / zusätzliche Tags:** - corr_id - expires_at_dist_hours - sign(t_gate_read − t_index_visible) **Domänenkontext:** - Timing‑Analyse verteilter Systeme - Event‑Visibility‑Lag‑Beobachtung **Outlier-Definition:** - Methode: Schwellenwertbeurteilung - Beschreibung: Fälle mit expires_at_dist_hours > 24h gelten als Ausreißer in der Δt<0‑Gruppe. - Metrik: expires_at_dist_hours **Motivation:** - Präzise Baseline vor Regeländerung sichern. - Vermeidung von Zufallseffekten durch Run‑Konsistenz. - Einführung einer expliziten, begründeten Near‑Expiry‑Schwelle. ## Methode / Spezifikation **Übersicht:** - Runs #6–#10 wurden mit identischer Instrumentierung durchgeführt. - Δt wird berechnet als Differenz zwischen Gate‑Read‑ und Index‑Visibility‑Zeitpunkten. - Negative Δt‑Werte signalisieren frühe Gate‑Erkennung vor sichtbarem Index. **Algorithmen / Verfahren:** - Erfassen von Δt<0‑Fällen pro Run. - Kategorisierung nach pinned / unpinned. - Aggregation aller Δt<0‑Fälle über Runs. - Berechnung der expires_at_dist_hours‑Verteilung. - Bestimmung der 24h‑Schwelle basierend auf 6/7 Fällen unter dieser Grenze. ## Input / Output ### Input-Anforderungen **Hardware:** - Standard‑Analyseumgebung ohne spezielle Sensorik **Software:** - Data‑Collection‑Pipeline mit Zeitstempel‑Erfassung **Konfiguration:** - Exit‑Regel v1 - Konstante Instrumentierung während Runs #6–#10 ### Erwartete Rohdaten **Felder pro Run:** - run_id - stratum - corr_id - t_gate_read - t_index_visible - expires_at_dist_hours **Formatbeispiele:** - run=10, stratum=unpinned, corr_id=U10‑A, expires_at_dist_hours=9.4, Δt_sign=negativ **Trace-Daten:** - Format: Tabellarische Textaufzeichnung oder CSV - Hinweis: Einträge pro Run konsistent formatiert; keine Feature‑Änderungen zwischen Runs. ### Analyse-Ausgaben **Pro Gruppe / pro Governor:** - warn_rate ≈ 0.06 (pinned) - unknown_rate ≈ 0.00 (pinned) - Δt<0 count pro Stratum **Vergleichsausgaben:** - pinned vs unpinned - Δ: Δt<0 proportion difference - RR: Erhöhtes Risiko negativer Lags bei unpinned‑Runs - Trace-Muster: Konsistent negatives Lag‑Vorzeichen in allen Δt<0‑Fällen. ## Workflow / Nutzung **Analyse-Workflow:** - Sammle Δt‑Metriken pro Run. - Trenne Daten nach Strata (pinned/unpinned). - Prüfe Lag‑Vorzeichenverteilung. - Aggregiere Near‑Expiry‑Kandidaten (expires_at_dist_hours < 24h). - Setze Schwelle = 24h als Regeldefinition. - Dokumentiere Regel für A/B‑Test‑Konfiguration. ### Trace-Template-Anforderungen **Ziel:** Konsistente Erhebung von Timing‑Differenzen zur Stabilitätsbewertung. **Erforderliche Tags & Metadaten:** - corr_id - t_gate_read - t_index_visible - expires_at_dist_hours **trace-cmd-Setup:** - Verwende gleiche Logging‑Parameter über alle Runs. - Deaktiviere Zwischenpuffer für Echtzeit‑Erfassung. **Run-Design für Contributors:** - Halte Instrumentierung konstant. - Verändere keine Systemparameter während der Baseline‑Runs. ## Interpretation & erwartete Ergebnisse **Kernbefunde:** - Δt<0‑Fälle ausschließlich bei unpinned‑Runs beobachtet. - Kein einziger positiver Lag‑Wert in der beobachteten Serie. - 6 von 7 negativen Fällen mit expires_at_dist_hours < 24h. **Implikationen für Experimente:** - Die empirisch begründete Schwelle reduziert Zufallseinflüsse. - Die Regel Near‑Expiry := expires_at_dist_hours < 24h kann als deterministische Entscheidungsbasis dienen. - Die 24–48h‑Zone bleibt als Monitoring‑Bereich aktiv, jedoch ohne Regelbeteiligung. **Planungsziel:** - Ziel: Schaffung einer sauberen, überprüfbaren Entscheidungslogik für Near‑Expiry‑Erkennung. - Vorgehen: - Datengetriebene Schwellenwertbestimmung - Baseline‑Validierung über stabile Run‑Serie ## Limitationen & Fallstricke **Datenbezogene Limitationen:** - Einzelfall mit >24h (31.5h) könnte auf unerkannten Sonderfall hinweisen. - Kleine Stichprobe (7 Δt<0‑Fälle) begrenzt statistische Aussagekraft. **Kausalität & Generalisierbarkeit:** - Korrelation zwischen Near‑Expiry und negativem Lag nicht notwendigerweise kausal. - Ergebnisse gelten nur für Testsystem mit Exit‑Regel v1. **Praktische Fallstricke:** - Schwellenänderung in späteren Runs erfordert Re‑Kalibrierung der Regel. - Fehlerhafte Zeitsynchronisation kann Δt‑Sign verfälschen. ## Nächste Schritte & Erweiterungen **Geplante Experimente:** - Durchführung eines A/B‑Tests mit Near‑Expiry‑Schwelle <24h vs. Kontrollgruppe ohne Schwelle. **Analyseziele:** - Überprüfung der Regelauswirkungen auf Lag‑Verteilung und Fehlerraten. **Regression & Modellierung:** - Langfristig Modellierung der Lag‑Verteilung als Funktion der Restlaufzeit. **Community-Beiträge:** - Validierung durch weitere Runs mit standardisierter Trace‑Template‑Einhaltung.