Mika c083b4439d Add near_expiry_rule/README.md

2026-03-03 11:21:15 +00:00

5.6 KiB

Raw Blame History

Near‑Expiry‑Regel – Datenbasierte Definition und Schwellenwertanalyse

Purpose

Analyse der Run‑Timings #6–#10 zur Ableitung der Near‑Expiry‑Regel in einem mehrstufigen System.

Problemstellung: Negative Time‑Lags (Δt<0) treten gehäuft bei unpinned‑Runs auf. Ziel ist, eine quantitative Grenze für Near‑Expiry‑Fälle zu bestimmen, um deterministisch entscheiden zu können.

Ziele:

Definition der Near‑Expiry‑Schwelle basierend auf empirischen Δt‑Musteranalysen.
Validierung der Stabilität über fünf Runs mit konstanter Instrumentierung.
Vorbereitung auf A/B‑Test mit klarer Entscheidungsregel.

Kontext & Hintergrund

Konsolidierte Run‑Daten #6–#10 aus Systemmessungen, getrennt nach pinned und unpinned Strata.

Gruppierung:

Run‑Nummer (#6–#10)
Stratum: pinned vs. unpinned

Trace-Metadaten / zusätzliche Tags:

corr_id
expires_at_dist_hours
sign(t_gate_read − t_index_visible)

Domänenkontext:

Timing‑Analyse verteilter Systeme
Event‑Visibility‑Lag‑Beobachtung

Outlier-Definition:

Methode: Schwellenwertbeurteilung
Beschreibung: Fälle mit expires_at_dist_hours > 24h gelten als Ausreißer in der Δt<0‑Gruppe.
Metrik: expires_at_dist_hours

Motivation:

Präzise Baseline vor Regeländerung sichern.
Vermeidung von Zufallseffekten durch Run‑Konsistenz.
Einführung einer expliziten, begründeten Near‑Expiry‑Schwelle.

Methode / Spezifikation

Übersicht:

Runs #6–#10 wurden mit identischer Instrumentierung durchgeführt.
Δt wird berechnet als Differenz zwischen Gate‑Read‑ und Index‑Visibility‑Zeitpunkten.
Negative Δt‑Werte signalisieren frühe Gate‑Erkennung vor sichtbarem Index.

Algorithmen / Verfahren:

Erfassen von Δt<0‑Fällen pro Run.
Kategorisierung nach pinned / unpinned.
Aggregation aller Δt<0‑Fälle über Runs.
Berechnung der expires_at_dist_hours‑Verteilung.
Bestimmung der 24h‑Schwelle basierend auf 6/7 Fällen unter dieser Grenze.

Input / Output

Input-Anforderungen

Hardware:

Standard‑Analyseumgebung ohne spezielle Sensorik

Software:

Data‑Collection‑Pipeline mit Zeitstempel‑Erfassung

Konfiguration:

Exit‑Regel v1
Konstante Instrumentierung während Runs #6–#10

Erwartete Rohdaten

Felder pro Run:

run_id
stratum
corr_id
t_gate_read
t_index_visible
expires_at_dist_hours

Formatbeispiele:

run=10, stratum=unpinned, corr_id=U10‑A, expires_at_dist_hours=9.4, Δt_sign=negativ

Trace-Daten:

Format: Tabellarische Textaufzeichnung oder CSV
Hinweis: Einträge pro Run konsistent formatiert; keine Feature‑Änderungen zwischen Runs.

Analyse-Ausgaben

Pro Gruppe / pro Governor:

warn_rate ≈ 0.06 (pinned)
unknown_rate ≈ 0.00 (pinned)
Δt<0 count pro Stratum

Vergleichsausgaben:

pinned vs unpinned
- Δ: Δt<0 proportion difference
- RR: Erhöhtes Risiko negativer Lags bei unpinned‑Runs
Trace-Muster: Konsistent negatives Lag‑Vorzeichen in allen Δt<0‑Fällen.

Workflow / Nutzung

Analyse-Workflow:

Sammle Δt‑Metriken pro Run.
Trenne Daten nach Strata (pinned/unpinned).
Prüfe Lag‑Vorzeichenverteilung.
Aggregiere Near‑Expiry‑Kandidaten (expires_at_dist_hours < 24h).
Setze Schwelle = 24h als Regeldefinition.
Dokumentiere Regel für A/B‑Test‑Konfiguration.

Trace-Template-Anforderungen

Ziel: Konsistente Erhebung von Timing‑Differenzen zur Stabilitätsbewertung.

Erforderliche Tags & Metadaten:

corr_id
t_gate_read
t_index_visible
expires_at_dist_hours

trace-cmd-Setup:

Verwende gleiche Logging‑Parameter über alle Runs.
Deaktiviere Zwischenpuffer für Echtzeit‑Erfassung.

Run-Design für Contributors:

Halte Instrumentierung konstant.
Verändere keine Systemparameter während der Baseline‑Runs.

Interpretation & erwartete Ergebnisse

Kernbefunde:

Δt<0‑Fälle ausschließlich bei unpinned‑Runs beobachtet.
Kein einziger positiver Lag‑Wert in der beobachteten Serie.
6 von 7 negativen Fällen mit expires_at_dist_hours < 24h.

Implikationen für Experimente:

Die empirisch begründete Schwelle reduziert Zufallseinflüsse.
Die Regel Near‑Expiry := expires_at_dist_hours < 24h kann als deterministische Entscheidungsbasis dienen.
Die 24–48h‑Zone bleibt als Monitoring‑Bereich aktiv, jedoch ohne Regelbeteiligung.

Planungsziel:

Ziel: Schaffung einer sauberen, überprüfbaren Entscheidungslogik für Near‑Expiry‑Erkennung.
Vorgehen:
- Datengetriebene Schwellenwertbestimmung
- Baseline‑Validierung über stabile Run‑Serie

Limitationen & Fallstricke

Datenbezogene Limitationen:

Einzelfall mit >24h (31.5h) könnte auf unerkannten Sonderfall hinweisen.
Kleine Stichprobe (7 Δt<0‑Fälle) begrenzt statistische Aussagekraft.

Kausalität & Generalisierbarkeit:

Korrelation zwischen Near‑Expiry und negativem Lag nicht notwendigerweise kausal.
Ergebnisse gelten nur für Testsystem mit Exit‑Regel v1.

Praktische Fallstricke:

Schwellenänderung in späteren Runs erfordert Re‑Kalibrierung der Regel.
Fehlerhafte Zeitsynchronisation kann Δt‑Sign verfälschen.

Nächste Schritte & Erweiterungen

Geplante Experimente:

Durchführung eines A/B‑Tests mit Near‑Expiry‑Schwelle <24h vs. Kontrollgruppe ohne Schwelle.

Analyseziele:

Überprüfung der Regelauswirkungen auf Lag‑Verteilung und Fehlerraten.

Regression & Modellierung:

Langfristig Modellierung der Lag‑Verteilung als Funktion der Restlaufzeit.

Community-Beiträge:

Validierung durch weitere Runs mit standardisierter Trace‑Template‑Einhaltung.

5.6 KiB Raw Blame History Unescape Escape