run_11_fresh_vs_near_expiry/artifact.3/README.md
2026-03-04 15:16:39 +00:00

154 lines
4.9 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# A/B-Test Dokumentation Fresh vs Near-Expiry (Run #11)
## Purpose
Untersuchung, ob NearExpiry Produkte die Ursache für negative Zeitstempel-Differenzen (Δt < 0) sind.
**Problemstellung:** Vorherige Runs zeigten Δt < 0Fälle, deren Ursache unklar war. Es wird geprüft, ob NearExpiry Produkte den Effekt verursachen.
**Ziele:**
- Validierung der Hypothese, dass NearExpiry ein technischer Einflussfaktor auf Zeitdifferenzen ist.
- Beibehaltung eines minimalen, kontrollierten A/BTestSetups ohne neue Instrumentierung.
## Kontext & Hintergrund
Erfasste Laufdaten mit Metriken zu warn_rate, unknown_rate und ΔtBedingungen in Gruppen Fresh und NearExpiry, jeweils nach Stratum pinned/unpinned
**Gruppierung:**
- fresh/pinned
- fresh/unpinned
- nearexpiry/pinned
- nearexpiry/unpinned
**Trace-Metadaten / zusätzliche Tags:**
- expires_at_dist_hours
- t_gate_read
- t_index_visible
- corr_id
**Domänenkontext:**
- ZeitstempelKonsistenzanalyse in A/BTestRuns
- Verlaufsmessung technischer Metriken unter unterschiedlichen Produkt-Zuständen
**Outlier-Definition:**
- Methode: delta_t_negative_detection
- Beschreibung: Ein Lauf wird als Ausreißer markiert, wenn Δt = (t_gate_read t_index_visible) < 0.
- Metrik: Δt
**Motivation:**
- Erkennen zeitlicher Unstimmigkeiten bei NearExpiry Items
- Sicherung synchroner Prozessverläufe in Produktionssystemen
## Methode / Spezifikation
**Übersicht:**
- Zwei Gruppen im A/BDesign: Gruppe A = fresh (expires_at_dist_hours 72h), Gruppe B = nearexpiry (expires_at_dist_hours < 24h).
- Stratifizierung nach pinned/unpinned Konfiguration.
- ExitRegel v1 unverändert, keine Änderung an Instrumentierung.
**Algorithmen / Verfahren:**
- Berechnung relativer Raten: warn_rate, unknown_rate, Δt<0Vorkommen je Gruppe und Stratum.
- Vergleich der Δt<0Anteile zwischen A und B im unpinnedStratum als zentrale Hypothesenprüfung.
## Input / Output
### Erwartete Rohdaten
**Felder pro Run:**
- corr_id
- expires_at_dist_hours
- t_gate_read
- t_index_visible
- warn_flag
- pinned_flag
**Formatbeispiele:**
- corr_id=9f2c…, expires_at_dist_hours=5.9, Δt=00:02:41
**Trace-Daten:**
- Format: Tabellarisch nach Gruppen (A/B × pinned/unpinned)
- Hinweis: Jede Zelle enthält warn_rate, unknown_rate und Δt<0Zählung.
### Analyse-Ausgaben
**Pro Gruppe / pro Governor:**
- warn_rate
- unknown_rate
- Δt<0_count
**Vergleichsausgaben:**
- fresh-unpinned vs near-expiry-unpinned
- Δ: Δt<0: 0% vs 3 Fälle
- RR: undefiniert (0 vs >0)
- Trace-Muster: Δt<0Fälle treten nur bei nearexpiryunpinned auf.
## Workflow / Nutzung
**Analyse-Workflow:**
- Daten pro Run erfassen.
- Nach Gruppenzuordnung (fresh/nearexpiry) und Stratum (pinned/unpinned) aggregieren.
- Anteile für warn_rate und Δt<0 berechnen.
- Effektvergleich durchführen, Entscheidungsregel anwenden.
### Trace-Template-Anforderungen
**Ziel:** Identifikation von Zeitdifferenzen in Ablaufprozessen bei NearExpiry Items
**Erforderliche Tags & Metadaten:**
- expires_at_dist_hours
- pinned_flag
- t_gate_read
- t_index_visible
**trace-cmd-Setup:**
- Keine neue Instrumentierung, bestehendes Setup unverändert einsetzen.
**Run-Design für Contributors:**
- A/BZuteilung nach expires_at_dist_hours, identische Pipelines für beide Gruppen.
## Interpretation & erwartete Ergebnisse
**Kernbefunde:**
- Δt<0 tritt ausschließlich in nearexpiryunpinned auf.
- PinnedStrata sind stabil, unabhängig vom Produktzustand.
- Warn und unknownRaten sind über beide Gruppen nahezu gleich.
**Implikationen für Experimente:**
- NearExpiry beeinflusst Zeitkonsistenz signifikant im unpinnedStratum.
- Künftige Runs sollen bestätigen, ob der Effekt stabil wiederholbar ist.
**Planungsziel:**
- Ziel: Überprüfung der Stabilität des NearExpiryEffekts über mehrere Runs hinweg.
- Vorgehen:
- Keine Änderungen, passives Beobachten über 2448h.
- Mindestens ein weiterer Run mit identischem Setup.
## Limitationen & Fallstricke
**Datenbezogene Limitationen:**
- Nur ein Run (#11) vorhanden; statistische Absicherung fehlt.
- Gruppengrößen nicht spezifiziert.
**Kausalität & Generalisierbarkeit:**
- Kausalität nur vermutet, nicht bewiesen.
- Effekt kann zufallsbedingt oder durch Nebenbedingungen verursacht sein.
**Praktische Fallstricke:**
- Verfrühte operative Maßnahmen ohne Replikation riskant.
- Nur Beobachtung empfohlen, keine sofortige Regeländerung.
## Nächste Schritte & Erweiterungen
**Geplante Experimente:**
- Run #12 mit gleichem Setup zur Validierung des NearExpiryEffekts.
**Analyseziele:**
- Überprüfung der Wiederholbarkeit von Δt<0 bei nearexpiryunpinned.
- Messung der Stabilität über mehrere 24hZyklen.
**Regression & Modellierung:**
- Optional: logistische Regression Δt<0 ~ expires_at_dist_hours + pinned_flag.
**Community-Beiträge:**
- Diskussion der NearExpiryBehandlung auf MissionControl Forum (Tag 166).