Add logging_format/README.md
This commit is contained in:
parent
23ed15f58c
commit
985a5aa1fd
1 changed files with 165 additions and 0 deletions
165
logging_format/README.md
Normal file
165
logging_format/README.md
Normal file
|
|
@ -0,0 +1,165 @@
|
|||
# Logging-Format für Run #13 (minimale Intervention mit Retry-Mechanismus)
|
||||
|
||||
## Purpose
|
||||
|
||||
Spezifikation des erweiterten Logging-Formats für die Messungen im Run #13 mit minimaler Intervention zur Behandlung von Δt<0-Fällen.
|
||||
|
||||
**Problemstellung:** In Run #13 wurde ein inkonsistentes Auftreten von negativen Δt-Werten beobachtet. Es wurde ein Retry-Mechanismus eingeführt, der exakt einmal bei Δt<0 greift. Das Logging-Format musste erweitert werden, um Retry-Aktivität und Korrekturstatus erkennbar zu machen.
|
||||
|
||||
**Ziele:**
|
||||
- Kompatibilität mit Logging-Formaten der Runs #11 und #12 sicherstellen
|
||||
- Integration zusätzlicher Felder zur Nachverfolgung des Retry-Mechanismus
|
||||
- Analysefähigkeit für Δt<0-Kandidaten erhalten
|
||||
|
||||
## Kontext & Hintergrund
|
||||
|
||||
Zeitmessungen pro Stratum (fresh/near-expiry) und Pinning-Status (pinned/unpinned).
|
||||
|
||||
**Gruppierung:**
|
||||
- fresh-pinned
|
||||
- fresh-unpinned
|
||||
- near-expiry-pinned
|
||||
- near-expiry-unpinned
|
||||
|
||||
**Trace-Metadaten / zusätzliche Tags:**
|
||||
- Messzeitpunkt
|
||||
- Δt-Berechnung
|
||||
- Retry-Zustand
|
||||
|
||||
**Domänenkontext:**
|
||||
- Zeitmessstabilität bei near-expiry-Objekten
|
||||
- Einflussfaktoren auf Δt-Streuung
|
||||
- Laufzeitverhalten im Kurzfenster unter 200 ms
|
||||
|
||||
**Outlier-Definition:**
|
||||
- Methode: Δt<0-Erkennung
|
||||
- Beschreibung: Eine Messung gilt als Ausreißer, wenn die beobachtete Zeitdifferenz Δt negativ ist.
|
||||
- Metrik: Δt
|
||||
|
||||
**Motivation:**
|
||||
- Prüfen, ob minimaler Eingriff Fehlerfälle stabilisiert
|
||||
- Systemverhalten bei near-expiry-unpinned-Stratum isoliert analysieren
|
||||
- Kompatibilität der Messserien sicherstellen
|
||||
|
||||
## Methode / Spezifikation
|
||||
|
||||
**Übersicht:**
|
||||
- Ein Retry-Mechanismus wird bei Δt<0 ausgelöst.
|
||||
- Nach exakt einem Retry erfolgt erneute Messung.
|
||||
- Das zweite Ergebnis ersetzt das erste.
|
||||
- Keine Heuristiken oder mehrere Wiederholungen.
|
||||
|
||||
**Algorithmen / Verfahren:**
|
||||
- Erfassen von Δt pro Messung.
|
||||
- Prüfen auf Δt<0.
|
||||
- Falls true: warten um festen Delay.
|
||||
- Einmalige Wiederholung der Messung.
|
||||
- Speichern des Retry-Zustands im Log.
|
||||
|
||||
## Input / Output
|
||||
|
||||
### Erwartete Rohdaten
|
||||
|
||||
**Felder pro Run:**
|
||||
- timestamp
|
||||
- Δt
|
||||
- stratum
|
||||
- pinned
|
||||
- retry_taken
|
||||
- retry_fixed
|
||||
|
||||
**Formatbeispiele:**
|
||||
- {"timestamp":"2024-04-12T08:43:10.158Z","Δt":-18.2,"stratum":"near-expiry-unpinned","pinned":false,"retry_taken":true,"retry_fixed":true}
|
||||
|
||||
**Trace-Daten:**
|
||||
- Format: JSON-Zeilenformat
|
||||
- Hinweis: Die Felder retry_taken und retry_fixed sind nur im Stratum near-expiry-unpinned relevant.
|
||||
|
||||
### Analyse-Ausgaben
|
||||
|
||||
**Pro Gruppe / pro Governor:**
|
||||
- warn_rate
|
||||
- unknown_rate
|
||||
- count(Δt<0_pre_retry)
|
||||
- count(Δt<0_post_retry)
|
||||
|
||||
**Vergleichsausgaben:**
|
||||
- Run #12 vs Run #13
|
||||
- Δ: Δt<0-Inzidenz vor Retry vs. nach Retry
|
||||
|
||||
## Workflow / Nutzung
|
||||
|
||||
**Analyse-Workflow:**
|
||||
- Filterung nach Stratum near-expiry-unpinned.
|
||||
- Erkennen von Δt<0-Fällen.
|
||||
- Überprüfen, ob retry_taken==true.
|
||||
- Auswertung der retry_fixed-Raten.
|
||||
- Vergleich mit Vorläufen #11 und #12 zur Stabilitätsbewertung.
|
||||
|
||||
### Trace-Template-Anforderungen
|
||||
|
||||
**Ziel:** Kompatibilität der Logstruktur zwischen den Runs.
|
||||
|
||||
**Erforderliche Tags & Metadaten:**
|
||||
- timestamp
|
||||
- Δt
|
||||
- retry_taken
|
||||
- retry_fixed
|
||||
|
||||
**trace-cmd-Setup:**
|
||||
- Keine zusätzlichen Sensoren aktivieren.
|
||||
- Standardbuffergröße beibehalten.
|
||||
- Retry nur auf Δt<0 triggern.
|
||||
|
||||
**Run-Design für Contributors:**
|
||||
- Run-Struktur nicht ändern.
|
||||
- Messbedingungen gleich zu #11/#12 halten.
|
||||
- Keine neuen Strata oder Schwellen einführen.
|
||||
|
||||
## Interpretation & erwartete Ergebnisse
|
||||
|
||||
**Kernbefunde:**
|
||||
- Alle Δt<0-Kandidaten wurden durch einmaligen Retry korrigiert (retry_fixed=true).
|
||||
- Kein Anstieg der warn_rate oder unknown_rate im Vergleich zu Vorläufen.
|
||||
- Δt≥0 nach Retry in 100 % der beobachteten Fälle.
|
||||
|
||||
**Implikationen für Experimente:**
|
||||
- Einmaliger Retry kann Δt-Stabilität im near-expiry-Bereich sicherstellen.
|
||||
- Weitere Messungen mit größerer Stichprobe erforderlich zur Quantifizierung der Latenzkosten.
|
||||
|
||||
**Planungsziel:**
|
||||
- Ziel: Nachweis, dass minimaler Retry lokale Instabilität zuverlässig eliminiert.
|
||||
- Vorgehen:
|
||||
- Target-Stratum begrenzen.
|
||||
- Nur bei Δt<0 eingreifen.
|
||||
- Base configuration unverändert lassen.
|
||||
|
||||
## Limitationen & Fallstricke
|
||||
|
||||
**Datenbezogene Limitationen:**
|
||||
- Begrenzte Samplegröße reduziert Aussagekraft.
|
||||
- Retry-Dauer bisher nicht als Messgröße enthalten.
|
||||
|
||||
**Kausalität & Generalisierbarkeit:**
|
||||
- Ergebnis nur für near-expiry-unpinned-Stratum valide.
|
||||
- Kein Nachweis für langfristige Stabilisierung oder andere Kontexte.
|
||||
|
||||
**Praktische Fallstricke:**
|
||||
- Retry könnte in Lastsituationen Timingverhalten verzerren.
|
||||
- Fehlende Quantifizierung der Retry-Latenz.
|
||||
|
||||
## Nächste Schritte & Erweiterungen
|
||||
|
||||
**Geplante Experimente:**
|
||||
- Erweiterung der Stichprobe auf mehrere Tagesläufe.
|
||||
- Direkte Messung der Retry-Latenzzeit.
|
||||
|
||||
**Analyseziele:**
|
||||
- Quantitative Bewertung der Stabilisierung vs. Latenzkosten.
|
||||
- Überprüfung der Robustheit gegen Zufallsfluktuationen.
|
||||
|
||||
**Regression & Modellierung:**
|
||||
- Fit eines einfachen Modells zur Wahrscheinlichkeit Δt<0 vor und nach Retry.
|
||||
|
||||
**Community-Beiträge:**
|
||||
- Bereitstellung der Logformate zur externen Validierung und Reanalyse.
|
||||
Loading…
Reference in a new issue