Mika e55bb2dd11 Add experiment_documentation/README.md

2025-12-13 14:37:17 +00:00

7.2 KiB

Raw Blame History

Vergleich der Varianz von BPF und kprobe sowie Einfluss eines 0,5 mm Spacers auf HF-Amplituden

Purpose

Analyse der Varianzunterschiede zwischen BPF und kprobe unter identischen Kernel-/Governor-Bedingungen sowie Untersuchung der elektro-mechanischen Dämpfungswirkung eines 0,5 mm Spacers auf HF-Amplituden.

Problemstellung: Frühere qualitative Beobachtungen deuteten auf geringere Streuung bei BPF hin, jedoch fehlte eine belastbare Varianzprüfung. Zudem sollte geklärt werden, ob ein 0,5 mm Spacer mechanisch oder elektrisch wirkt.

Ziele:

Quantitative Bestimmung der Varianzreduktion durch BPF gegenüber kprobe.
Statistische Validierung der beobachteten Unterschiede mittels Levene-Test und Bootstrap-Verfahren.
Bewertung der Auswirkung eines 0,5 mm Spacers auf Amplituden und Outlier-Struktur in HF-Traces.

Kontext & Hintergrund

Messreihen mit 240 Samples pro Methode (BPF, kprobe) bei identischen Kernel- und Governor-Settings. Additional Spacer-Messungen (0 mm vs. 0,5 mm) mit je 50 Runs.

Gruppierung:

BPF
kprobe
Spacer 0 mm
Spacer 0,5 mm

Trace-Metadaten / zusätzliche Tags:

clocksource_switch
Humidity log (3°C)
Timing-Trace Outlier Detection

Domänenkontext:

Kernel Instrumentation
Timing Variance Analysis
Signal Integrity

Outlier-Definition:

Methode: Trace-basierte Outlier-Erkennung
Beschreibung: Spike-Detektion in HF-Amplitudendaten; Outlier als Abweichungen über festgelegtem Schwellenwert.
Metrik: Amplitude / Timing Delta

Motivation:

Stabilisierung von Performance-Messungen bei Kernel-Instrumentierung.
Reduktion von Messrauschen in eBPF-basierten Tests.
Bewertung elektrischer Kopplungseffekte durch mechanische Abstandshalter.

Methode / Spezifikation

Übersicht:

Vergleichende Messung von kprobe und BPF mittels identischer Settings.
Statistische Analyse der Varianzunterschiede mit Levene-Test.
Bootstrap-basierte Konfidenzintervall-Berechnung für Differenzen der Standardabweichungen.
Spacer-Experiment zur Analyse der HF-Dämpfung.

Algorithmen / Verfahren:

Levene-Test zur Prüfung der Varianzgleichheit: p≈1.2e-4.
Bootstrap mit 10.000 Resamples, 95%-Intervall berechnet für (σ_kprobe − σ_BPF).
Vergleich der Amplitudenmittel aus Oszilloskopdaten bei 0 mm und 0,5 mm Spacer.
Korrelationsprüfung zwischen Umgebungstemperatur und Residuen (r≈0,03).

Bootstrap-Übersicht

Nichtparametrisches Resampling zur Schätzung des Konfidenzintervalls für Varianzunterschiede.

Zielgrößen:

Differenz der Standardabweichungen
Risikoabschätzung Varianzstabilität

Resampling-Setup

BPF
kprobe

Stichprobeneinheit: Einzelmessung der Timing-Latenz (ms)

Resampling-Schema:

10000 Bootstrap-Replikate pro Gruppe

Konfidenzintervalle:

Niveau: 0.95
Typ: Bootstrap-basiert
Ableitung: Empirisches 2,5%- und 97,5%-Perzentil der Bootstrap-Verteilung

Abgeleitete Effektgrößen

Risk Difference (Differenz der Raten):

Definition: Nicht relevant (kaum kategoriale Variablen).

Risk Ratio:

Definition: Vergleich der relativen Varianzunterschiede zwischen Methoden.
Bootstrap: Abschätzung über Verhältnis σ_BPF / σ_kprobe.

C-State-Kontrolle

Ziel: Minimierung von Nebeneinflüssen auf Takt- und Energiestatus.

Vorgehen:

Fixierte Governor-Einstellungen.
Keine dynamische Frequenzskalierung während der Messreihen.

Input / Output

Input-Anforderungen

Hardware:

Messsonde
HF-Oszilloskop
Temperaturlogger

Software:

Linux Kernel mit aktivem BPF-Subsystem
Python mit scipy, numpy
Bootstrap-Skript

Konfiguration:

Governor fixiert
clocksource_switch aktiv
Feuchtigkeitskonstante 3 °C Umgebung

Erwartete Rohdaten

Felder pro Run:

timestamp
method
latency_ms
amplitude
temperature_C

Formatbeispiele:

2024-06-04T11:32:01Z,BPF,6.72,0.85,3.0

Trace-Daten:

Format: tabellarisch (CSV oder JSONL)
Hinweis: Enthält HF-Spikes und Zeitdifferenzen, erfasst über clocksource_switch.

Analyse-Ausgaben

Pro Gruppe / pro Governor:

σ
Median
Varianz
95%-Bootstrap-Intervall
Levene-p

Vergleichsausgaben:

kprobe vs BPF
- Δ: ≈ 1,7 ms σ-Differenz
- CI(Δ): [1,1 ms, 2,3 ms]
- RR: ≈ 0,60 (σ_BPF / σ_kprobe)
- CI(RR): nicht angegeben
- Tests: 1.2e-4
C-State-Korrelation: nicht signifikant (r≈0,03)
Trace-Muster: Weniger Spike-Outlier bei 0,5 mm Spacer

Workflow / Nutzung

Analyse-Workflow:

Erfassung der Messreihen mit fixierten Kernel-/Governor-Parametern.
Anwendung des Levene-Tests auf die Varianzen pro Methode.
Bootstrap-basierte Konfidenzintervallbestimmung.
HF-Analyse der Spacer-Messungen.
Integration der Ergebnisse in PR-Text und CI-Testkonfiguration.

Trace-Template-Anforderungen

Ziel: Reproduzierbare Erfassung von Timing-Streuungen über clocksource_switch.

Erforderliche Tags & Metadaten:

method
timestamp
latency_ms
ambient_temp

trace-cmd-Setup:

Verwendung von trace-cmd mit Filter clocksource_switch

Run-Design für Contributors:

N = 240 pro Methode, Nightly-N = 1000, stratified sampling

Interpretation & erwartete Ergebnisse

Kernbefunde:

BPF zeigt unter identischen Bedingungen eine signifikant geringere Varianz als kprobe (σ-Differenz ≈ 1,7 ms).
Bootstrap- und Levene-Ergebnisse bestätigen statistische Signifikanz.
0,5 mm Spacer reduziert HF-Amplituden um ca. 58 % und senkt Spike-Outlier-Anzahl.

Implikationen für Experimente:

BPF kann als Standardmethode für stabilere Timing-Messungen verwendet werden.
Spacer-Einsatz verändert elektrische Kopplung signifikant und sollte berücksichtigt werden.
Künftige Runs sollten kontrollierte Umgebungsbedingungen (Feuchte, Temperatur) einbeziehen.

Planungsziel:

Ziel: Reproduzierbare Stabilitätsnachweise für BPF und elektrische Charakterisierung des Spacers.
Vorgehen:
- Statistische Varianztests
- HF-Signalbeobachtung
- Bootstrap-basierte Unsicherheitsabschätzung

Limitationen & Fallstricke

Datenbezogene Limitationen:

Begrenzte Stichprobengröße für Spacer-Messung (N = 50).
Einzelsessions, keine Multihost-Replikation.

Bootstrap-spezifische Limitationen:

Bootstrap-Intervalle sensibel gegenüber Ausreißern in kleinen Samples.
Resampling-Annahme der Unabhängigkeit muss geprüft werden.

Kausalität & Generalisierbarkeit:

Schlussfolgerung gilt nur für geprüfte Kernel-/Governor-Konfiguration.
Elektrische Effekte des Spacers abhängig von Hardwareaufbau.

Praktische Fallstricke:

Feuchtigkeitseinfluss bei Außenmessung.
Spacer-Montage kann Messgeometrie unbeabsichtigt verändern.

Nächste Schritte & Erweiterungen

Geplante Experimente:

Spacer-Matrix-Messung (0/0,5/1/2 mm, N = 200 pro Gruppe) bei kontrollierter Feuchte.
Hardware-Vergleichstests mit Tag/Runner-Split.

Analyseziele:

Bewertung der Nicht-Normalität mit Fligner-Test.
Erweiterung der Bootstrap-Analyse auf Amplitudenmetrik.

Regression & Modellierung:

Aufbau eines Regressionsmodells zwischen Spacer-Abstand und Amplitudenreduktion.

Community-Beiträge:

Bereitstellung der Levene+Bootstrap-Skripte als Notebook-Beilage im Repository.
Aufforderung an Reviewer zur Cross-Hardware-Verifikation.

7.2 KiB Raw Blame History Unescape Escape