# Vergleich der Varianz von BPF und kprobe sowie Einfluss eines 0,5 mm Spacers auf HF-Amplituden ## Purpose Analyse der Varianzunterschiede zwischen BPF und kprobe unter identischen Kernel-/Governor-Bedingungen sowie Untersuchung der elektro-mechanischen Dämpfungswirkung eines 0,5 mm Spacers auf HF-Amplituden. **Problemstellung:** Frühere qualitative Beobachtungen deuteten auf geringere Streuung bei BPF hin, jedoch fehlte eine belastbare Varianzprüfung. Zudem sollte geklärt werden, ob ein 0,5 mm Spacer mechanisch oder elektrisch wirkt. **Ziele:** - Quantitative Bestimmung der Varianzreduktion durch BPF gegenüber kprobe. - Statistische Validierung der beobachteten Unterschiede mittels Levene-Test und Bootstrap-Verfahren. - Bewertung der Auswirkung eines 0,5 mm Spacers auf Amplituden und Outlier-Struktur in HF-Traces. ## Kontext & Hintergrund Messreihen mit 240 Samples pro Methode (BPF, kprobe) bei identischen Kernel- und Governor-Settings. Additional Spacer-Messungen (0 mm vs. 0,5 mm) mit je 50 Runs. **Gruppierung:** - BPF - kprobe - Spacer 0 mm - Spacer 0,5 mm **Trace-Metadaten / zusätzliche Tags:** - clocksource_switch - Humidity log (3°C) - Timing-Trace Outlier Detection **Domänenkontext:** - Kernel Instrumentation - Timing Variance Analysis - Signal Integrity **Outlier-Definition:** - Methode: Trace-basierte Outlier-Erkennung - Beschreibung: Spike-Detektion in HF-Amplitudendaten; Outlier als Abweichungen über festgelegtem Schwellenwert. - Metrik: Amplitude / Timing Delta **Motivation:** - Stabilisierung von Performance-Messungen bei Kernel-Instrumentierung. - Reduktion von Messrauschen in eBPF-basierten Tests. - Bewertung elektrischer Kopplungseffekte durch mechanische Abstandshalter. ## Methode / Spezifikation **Übersicht:** - Vergleichende Messung von kprobe und BPF mittels identischer Settings. - Statistische Analyse der Varianzunterschiede mit Levene-Test. - Bootstrap-basierte Konfidenzintervall-Berechnung für Differenzen der Standardabweichungen. - Spacer-Experiment zur Analyse der HF-Dämpfung. **Algorithmen / Verfahren:** - Levene-Test zur Prüfung der Varianzgleichheit: p≈1.2e-4. - Bootstrap mit 10.000 Resamples, 95%-Intervall berechnet für (σ_kprobe − σ_BPF). - Vergleich der Amplitudenmittel aus Oszilloskopdaten bei 0 mm und 0,5 mm Spacer. - Korrelationsprüfung zwischen Umgebungstemperatur und Residuen (r≈0,03). ### Bootstrap-Übersicht Nichtparametrisches Resampling zur Schätzung des Konfidenzintervalls für Varianzunterschiede. **Zielgrößen:** - Differenz der Standardabweichungen - Risikoabschätzung Varianzstabilität ### Resampling-Setup - BPF - kprobe **Stichprobeneinheit:** Einzelmessung der Timing-Latenz (ms) **Resampling-Schema:** - 10000 Bootstrap-Replikate pro Gruppe **Konfidenzintervalle:** - Niveau: 0.95 - Typ: Bootstrap-basiert - Ableitung: Empirisches 2,5%- und 97,5%-Perzentil der Bootstrap-Verteilung ### Abgeleitete Effektgrößen **Risk Difference (Differenz der Raten):** - Definition: Nicht relevant (kaum kategoriale Variablen). **Risk Ratio:** - Definition: Vergleich der relativen Varianzunterschiede zwischen Methoden. - Bootstrap: Abschätzung über Verhältnis σ_BPF / σ_kprobe. ### C-State-Kontrolle **Ziel:** Minimierung von Nebeneinflüssen auf Takt- und Energiestatus. **Vorgehen:** - Fixierte Governor-Einstellungen. - Keine dynamische Frequenzskalierung während der Messreihen. ## Input / Output ### Input-Anforderungen **Hardware:** - Messsonde - HF-Oszilloskop - Temperaturlogger **Software:** - Linux Kernel mit aktivem BPF-Subsystem - Python mit scipy, numpy - Bootstrap-Skript **Konfiguration:** - Governor fixiert - clocksource_switch aktiv - Feuchtigkeitskonstante 3 °C Umgebung ### Erwartete Rohdaten **Felder pro Run:** - timestamp - method - latency_ms - amplitude - temperature_C **Formatbeispiele:** - 2024-06-04T11:32:01Z,BPF,6.72,0.85,3.0 **Trace-Daten:** - Format: tabellarisch (CSV oder JSONL) - Hinweis: Enthält HF-Spikes und Zeitdifferenzen, erfasst über clocksource_switch. ### Analyse-Ausgaben **Pro Gruppe / pro Governor:** - σ - Median - Varianz - 95%-Bootstrap-Intervall - Levene-p **Vergleichsausgaben:** - kprobe vs BPF - Δ: ≈ 1,7 ms σ-Differenz - CI(Δ): [1,1 ms, 2,3 ms] - RR: ≈ 0,60 (σ_BPF / σ_kprobe) - CI(RR): nicht angegeben - Tests: 1.2e-4 - C-State-Korrelation: nicht signifikant (r≈0,03) - Trace-Muster: Weniger Spike-Outlier bei 0,5 mm Spacer ## Workflow / Nutzung **Analyse-Workflow:** - Erfassung der Messreihen mit fixierten Kernel-/Governor-Parametern. - Anwendung des Levene-Tests auf die Varianzen pro Methode. - Bootstrap-basierte Konfidenzintervallbestimmung. - HF-Analyse der Spacer-Messungen. - Integration der Ergebnisse in PR-Text und CI-Testkonfiguration. ### Trace-Template-Anforderungen **Ziel:** Reproduzierbare Erfassung von Timing-Streuungen über clocksource_switch. **Erforderliche Tags & Metadaten:** - method - timestamp - latency_ms - ambient_temp **trace-cmd-Setup:** - Verwendung von trace-cmd mit Filter clocksource_switch **Run-Design für Contributors:** - N = 240 pro Methode, Nightly-N = 1000, stratified sampling ## Interpretation & erwartete Ergebnisse **Kernbefunde:** - BPF zeigt unter identischen Bedingungen eine signifikant geringere Varianz als kprobe (σ-Differenz ≈ 1,7 ms). - Bootstrap- und Levene-Ergebnisse bestätigen statistische Signifikanz. - 0,5 mm Spacer reduziert HF-Amplituden um ca. 58 % und senkt Spike-Outlier-Anzahl. **Implikationen für Experimente:** - BPF kann als Standardmethode für stabilere Timing-Messungen verwendet werden. - Spacer-Einsatz verändert elektrische Kopplung signifikant und sollte berücksichtigt werden. - Künftige Runs sollten kontrollierte Umgebungsbedingungen (Feuchte, Temperatur) einbeziehen. **Planungsziel:** - Ziel: Reproduzierbare Stabilitätsnachweise für BPF und elektrische Charakterisierung des Spacers. - Vorgehen: - Statistische Varianztests - HF-Signalbeobachtung - Bootstrap-basierte Unsicherheitsabschätzung ## Limitationen & Fallstricke **Datenbezogene Limitationen:** - Begrenzte Stichprobengröße für Spacer-Messung (N = 50). - Einzelsessions, keine Multihost-Replikation. **Bootstrap-spezifische Limitationen:** - Bootstrap-Intervalle sensibel gegenüber Ausreißern in kleinen Samples. - Resampling-Annahme der Unabhängigkeit muss geprüft werden. **Kausalität & Generalisierbarkeit:** - Schlussfolgerung gilt nur für geprüfte Kernel-/Governor-Konfiguration. - Elektrische Effekte des Spacers abhängig von Hardwareaufbau. **Praktische Fallstricke:** - Feuchtigkeitseinfluss bei Außenmessung. - Spacer-Montage kann Messgeometrie unbeabsichtigt verändern. ## Nächste Schritte & Erweiterungen **Geplante Experimente:** - Spacer-Matrix-Messung (0/0,5/1/2 mm, N = 200 pro Gruppe) bei kontrollierter Feuchte. - Hardware-Vergleichstests mit Tag/Runner-Split. **Analyseziele:** - Bewertung der Nicht-Normalität mit Fligner-Test. - Erweiterung der Bootstrap-Analyse auf Amplitudenmetrik. **Regression & Modellierung:** - Aufbau eines Regressionsmodells zwischen Spacer-Abstand und Amplitudenreduktion. **Community-Beiträge:** - Bereitstellung der Levene+Bootstrap-Skripte als Notebook-Beilage im Repository. - Aufforderung an Reviewer zur Cross-Hardware-Verifikation.