# pi_day_repetition_study ## Überblick Untersuchung der Stabilität von Leistungsdaten durch wiederholte Replikation von Tests zur Analyse von Ausreißern und Mustern. Ziel ist es, die Kausalität von Variablen zu testen und einen Cluster-Score zu definieren. **Link zum Artikel:** [https://donau2space.de/tag-177-pi-day-zwei-byte-identische-4x-runs-22-23-das-resonanzband-bleibt/](https://donau2space.de/tag-177-pi-day-zwei-byte-identische-4x-runs-22-23-das-resonanzband-bleibt/) **Git Repository:** [https://git.donau2space.de/Mika/pi_day_repetition_study](https://git.donau2space.de/Mika/pi_day_repetition_study) ### Hinweis Alle Inhalte wurden per KI generiert. Nutzung, Anpassung und Weiterentwicklung erfolgen eigenverantwortlich und auf eigenes Risiko. Es wird keine Korrektheit, Sicherheit, Funktionsfähigkeit oder rechtliche Eignung zugesichert. --- ## Inhalt des Repositories Das Repository enthält drei Python-Skripte, die gemeinsam den vollständigen Analysezyklus des Experiments **pi_day_repetition_study** abbilden. ### Artefaktliste #### 1. data_collection_tool - **Art:** python_script - **Ziel:** linux-userspace - **Sprache:** Python - **Zweck:** Automatisierte Erfassung und Speicherung von Laufzeitdaten aus Replikationsläufen - **API-Funktionen:** - `collect_performance_data(run_id)` – Erfasst Leistungsdaten eines bestimmten Laufes und speichert sie als Datenstruktur `data_dict`. - **Datentyp `data_dict`:** Felder: `run_id`, `p50`, `p95`, `max_alerts`, `total_overhead` #### 2. stability_analysis - **Art:** python_script - **Ziel:** linux-userspace - **Sprache:** Python - **Zweck:** Analyse der gesammelten Daten zur Erkennung von Stabilitätsclustern und Ausreißern - **API-Funktionen:** - `analyze_data(data_list)` – Identifiziert stabile Cluster und Muster in der Datengesamtheit und liefert `analysis_results`. - **Datentyp `analysis_results`:** Felder: `stable_cluster`, `outlier_counts`, `patterns` #### 3. report_generation - **Art:** python_script - **Ziel:** linux-userspace - **Sprache:** Python - **Zweck:** Erstellung eines strukturierten Berichts auf Basis der Analyseergebnisse - **API-Funktionen:** - `generate_report(analysis_results)` – Erzeugt einen Bericht und gibt den Speicherpfad `report_path` zurück. - **Datentyp `report_path`:** Feld: `file_location` --- ## Installation & Nutzung ### Voraussetzungen - Python 3.9 oder höher - Linux-Umgebung mit Zugriff auf Shell ### Installation 1. Repository klonen: ```bash git clone https://git.donau2space.de/Mika/pi_day_repetition_study.git cd pi_day_repetition_study ``` 2. Abhängigkeiten installieren (sofern vorhanden): ```bash pip install -r requirements.txt ``` ### Nutzung 1. Datenerfassung starten: ```bash python data_collection_tool.py ``` 2. Analyse ausführen: ```bash python stability_analysis.py ``` 3. Bericht generieren: ```bash python report_generation.py ``` --- ## Typische Use-Cases - Bewertung der Stabilität von Benchmark- oder Performancetests - Erkennung von systematischen Ausreißern in Replikationsläufen - Dokumentation wiederholter Messreihen mit Berichterstellung - Korrelation von Variablen zur Ermittlung möglicher Kausalbeziehungen --- ## Struktur & Erweiterbarkeit Das Projekt ist modular aufgebaut. Jedes Python-Skript kann separat oder im Verbund genutzt werden. - Erweiterbar durch zusätzliche Analysemodule oder alternative Formate für Berichte. - API-Strukturen im JSON-Format erleichtern Integration in vorhandene Pipelines. Empfohlene Erweiterungen: - Integration zusätzlicher Datenquellen - Erweiterung um visuelle Darstellung der Analyseergebnisse - Automatisierte Schwellentesterkennung --- ## Lizenz Veröffentlicht unter der **MIT-Lizenz**. Die Nutzung erfolgt auf eigenes Risiko. Für die bereitgestellten Skripte wird keine Gewährleistung übernommen.