# Run Set Analysis N=40

## Überblick
Dieses Repository enthält das Experiment **run_set_analysis_n40**. Ziel ist die Durchführung und Analyse von Run-Sets mit einer Stichprobengröße von N=40 zur Klassifikation von Retry-Verhalten und Stabilität in Schritt-Sequenzen.

**Artikel:** [https://donau2space.de/tag-123-1341-klarer-himmel-ueber-passau-und-ich-ziehe-das-n40-run-set-endlich-durch/](https://donau2space.de/tag-123-1341-klarer-himmel-ueber-passau-und-ich-ziehe-das-n40-run-set-endlich-durch/)  
**Git Repository:** [https://git.donau2space.de/Mika/run_set_analysis_n40](https://git.donau2space.de/Mika/run_set_analysis_n40)

### Hinweis
Alle Inhalte wurden per KI generiert.
Nutzung, Anpassung und Weiterentwicklung erfolgen eigenverantwortlich auf eigenes Risiko. Es wird keine Korrektheit, Sicherheit, Funktionsfähigkeit oder rechtliche Eignung zugesichert.

## Inhalt des Repositories
Das Repository umfasst zwei Hauptartefakte:

### 1. trace_agg
- **Art:** Python-Skript (`python_script`)
- **Zielumgebung:** Linux Userspace
- **Sprachen:** Python
- **Zweck:** Durchführung von Analysen zur Klassifikation von Retries und Fensterzeiten pro Run.

**API-Funktionen:**
- **classify_runs(run_data)** → Klassifiziert einzelne Runs basierend auf Retry- und Fensterstatistiken.
- **compute_spearman_correlation(retry_count, window_duration)** → Berechnet den Spearman-Korrelationskoeffizienten zwischen Retry-Häufigkeit und Fensterdauer.
- **calculate_edit_distance(step_sequence, pinned_median_sequence)** → Berechnet die Abstandsmetrik zwischen Schrittsequenzen und einer Median-Referenzsequenz.

**Datenstrukturen:**
- **RunData (json)**: Felder `run_id`, `retry_free_reads`, `window_duration`
- **ClassificationResults (json)**: Felder `run_id`, `step_stability_score`, `correlation_coefficient`

### 2. results_visualization
- **Art:** Web-Oberfläche (`web_ui`)
- **Zielumgebung:** Webbrowser
- **Sprachen:** HTML, CSS, JavaScript
- **Zweck:** Interaktive Visualisierung der Analyseergebnisse in Diagrammform.

**API-Funktionen:**
- **fetch_results()** → Ruft aktuelle Analyseergebnisse ab und stellt sie für die Visualisierung bereit.

**Routen:**
- `GET /api/results` → Liefert aktuelle Analyseergebnisse im JSON-Format.

**JavaScript-Module:**
- `chart.js` für die Darstellung der Diagramme.

## Voraussetzungen
Für die Weboberfläche wird ein moderner Webbrowser benötigt. Optional kann ein lokaler Webserver (z. B. nginx, Apache oder Python HTTP-Server) eingesetzt werden, um die Visualisierungsseite bereitzustellen.

Zur Ausführung des Analyse-Skripts wird Python 3.9 oder höher empfohlen.

## Installation & Nutzung

### Python-Skript ausführen
1. Repository klonen:
   ```bash
   git clone https://git.donau2space.de/Mika/run_set_analysis_n40.git
   cd run_set_analysis_n40
   ```
2. Abhängigkeiten installieren:
   ```bash
   pip install -r requirements.txt
   ```
3. Analyse starten:
   ```bash
   python trace_agg.py input/run_data.json
   ```

### Web-UI starten
1. In das Webverzeichnis wechseln:
   ```bash
   cd results_visualization
   ```
2. Lokalen Server starten:
   ```bash
   python3 -m http.server 8080
   ```
3. Web-UI im Browser öffnen: [http://localhost:8080](http://localhost:8080)

## Typische Use-Cases
- Analyse von Run-Sets mit Fokus auf Retry-Mustern und Stabilität.
- Vergleich von Schrittsequenzen auf Abweichungen.
- Überwachung von Test- oder Produktionsläufen hinsichtlich Zuverlässigkeit.
- Visualisierung von Korrelationen und Abweichungen im Zeitverlauf.

## Struktur & Erweiterbarkeit
- **trace_agg.py:** Zentrale Analyselogik mit erweiterbarer API.
- **results_visualization/:** Weboberfläche zur Ergebnisauswertung.
- Erweiterungspotenzial:
  - Neue Klassifikationsmetriken im Python-Skript.
  - Zusätzliche Diagrammtypen in der Web-UI.
  - Integration weiterer Datenquellen.

## Lizenz
Dieses Projekt steht unter der **MIT-Lizenz**.

*Hinweis:* Alle Inhalte wurden automatisch generiert. Verwendung und Modifikation auf eigenes Risiko.