From 0cdc85c78371aea51b82531c0e5e31317b969912 Mon Sep 17 00:00:00 2001 From: Mika Date: Tue, 3 Feb 2026 17:11:48 +0000 Subject: [PATCH] Add README.md --- README.md | 109 ++++++++++++++++++++++++++++++++++++++++++++++++++++++ 1 file changed, 109 insertions(+) create mode 100644 README.md diff --git a/README.md b/README.md new file mode 100644 index 0000000..bc87cc2 --- /dev/null +++ b/README.md @@ -0,0 +1,109 @@ +# Drift Report Analysis + +## Überblick + +Das Projekt **drift_report_analysis** automatisiert die Analyse von *drift_report.json*-Dateien zur Verbesserung von Audit-Statistiken und Entscheidungsgrundlagen. Es bietet Python-Skripte zur Datenauswertung sowie generierte CSV-Aggregationen für weiterführende Berichte. + +### Hinweis + +Alle Inhalte wurden per KI generiert. + +Nutzung, Anpassung und Weiterentwicklung erfolgen eigenverantwortlich auf eigenes Risiko. Es wird keine Korrektheit, Sicherheit, Funktionsfähigkeit oder rechtliche Eignung zugesichert. + +--- + +**Artikel:** [Tag 138 – 100 Runs ohne Ausreden: Mein Audit liest jetzt drift_report.json stapelweise](https://donau2space.de/tag-138-100-runs-ohne-ausreden-mein-audit-liest-jetzt-drift_report-json-stapelweise/) + +**Git Repository:** [https://git.donau2space.de/Mika/drift_report_analysis](https://git.donau2space.de/Mika/drift_report_analysis) + +--- + +## Inhalt des Repositories + +### 1. audit_drift_script +- **Art:** Python-Skript +- **Ziel:** Linux Userspace +- **Sprache:** Python +- **Zweck:** Analysiert mehrere *drift_report.json*-Dateien, aggregiert Statistiken und erstellt Audit-Auswertungen. + +**API-Funktionen:** +- `analyze_reports(directory_path)` – liest alle Reports im angegebenen Verzeichnis, extrahiert Metriken und gibt aggregierte Ergebnisse zurück. + +**Datenstruktur:** *ReportData (JSON)* – Felder: *timestamp*, *run_id*, *stratum*, *decision*, *warn_rate*, *unknown_rate*. + +--- + +### 2. audit_report_aggregation +- **Art:** CSV-Dataset +- **Ziel:** Linux Userspace +- **Sprache:** CSV +- **Zweck:** Enthält tabellarisch aggregierte Prüfungsergebnisse pro Stratum. + +**API-Funktionen:** +- `generate_aggregation_csv(aggregation_results)` – erzeugt eine neue CSV-Datei auf Basis der Analyseergebnisse. + +**Datenstruktur:** *AggregationResult (Tabelle)* – Felder: *stratum*, *count*, *pass_rate*, *warn_rate*, *fail_rate*. + +--- + +### 3. unknowns_classifier +- **Art:** Python-Skript +- **Ziel:** Linux Userspace +- **Sprache:** Python +- **Zweck:** Klassifiziert unbekannte Status von Runs und ergänzt die Audit-Auswertung. + +**API-Funktionen:** +- `classify_unknowns(unknown_cases)` – analysiert und gruppiert unbekannte Fälle nach Typen. + +**Datenstruktur:** *UnknownClassification (JSON)* – Felder: *unknown_type*, *count*. + +--- + +## Installation & Nutzung + +### Voraussetzungen +- Linux-System mit Python 3.8 oder neuer +- Pip verfügbar +- Empfohlene Python-Pakete: *pandas*, *json*, *csv* + +### Installation +1. Repository klonen: + `git clone https://git.donau2space.de/Mika/drift_report_analysis` +2. In das Verzeichnis wechseln: + `cd drift_report_analysis` +3. Abhängigkeiten installieren: + `pip install -r requirements.txt` + +### Nutzung +- Analyse starten: + `python audit_drift_script.py /pfad/zu/drift_reports/` +- Unbekannte Fälle klassifizieren: + `python unknowns_classifier.py /pfad/zu/unknown_cases.json` +- Aggregierte CSV-Ergebnisse befinden sich im Ausgabeverzeichnis (Standard: *output/audit_report_aggregation.csv*). + +--- + +## Typische Use-Cases +- Automatisierte Audit-Überwachung und Trendanalyse über mehrere Runs hinweg. +- Bereitstellung von CSV-Statistiken für Dashboards und Monitoring-Systeme. +- Analyse der Wahrnehmung und Häufigkeit unbekannter Audit-Ergebnisse. +- Unterstützung bei der Verbesserung von Qualitätsentscheidungen in Audit-Pipelines. + +--- + +## Struktur & mögliche Erweiterungen +- **scripts/** – enthält Python-Auswertungslogik. +- **data/** – Beispiel- oder Eingabedateien (*drift_report.json*). +- **output/** – generierte Aggregationsdaten (CSV). + +**Erweiterungsvorschläge:** +- Integration einer Web-Oberfläche zur interaktiven Ergebnisbetrachtung. +- Erweiterung um Machine-Learning-Komponenten zur Anomalieerkennung. +- Unterstützung zusätzlicher Dateiformate. + +--- + +## Lizenz +Dieses Projekt steht unter der **MIT-Lizenz**. + +Verwendung und Modifikation sind erlaubt, jedoch erfolgt die Nutzung auf eigene Verantwortung. \ No newline at end of file