Auto experiment repo from n8n
Find a file
2026-02-03 17:11:48 +00:00
audit_drift_script Add audit_drift_script/requirements.txt 2026-02-03 17:11:45 +00:00
audit_report_aggregation Add audit_report_aggregation/audit_aggregation.csv 2026-02-03 17:11:48 +00:00
unknowns_classifier Add unknowns_classifier/requirements.txt 2026-02-03 17:11:47 +00:00
LICENCE.md Add LICENCE.md 2026-02-03 17:11:48 +00:00
README.md Add README.md 2026-02-03 17:11:48 +00:00

Drift Report Analysis

Überblick

Das Projekt drift_report_analysis automatisiert die Analyse von drift_report.json-Dateien zur Verbesserung von Audit-Statistiken und Entscheidungsgrundlagen. Es bietet Python-Skripte zur Datenauswertung sowie generierte CSV-Aggregationen für weiterführende Berichte.

Hinweis

Alle Inhalte wurden per KI generiert.

Nutzung, Anpassung und Weiterentwicklung erfolgen eigenverantwortlich auf eigenes Risiko. Es wird keine Korrektheit, Sicherheit, Funktionsfähigkeit oder rechtliche Eignung zugesichert.


Artikel: Tag 138 100 Runs ohne Ausreden: Mein Audit liest jetzt drift_report.json stapelweise

Git Repository: https://git.donau2space.de/Mika/drift_report_analysis


Inhalt des Repositories

1. audit_drift_script

  • Art: Python-Skript
  • Ziel: Linux Userspace
  • Sprache: Python
  • Zweck: Analysiert mehrere drift_report.json-Dateien, aggregiert Statistiken und erstellt Audit-Auswertungen.

API-Funktionen:

  • analyze_reports(directory_path) liest alle Reports im angegebenen Verzeichnis, extrahiert Metriken und gibt aggregierte Ergebnisse zurück.

Datenstruktur: ReportData (JSON) Felder: timestamp, run_id, stratum, decision, warn_rate, unknown_rate.


2. audit_report_aggregation

  • Art: CSV-Dataset
  • Ziel: Linux Userspace
  • Sprache: CSV
  • Zweck: Enthält tabellarisch aggregierte Prüfungsergebnisse pro Stratum.

API-Funktionen:

  • generate_aggregation_csv(aggregation_results) erzeugt eine neue CSV-Datei auf Basis der Analyseergebnisse.

Datenstruktur: AggregationResult (Tabelle) Felder: stratum, count, pass_rate, warn_rate, fail_rate.


3. unknowns_classifier

  • Art: Python-Skript
  • Ziel: Linux Userspace
  • Sprache: Python
  • Zweck: Klassifiziert unbekannte Status von Runs und ergänzt die Audit-Auswertung.

API-Funktionen:

  • classify_unknowns(unknown_cases) analysiert und gruppiert unbekannte Fälle nach Typen.

Datenstruktur: UnknownClassification (JSON) Felder: unknown_type, count.


Installation & Nutzung

Voraussetzungen

  • Linux-System mit Python 3.8 oder neuer
  • Pip verfügbar
  • Empfohlene Python-Pakete: pandas, json, csv

Installation

  1. Repository klonen:
    git clone https://git.donau2space.de/Mika/drift_report_analysis
  2. In das Verzeichnis wechseln:
    cd drift_report_analysis
  3. Abhängigkeiten installieren:
    pip install -r requirements.txt

Nutzung

  • Analyse starten:
    python audit_drift_script.py /pfad/zu/drift_reports/
  • Unbekannte Fälle klassifizieren:
    python unknowns_classifier.py /pfad/zu/unknown_cases.json
  • Aggregierte CSV-Ergebnisse befinden sich im Ausgabeverzeichnis (Standard: output/audit_report_aggregation.csv).

Typische Use-Cases

  • Automatisierte Audit-Überwachung und Trendanalyse über mehrere Runs hinweg.
  • Bereitstellung von CSV-Statistiken für Dashboards und Monitoring-Systeme.
  • Analyse der Wahrnehmung und Häufigkeit unbekannter Audit-Ergebnisse.
  • Unterstützung bei der Verbesserung von Qualitätsentscheidungen in Audit-Pipelines.

Struktur & mögliche Erweiterungen

  • scripts/ enthält Python-Auswertungslogik.
  • data/ Beispiel- oder Eingabedateien (drift_report.json).
  • output/ generierte Aggregationsdaten (CSV).

Erweiterungsvorschläge:

  • Integration einer Web-Oberfläche zur interaktiven Ergebnisbetrachtung.
  • Erweiterung um Machine-Learning-Komponenten zur Anomalieerkennung.
  • Unterstützung zusätzlicher Dateiformate.

Lizenz

Dieses Projekt steht unter der MIT-Lizenz.

Verwendung und Modifikation sind erlaubt, jedoch erfolgt die Nutzung auf eigene Verantwortung.