Add metrics_reporting/src/metrics_reporting/core.py

2026-02-23 14:48:38 +00:00 · 2026-02-23 14:48:38 +00:00 · 09b1a74da6
commit 09b1a74da6
parent 7266062547
1 changed files with 74 additions and 0 deletions
--- a/metrics_reporting/src/metrics_reporting/core.py
+++ b/metrics_reporting/src/metrics_reporting/core.py
@ -0,0 +1,74 @@
+from __future__ import annotations
+import json
+import logging
+from typing import List, Dict, Any
+from dataclasses import dataclass, asdict
+from statistics import mean
+from pathlib import Path
+import pandas as pd
+
+logger = logging.getLogger(__name__)
+
+
+@dataclass
+class MetricSummary:
+    warn_rate: float
+    drift_detected: bool
+    performance: float
+
+
+def report_metrics(logs: List[Dict[str, Any]], threshold: float) -> Dict[str, Any]:
+    """Berechnet aggregierte Metriken aus Log-Daten zur Driftbewertung.
+
+    Args:
+        logs: Liste von Log-Einträgen (dicts) mit mindestens 'level' und 'duration' Feldern.
+        threshold: Schwellwert, ab dem eine Drift als signifikant gilt.
+
+    Returns:
+        Eine JSON-kompatible dict-Zusammenfassung der berechneten Kennzahlen.
+    """
+    assert isinstance(logs, list), "logs muss eine Liste von Dicts sein"
+    assert all(isinstance(l, dict) for l in logs), "Jeder Log-Eintrag muss ein Dict sein"
+    assert isinstance(threshold, (int, float)), "threshold muss float oder int sein"
+
+    if not logs:
+        logger.warning("Leere Log-Liste übergeben; gebe neutrale Metriken zurück.")
+        result = MetricSummary(warn_rate=0.0, drift_detected=False, performance=0.0)
+        return asdict(result)
+
+    try:
+        df = pd.DataFrame(logs)
+    except Exception as e:
+        logger.error(f"Fehler beim Erstellen eines DataFrame aus Logs: {e}")
+        raise ValueError("Ungültige Log-Daten übergeben.") from e
+
+    if 'level' not in df.columns:
+        raise ValueError("Log-Einträge müssen ein 'level'-Feld enthalten.")
+
+    # Warn-Rate berechnen
+    warn_count = (df['level'] == 'WARN').sum()
+    total_count = len(df)
+    warn_rate = warn_count / total_count if total_count > 0 else 0.0
+
+    # Performance (z. B. Durchschnitts-Dauer pro Event)
+    performance_metric = 0.0
+    if 'duration' in df.columns:
+        durations = df['duration'].dropna()
+        if not durations.empty:
+            performance_metric = float(mean(durations))
+
+    # Drift-Erkennung basierend auf Schwellwert und Warnrate
+    drift_detected = warn_rate > threshold
+
+    result = MetricSummary(
+        warn_rate=round(float(warn_rate), 5),
+        drift_detected=drift_detected,
+        performance=round(float(performance_metric), 5)
+    )
+
+    # CI-sichere Validierung
+    assert 0.0 <= result.warn_rate <= 1.0, "warn_rate muss zwischen 0 und 1 liegen"
+    assert isinstance(result.drift_detected, bool), "drift_detected muss bool sein"
+    assert result.performance >= 0.0, "performance darf nicht negativ sein"
+
+    return asdict(result)