Add frozen_runs_analysis/src/frozen_runs_analysis/core.py

2026-01-26 12:23:44 +00:00 · 2026-01-26 12:23:44 +00:00 · c67cc23016
commit c67cc23016
parent 9fab7ffa8c
1 changed files with 96 additions and 0 deletions
--- a/frozen_runs_analysis/src/frozen_runs_analysis/core.py
+++ b/frozen_runs_analysis/src/frozen_runs_analysis/core.py
@ -0,0 +1,96 @@
 from __future__ import annotations
 import logging
 from dataclasses import dataclass, asdict
 from typing import Dict, Any, List
 import pandas as pd
 from statistics import mean, pstdev, quantiles
 logger = logging.getLogger(__name__)
 logger.setLevel(logging.INFO)
 class RunDataValidationError(Exception):
    """Raised when RunData validation fails."""
    pass
@dataclass
 class RunData:
    run_id: str
    status: str
    sanity_checks: Dict[str, Any]
    config_hash: str
    @classmethod
    def validate(cls, data: Dict[str, Any]) -> 'RunData':
        required_fields = {"run_id", "status", "sanity_checks", "config_hash"}
        missing = required_fields - data.keys()
        if missing:
            raise RunDataValidationError(f"Missing fields in RunData: {', '.join(missing)}")
        if not isinstance(data.get("sanity_checks"), dict):
            raise RunDataValidationError("Field 'sanity_checks' must be a dict.")
        if not isinstance(data.get("run_id"), str):
            raise RunDataValidationError("Field 'run_id' must be a str.")
        if not isinstance(data.get("status"), str):
            raise RunDataValidationError("Field 'status' must be a str.")
        if not isinstance(data.get("config_hash"), str):
            raise RunDataValidationError("Field 'config_hash' must be a str.")
        return cls(
            run_id=data["run_id"],
            status=data["status"],
            sanity_checks=data["sanity_checks"],
            config_hash=data["config_hash"]
        )
 def analyse_frozen_runs(data: List[RunData]) -> Dict[str, Any]:
    """Analysiert Frozen-Run-Daten, berechnet Kennzahlen zur Stabilität und Häufigkeiten."""
    # Validierung
    if not data:
        logger.warning("Keine Daten zur Analyse übergeben.")
        return {}
    valid_runs: List[RunData] = []
    for item in data:
        if isinstance(item, dict):
            try:
                valid_runs.append(RunData.validate(item))
            except RunDataValidationError as e:
                logger.error(f"Ungültiger Dateneintrag ignoriert: {e}")
        elif isinstance(item, RunData):
            valid_runs.append(item)
        else:
            logger.error(f"Unbekannter Datentyp in Analyse: {type(item).__name__}")
    if not valid_runs:
        logger.warning("Keine validen Läufe nach Validierung.")
        return {}
    df = pd.DataFrame([asdict(r) for r in valid_runs])
    # Einfacher Sanity-Score: Anzahl Fehler in sanity_checks
    df['sanity_error_count'] = df['sanity_checks'].apply(lambda d: sum(1 for v in d.values() if v not in (None, True, False) and not v))
    # Flip-Flop-Frequenz per config_hash und status
    hash_status = df.groupby('config_hash')['status'].nunique()
    flip_flop_rate = (hash_status > 1).mean()
    # Statistische Verteilungen
    sanity_counts = df['sanity_error_count'].tolist()
    avg_errors = mean(sanity_counts)
    std_errors = pstdev(sanity_counts) if len(sanity_counts) > 1 else 0.0
    p95 = quantiles(sanity_counts, n=100)[94] if len(sanity_counts) >= 20 else max(sanity_counts)
    result = {
        "total_runs": len(df),
        "unique_hashes": df['config_hash'].nunique(),
        "flip_flop_rate": round(float(flip_flop_rate), 4),
        "avg_sanity_errors": round(avg_errors, 4),
        "std_sanity_errors": round(std_errors, 4),
        "p95_sanity_errors": round(float(p95), 4),
    }
    logger.info(f"Analyse abgeschlossen: {result}")
    return result