Add results_analysis/src/results_analysis/core.py

2026-02-05 13:42:05 +00:00 · 2026-02-05 13:42:05 +00:00 · c057dcb25f
commit c057dcb25f
parent 54c7606e6d
1 changed files with 76 additions and 0 deletions
--- a/results_analysis/src/results_analysis/core.py
+++ b/results_analysis/src/results_analysis/core.py
@ -0,0 +1,76 @@
 from __future__ import annotations
 from dataclasses import dataclass, asdict
 from typing import List, Dict
 import pandas as pd
 import logging
 logger = logging.getLogger(__name__)
 logger.setLevel(logging.INFO)
 class ResultsAnalysisError(Exception):
    """Custom exception for results analysis errors."""
@dataclass
 class ConfusionMatrix:
    """Repräsentation einer Confusion-Matrix zum Vergleich zweier Policy-Versionen."""
    TP: int
    TN: int
    FP: int
    FN: int
    def to_json(self) -> Dict[str, int]:
        """Serialisiert die Matrix in ein JSON-kompatibles Format."""
        return asdict(self)
 def _validate_results(results: List[Dict]) -> None:
    if not isinstance(results, list):
        raise ResultsAnalysisError("Results must be a list of dicts.")
    required_keys = {"run_id", "decision"}
    for item in results:
        if not isinstance(item, dict):
            raise ResultsAnalysisError("Each result entry must be a dictionary.")
        if not required_keys.issubset(item.keys()):
            raise ResultsAnalysisError(f"Missing required keys in result: {item}")
 def create_confusion_matrix(previous_results: List[Dict], new_results: List[Dict]) -> Dict[str, int]:
    """Erzeugt eine Confusion-Matrix durch Vergleich von früheren und neuen Policy-Ergebnissen."""
    _validate_results(previous_results)
    _validate_results(new_results)
    prev_df = pd.DataFrame(previous_results)
    new_df = pd.DataFrame(new_results)
    if prev_df.empty or new_df.empty:
        raise ResultsAnalysisError("Input results must not be empty.")
    merged = pd.merge(prev_df, new_df, on="run_id", suffixes=("_prev", "_new"))
    TP = int(((merged.decision_prev == "PASS") & (merged.decision_new == "PASS")).sum())
    TN = int(((merged.decision_prev != "PASS") & (merged.decision_new != "PASS")).sum())
    FP = int(((merged.decision_prev != "PASS") & (merged.decision_new == "PASS")).sum())
    FN = int(((merged.decision_prev == "PASS") & (merged.decision_new != "PASS")).sum())
    cm = ConfusionMatrix(TP=TP, TN=TN, FP=FP, FN=FN)
    logger.info("Confusion matrix created: %s", cm)
    return cm.to_json()
 def get_deltas(previous_results: List[Dict], new_results: List[Dict]) -> List[Dict]:
    """Ermittelt alle Fälle, in denen sich das Ergebnisverhalten zwischen Versionen geändert hat."""
    _validate_results(previous_results)
    _validate_results(new_results)
    prev_df = pd.DataFrame(previous_results)
    new_df = pd.DataFrame(new_results)
    merged = pd.merge(prev_df, new_df, on="run_id", suffixes=("_prev", "_new"))
    changed = merged[merged.decision_prev != merged.decision_new]
    deltas = changed[["run_id", "decision_prev", "decision_new"]].to_dict(orient="records")
    logger.info("Detected %d changed results.", len(deltas))
    return deltas