Add artifact_2_worker_binding_analysis/src/artifact_2_worker_binding_analysis/core.py

2026-03-19 13:57:24 +00:00 · 2026-03-19 13:57:24 +00:00 · 7f8c8b7f57
commit 7f8c8b7f57
parent 0c1eda9609
1 changed files with 81 additions and 0 deletions
--- a/artifact_2_worker_binding_analysis/src/artifact_2_worker_binding_analysis/core.py
+++ b/artifact_2_worker_binding_analysis/src/artifact_2_worker_binding_analysis/core.py
@ -0,0 +1,81 @@
+from typing import List, Dict, Any
+from collections import defaultdict
+from statistics import mean
+
+
+class WorkerBindingResult:
+    """Datenmodell für die Bindung eines Workers an eine Population."""
+
+    def __init__(self, worker_id: str, population_percentage: float) -> None:
+        if not isinstance(worker_id, str):
+            raise TypeError("worker_id muss eine Zeichenkette sein.")
+        if not isinstance(population_percentage, (int, float)):
+            raise TypeError("population_percentage muss numerisch sein.")
+        if not (0.0 <= population_percentage <= 100.0):
+            raise ValueError("population_percentage muss zwischen 0 und 100 liegen.")
+        self.worker_id = worker_id
+        self.population_percentage = float(population_percentage)
+
+    def __repr__(self) -> str:
+        return f"WorkerBindingResult(worker_id={self.worker_id!r}, population_percentage={self.population_percentage:.2f})"
+
+
+def _validate_input(data: List[Dict[str, Any]]) -> None:
+    if not isinstance(data, list):
+        raise TypeError("Eingabedaten müssen eine Liste von Dictionaries sein.")
+    for entry in data:
+        if not isinstance(entry, dict):
+            raise TypeError("Jedes Element der Eingabeliste muss ein Dictionary sein.")
+        if 'worker_id' not in entry or 'population_percentage' not in entry:
+            raise ValueError("Jedes Datenelement muss 'worker_id' und 'population_percentage' enthalten.")
+        if not isinstance(entry['worker_id'], str):
+            raise TypeError("'worker_id' muss vom Typ str sein.")
+        if not isinstance(entry['population_percentage'], (int, float)):
+            raise TypeError("'population_percentage' muss numerisch sein.")
+
+
+def _aggregate_by_worker(data: List[Dict[str, Any]]) -> Dict[str, float]:
+    aggregation = defaultdict(list)
+    for entry in data:
+        aggregation[entry['worker_id']].append(entry['population_percentage'])
+    return {worker: mean(values) for worker, values in aggregation.items()}
+
+
+def analyze_worker_binding(data_enforced: List[Dict[str, Any]], data_randomized: List[Dict[str, Any]]) -> Dict[str, Any]:
+    """Vergleicht Worker-Bindungen zwischen enforced- und randomized-Modi und berechnet statistische Kennzahlen.
+
+    Args:
+        data_enforced: Liste mit Worker-Bindungsdaten aus dem Affinitätsmodus.
+        data_randomized: Liste mit Worker-Bindungsdaten aus dem zufälligen Modus.
+
+    Returns:
+        dict mit Schlüssel 'mean_concentration_enforced', 'mean_concentration_randomized',
+        'diff_per_worker' und 'avg_diff_overall'.
+    """
+    _validate_input(data_enforced)
+    _validate_input(data_randomized)
+
+    enforced_agg = _aggregate_by_worker(data_enforced)
+    randomized_agg = _aggregate_by_worker(data_randomized)
+
+    mean_conc_enforced = mean(enforced_agg.values()) if enforced_agg else 0.0
+    mean_conc_randomized = mean(randomized_agg.values()) if randomized_agg else 0.0
+
+    all_workers = set(enforced_agg.keys()) | set(randomized_agg.keys())
+    diff_per_worker = {}
+    for worker in all_workers:
+        val_enf = enforced_agg.get(worker, 0.0)
+        val_rand = randomized_agg.get(worker, 0.0)
+        diff_per_worker[worker] = val_enf - val_rand
+
+    avg_diff_overall = mean(diff_per_worker.values()) if diff_per_worker else 0.0
+
+    result = {
+        'mean_concentration_enforced': mean_conc_enforced,
+        'mean_concentration_randomized': mean_conc_randomized,
+        'diff_per_worker': diff_per_worker,
+        'avg_diff_overall': avg_diff_overall
+    }
+
+    assert isinstance(result, dict), "Rückgabewert muss ein Dictionary sein."
+    return result