Odds-Differenz / Log Odds Ratio
Differenz- und Verhaeltnis-Features aus den 1X2-Wettquoten. Diese Features messen die relative Staerke-Differenz zwischen Heim- und Auswaertsteam aus Marktsicht und ergaenzen die absoluten Implied Probabilities (Feature #1).
Ueberblick
Waehrend Feature #1 die fairen Wahrscheinlichkeiten fuer Heim, Remis und Auswaerts liefert, extrahieren die Odds-Differenz-Features die Richtung und Staerke der Markteinschaetzung in einem einzigen Wert. Sie sind besonders nuetzlich fuer 1X2-Vorhersagen.
Beide Feature-Gruppen werden im selben Modul ( odds_features.py) berechnet und basieren auf denselben Quoten-Daten.
Berechnung
Implied Probability Difference
Die Differenz der fairen Siegwahrscheinlichkeiten — der direkteste Indikator fuer die Markteinschaetzung der relativen Teamstaerke:
implied_prob_diff = implied_prob_home - implied_prob_away
Beispiel: 52.63% - 21.05% = +31.58%
→ Starker HeimfavoritOdds Difference
Die rohe Quotendifferenz — hoehere Werte signalisieren staerkeren Auswaertsvorteil:
odds_diff = odds_away - odds_home
Beispiel: 4.50 - 1.80 = +2.70
→ Heim deutlich favorisiertLog Odds Ratio
Das logarithmische Verhaeltnis der Quoten — symmetrisch um 0, ideal fuer lineare Modelle:
log_odds_ratio = log(odds_away / odds_home)
Beispiel: log(4.50 / 1.80) = log(2.50) = +0.916
→ Positiv = Heimvorteil, Negativ = Auswaertsvorteil, 0 = ausgeglichenFeatures
| Feature | Formel | Wertebereich | Relevant fuer |
|---|---|---|---|
implied_prob_diff | prob_H - prob_A | [-1, 1] | 1X2 |
odds_diff | odds_A - odds_H | (-∞, +∞) | 1X2 |
log_odds_ratio | log(odds_A / odds_H) | (-∞, +∞) | 1X2 |
Korrelation und Redundanz
Die drei Differenz-Features sind stark korreliert, da sie alle dieselbe Information messen (relative Staerke-Differenz):
odds_diff ~ log_odds_ratio ~ implied_prob_diff
(alle messen die Staerke-Differenz aus Marktsicht)Fuer das ML-Modell sollte eine Differenz-Metrik gewaehlt werden — typischerweise implied_prob_diff oder log_odds_ratio. Feature-Importance-Analyse entscheidet, welche Variante letztendlich verwendet wird.
Quellen
- Siehe Feature #1 (Implied Win Probability) — beide Features werden aus denselben Quoten-Daten abgeleitet
- Hvattum & Arntzen (2010): "Using soccer forecasts to forecast soccer"
- Kaunitz, Zhong & Kreiner (2017): "Beating the bookies with their own numbers"