Odds-Differenz / Log Odds Ratio

Feature #2

Differenz- und Verhaeltnis-Features aus den 1X2-Wettquoten. Diese Features messen die relative Staerke-Differenz zwischen Heim- und Auswaertsteam aus Marktsicht und ergaenzen die absoluten Implied Probabilities (Feature #1).

Ueberblick

Waehrend Feature #1 die fairen Wahrscheinlichkeiten fuer Heim, Remis und Auswaerts liefert, extrahieren die Odds-Differenz-Features die Richtung und Staerke der Markteinschaetzung in einem einzigen Wert. Sie sind besonders nuetzlich fuer 1X2-Vorhersagen.

Beide Feature-Gruppen werden im selben Modul ( odds_features.py) berechnet und basieren auf denselben Quoten-Daten.

Berechnung

Implied Probability Difference

Die Differenz der fairen Siegwahrscheinlichkeiten — der direkteste Indikator fuer die Markteinschaetzung der relativen Teamstaerke:

implied_prob_diff = implied_prob_home - implied_prob_away

Beispiel: 52.63% - 21.05% = +31.58%
→ Starker Heimfavorit

Odds Difference

Die rohe Quotendifferenz — hoehere Werte signalisieren staerkeren Auswaertsvorteil:

odds_diff = odds_away - odds_home

Beispiel: 4.50 - 1.80 = +2.70
→ Heim deutlich favorisiert

Log Odds Ratio

Das logarithmische Verhaeltnis der Quoten — symmetrisch um 0, ideal fuer lineare Modelle:

log_odds_ratio = log(odds_away / odds_home)

Beispiel: log(4.50 / 1.80) = log(2.50) = +0.916
→ Positiv = Heimvorteil, Negativ = Auswaertsvorteil, 0 = ausgeglichen

Features

FeatureFormelWertebereichRelevant fuer
implied_prob_diffprob_H - prob_A[-1, 1]1X2
odds_diffodds_A - odds_H(-∞, +∞)1X2
log_odds_ratiolog(odds_A / odds_H)(-∞, +∞)1X2

Korrelation und Redundanz

Die drei Differenz-Features sind stark korreliert, da sie alle dieselbe Information messen (relative Staerke-Differenz):

odds_diff ~ log_odds_ratio ~ implied_prob_diff
(alle messen die Staerke-Differenz aus Marktsicht)

Fuer das ML-Modell sollte eine Differenz-Metrik gewaehlt werden — typischerweise implied_prob_diff oder log_odds_ratio. Feature-Importance-Analyse entscheidet, welche Variante letztendlich verwendet wird.

Quellen

  • Siehe Feature #1 (Implied Win Probability) — beide Features werden aus denselben Quoten-Daten abgeleitet
  • Hvattum & Arntzen (2010): "Using soccer forecasts to forecast soccer"
  • Kaunitz, Zhong & Kreiner (2017): "Beating the bookies with their own numbers"