Elo-Rating

Feature #3

Das Elo-Rating-System ist ein dynamisches Bewertungssystem, das die relative Staerke von Teams basierend auf Spielergebnissen berechnet. Urspruenglich fuer Schach entwickelt, wird es in zahlreichen Fussball-Vorhersagesystemen eingesetzt (ClubElo, FiveThirtyEight SPI, eloratings.net).

Ueberblick

Elo-Ratings messen die relative Staerke eines Teams. Nach jedem Spiel werden die Ratings beider Teams angepasst: Das siegreiche Team gewinnt Punkte, das unterlegene verliert Punkte. Die Hoehe der Anpassung haengt davon ab, wie ueberraschend das Ergebnis war — ein Sieg eines Aussenseiters fuehrt zu groesseren Rating-Aenderungen als ein erwarteter Favoritensieg.

Als ML-Feature ist Elo allein kein State-of-the-Art-Praediktor, aber ein exzellentes Feature in Kombination mit anderen Praediktoren. SHAP-Analysen identifizieren die Elo-Differenz konsistent als eines der Top-Features.

Berechnung

Kern-Formel

R_neu = R_alt + K * G * (W - W_erwartet)
SymbolBedeutung
R_neuNeues Rating nach dem Spiel
R_altRating vor dem Spiel
KLernrate (bestimmt Reaktionsgeschwindigkeit)
GTordifferenz-Multiplikator (Margin of Victory)
WTatsaechliches Ergebnis (1 = Sieg, 0.5 = Remis, 0 = Niederlage)
W_erwartetErwartetes Ergebnis basierend auf Rating-Differenz

Erwartungswert-Formel

W_erwartet = 1 / (1 + 10^((R_gegner - R_team) / 400))
Elo-DifferenzSiegwahrscheinlichkeit
050%
10064%
20075%
30085%
40091%

Tordifferenz-Skalierung mit Autokorrelationskorrektur

Starke Teams gewinnen haeufiger und mit groesserer Tordifferenz. Ohne Korrektur werden ihre Ratings uebermaessig aufgeblaeht. Wir verwenden die FiveThirtyEight-Korrektur:

G = ln(1 + |TD|) * (C / ((Elo_Sieger - Elo_Verlierer) * 0.001 + C))

Favorit gewinnt hoch  → G wird reduziert   (erwartbares Ergebnis)
Aussenseiter gewinnt  → G wird verstaerkt  (ueberraschendes Ergebnis)
Gleich starke Teams   → G bleibt unveraendert

Saison-Regression

Zwischen Saisons werden Ratings um 1/3 Richtung 1500 regressiert, um Kaderaenderungen und Regression zum Mittelwert zu beruecksichtigen:

Elo_neu = Elo_end * 2/3 + 1500 * 1/3

Parameter

ParameterWertBegruendung
Start-Elo1500Standard, kompatibel mit allen Implementierungen
K-Faktor20Entspricht ClubElo, Mitte des optimalen Bereichs (15–30)
Heimvorteil (HFA)65Liga-spezifisch berechnet, 65 als globaler Default
Skalierungsfaktor400Standard aus dem Schach, bestimmt die Spreizung
Autokorrelations-Konstante C2.2FiveThirtyEight-Startwert
Saison-Regression1/3 Richtung 1500Beruecksichtigt Kaderaenderungen zwischen Saisons

Praediktive Kraft

MethodeRPS3-Wege-Genauigkeit
Wettquoten (beste Baseline)~0.190–0.195~53–55%
FiveThirtyEight SPI0.1957
CatBoost + Pi-Ratings0.192555.82%
Pi-Ratings (standalone)0.199
Elo (standalone)0.204~50–52%
Elo + weitere Features~0.195–0.200~52–55%

RPS = Ranked Probability Score — niedriger ist besser. Elo allein liegt bei ~0.204, verbessert sich aber deutlich in Kombination mit anderen Features (Quoten, Form, Tore).

Erwartete 3-Wege-Genauigkeit nach Methode:

  • Zufalls-Baseline: ~33%
  • Immer Heimsieg vorhersagen: ~45%
  • Basis-Elo: ~50–52%
  • State-of-the-Art (ML + Quoten + xG): ~55–58%
  • Theoretische Obergrenze: ~55–60%

Quellen

  • Hvattum & Arntzen (2010): "Using ELO ratings for match result prediction in association football"
  • ClubElo.com — Reines Elo-System fuer europaeischen Klubfussball
  • FiveThirtyEight: "How Our Club Soccer Predictions Work" — SPI-Methodik
  • World Football Elo Ratings (eloratings.net) — Elo fuer Nationalteams
  • Stuart Lacy (2017): "Implementing an Elo Rating System for European Football"
  • Steven Morse: "Autocorrelation in Elo Ratings" — Zur Tordifferenz-Korrektur