Elo-Rating
Das Elo-Rating-System ist ein dynamisches Bewertungssystem, das die relative Staerke von Teams basierend auf Spielergebnissen berechnet. Urspruenglich fuer Schach entwickelt, wird es in zahlreichen Fussball-Vorhersagesystemen eingesetzt (ClubElo, FiveThirtyEight SPI, eloratings.net).
Ueberblick
Elo-Ratings messen die relative Staerke eines Teams. Nach jedem Spiel werden die Ratings beider Teams angepasst: Das siegreiche Team gewinnt Punkte, das unterlegene verliert Punkte. Die Hoehe der Anpassung haengt davon ab, wie ueberraschend das Ergebnis war — ein Sieg eines Aussenseiters fuehrt zu groesseren Rating-Aenderungen als ein erwarteter Favoritensieg.
Als ML-Feature ist Elo allein kein State-of-the-Art-Praediktor, aber ein exzellentes Feature in Kombination mit anderen Praediktoren. SHAP-Analysen identifizieren die Elo-Differenz konsistent als eines der Top-Features.
Berechnung
Kern-Formel
R_neu = R_alt + K * G * (W - W_erwartet)| Symbol | Bedeutung |
|---|---|
R_neu | Neues Rating nach dem Spiel |
R_alt | Rating vor dem Spiel |
K | Lernrate (bestimmt Reaktionsgeschwindigkeit) |
G | Tordifferenz-Multiplikator (Margin of Victory) |
W | Tatsaechliches Ergebnis (1 = Sieg, 0.5 = Remis, 0 = Niederlage) |
W_erwartet | Erwartetes Ergebnis basierend auf Rating-Differenz |
Erwartungswert-Formel
W_erwartet = 1 / (1 + 10^((R_gegner - R_team) / 400))| Elo-Differenz | Siegwahrscheinlichkeit |
|---|---|
| 0 | 50% |
| 100 | 64% |
| 200 | 75% |
| 300 | 85% |
| 400 | 91% |
Tordifferenz-Skalierung mit Autokorrelationskorrektur
Starke Teams gewinnen haeufiger und mit groesserer Tordifferenz. Ohne Korrektur werden ihre Ratings uebermaessig aufgeblaeht. Wir verwenden die FiveThirtyEight-Korrektur:
G = ln(1 + |TD|) * (C / ((Elo_Sieger - Elo_Verlierer) * 0.001 + C))
Favorit gewinnt hoch → G wird reduziert (erwartbares Ergebnis)
Aussenseiter gewinnt → G wird verstaerkt (ueberraschendes Ergebnis)
Gleich starke Teams → G bleibt unveraendertSaison-Regression
Zwischen Saisons werden Ratings um 1/3 Richtung 1500 regressiert, um Kaderaenderungen und Regression zum Mittelwert zu beruecksichtigen:
Elo_neu = Elo_end * 2/3 + 1500 * 1/3Parameter
| Parameter | Wert | Begruendung |
|---|---|---|
| Start-Elo | 1500 | Standard, kompatibel mit allen Implementierungen |
| K-Faktor | 20 | Entspricht ClubElo, Mitte des optimalen Bereichs (15–30) |
| Heimvorteil (HFA) | 65 | Liga-spezifisch berechnet, 65 als globaler Default |
| Skalierungsfaktor | 400 | Standard aus dem Schach, bestimmt die Spreizung |
| Autokorrelations-Konstante C | 2.2 | FiveThirtyEight-Startwert |
| Saison-Regression | 1/3 Richtung 1500 | Beruecksichtigt Kaderaenderungen zwischen Saisons |
Praediktive Kraft
| Methode | RPS | 3-Wege-Genauigkeit |
|---|---|---|
| Wettquoten (beste Baseline) | ~0.190–0.195 | ~53–55% |
| FiveThirtyEight SPI | 0.1957 | — |
| CatBoost + Pi-Ratings | 0.1925 | 55.82% |
| Pi-Ratings (standalone) | 0.199 | — |
| Elo (standalone) | 0.204 | ~50–52% |
| Elo + weitere Features | ~0.195–0.200 | ~52–55% |
RPS = Ranked Probability Score — niedriger ist besser. Elo allein liegt bei ~0.204, verbessert sich aber deutlich in Kombination mit anderen Features (Quoten, Form, Tore).
Erwartete 3-Wege-Genauigkeit nach Methode:
- Zufalls-Baseline: ~33%
- Immer Heimsieg vorhersagen: ~45%
- Basis-Elo: ~50–52%
- State-of-the-Art (ML + Quoten + xG): ~55–58%
- Theoretische Obergrenze: ~55–60%
Quellen
- Hvattum & Arntzen (2010): "Using ELO ratings for match result prediction in association football"
- ClubElo.com — Reines Elo-System fuer europaeischen Klubfussball
- FiveThirtyEight: "How Our Club Soccer Predictions Work" — SPI-Methodik
- World Football Elo Ratings (eloratings.net) — Elo fuer Nationalteams
- Stuart Lacy (2017): "Implementing an Elo Rating System for European Football"
- Steven Morse: "Autocorrelation in Elo Ratings" — Zur Tordifferenz-Korrektur