Heim/Auswaerts-Performance
Separate PPG-Werte fuer Heim- und Auswaertsspiele sowie die Differenz zwischen beiden. Erfasst team-spezifische Spielort-Effekte — manche Teams sind zuhause dominant, aber auswaerts schwach. Das Match-Feature ppg_location_diff liefert ein praeziseres Signal als der Gesamt-PPG-Vergleich.
Ueberblick
Der Heimvorteil ist einer der staerksten und konsistentesten Effekte im Fussball. Er variiert aber stark zwischen Teams — manche Teams sind zuhause nahezu unschlagbar, aber auswaerts schwach. Heim/Auswaerts-PPG erfasst diese team-spezifische Asymmetrie, die im Gesamt-PPG (Feature #8) verloren geht.
In einer Studie mit 205 potenziellen Features wurde point_per_match_HT (PPG des Heimteams) in das optimale Feature-Set von nur 6 Features aufgenommen — neben Pi-Ratings, Expected Goals und Siegquote. Das zeigt: spielort-spezifisches PPG gehoert zum Kern starker Vorhersagemodelle.
Pi-Ratings als Vorbild: Pi-Ratings fuehren separate Heim- und Auswaerts-Ratings pro Team, wobei beide Ratings bei jedem Update leicht voneinander beeinflusst werden ("catch-up learning rate"). Pi-Ratings erreichten RPS 0.199 vs. Standard-Elo 0.204 auf Eredivisie-Daten.
Enthaltene Features
| # | Feature | Beschreibung | Windows |
|---|---|---|---|
| 17 | Home PPG / Away PPG | Punkte getrennt nach Spielort | 5, 10, Season |
| 18 | Home-Away Gap | Differenz: Heim-PPG minus Auswaerts-PPG | 5, 10, Season |
Berechnung
Grundformel
home_ppg = sum(Punkte in Heimspielen) / Anzahl_Heimspiele
away_ppg = sum(Punkte in Auswaertsspielen) / Anzahl_Auswaertsspiele
home_away_gap = home_ppg - away_ppg
Wertebereich: 0.0 (alles verloren) bis 3.0 (alles gewonnen)
Home-Away Gap: -3.0 bis +3.0 (positiv = staerker zuhause)Rolling Windows
Wie bei allen Features werden drei Zeitfenster berechnet, aber hier nur ueber Spiele des jeweiligen Typs (nur Heim- oder nur Auswaertsspiele):
home_ppg_5 — Letzte 5 Heimspiele
home_ppg_10 — Letzte 10 Heimspiele
home_ppg_season — Alle Heimspiele der aktuellen Saison
away_ppg_5 — Letzte 5 Auswaertsspiele
away_ppg_10 — Letzte 10 Auswaertsspiele
away_ppg_season — Alle Auswaertsspiele der aktuellen Saison
Gewichteter Avg: 0.5 * val_5 + 0.3 * val_10 + 0.2 * val_seasonMatch-Level Feature
ppg_location_diff = home_team_home_ppg_avg - away_team_away_ppg_avg
→ Vergleicht Heimstaerke des Heimteams mit Auswaertsstaerke
des Gastteams — praeziseres Signal als Gesamt-PPG-VergleichIn ML-Benchmarks liefert home_team_home_ppg - away_team_away_ppg ein praeziseres Signal als home_team_overall_ppg - away_team_overall_ppg.
Simpson's Paradox
Ein Team mit starker Heimform und schwacher Auswaertsform hat ein Gesamt-PPG, das fuer beide Kontexte irrefuehrend ist. Das ist der Hauptgrund fuer die Existenz dieses Features.
| Metrik | Wert | Problem |
|---|---|---|
| Heim-PPG | 2.50 | — |
| Auswaerts-PPG | 0.80 | — |
| Gesamt-PPG | ~1.65 | Zu niedrig fuer Heimspiel, zu hoch fuer Auswaertsspiel |
Die Loesung: Immer Heim/Auswaerts-getrennte PPGs berechnen und als separate Features verwenden. Das Gesamt-PPG (Feature #8) bleibt als komplementaeres Feature erhalten, wird aber durch die spielort-spezifischen Werte ergaenzt.
Empirischer Heimvorteil
| Liga | Heim-Sieganteil (ca.) |
|---|---|
| Serie A (Italien) | 62.25% — am staerksten |
| La Liga (Spanien) | ~61% |
| Ligue 1 (Frankreich) | ~61% |
| Premier League (England) | ~60% |
| Bundesliga (Deutschland) | 58.35% — am schwaechsten der Big 5 |
Der Heimvorteil bei Toren ist substanziell: Das Dixon-Coles-Modell quantifiziert ihn als Multiplikator von e^0.297 = 1.35x — Heimteams erzielen im Schnitt 35% mehr Tore. COVID-Studien zeigten, dass Zuschauerunterstuetzung ca. 23% des Heimvorteils ausmacht.
Trend: Der Heimvorteil sinkt seit Jahren (aktuell ca. 52% Heim-Siegrate). Aufsteiger und kleinere Teams haben oft einen staerkeren Heimvorteil. Der Effekt variiert stark zwischen Teams (Stadiongroesse, Fankultur, Hoehendifferenz).
Stabilisierung und Sample Size
Das Kernproblem der Heim/Auswaerts-Splits ist die halbierte Stichprobe. In einer 34-Spiele-Saison hat jedes Team nur 17 Heim- und 17 Auswaertsspiele.
| Window | Effektive Spiele | Moegliche Werte | Zuverlaessigkeit |
|---|---|---|---|
| 5 Spiele (Heim) | ~3 Heimspiele | 7 Werte (0.0–3.0) | Sehr unzuverlaessig |
| 10 Spiele (Heim) | ~5 Heimspiele | 16 Werte | Marginal nuetzlich |
| Season (Heim) | ~17 Heimspiele | Kontinuierlich | Am zuverlaessigsten |
Die Kombination mit dem Gesamt-PPG (Feature #8) ist daher wichtig — der gewichtete Durchschnitt (0.5/0.3/0.2) fungiert als implizite Regularisierung. Bei kurzen Windows ist die hohe Varianz der Heim/Auswaerts-Splits das groesste Risiko.
Kombiniert vs. Getrennt: ML-Benchmark
Der "Beat the Bookie"-Blog testete kombinierte (COMB) vs. getrennte Heim/Auswaerts-Features (HA) und fand ein ueberraschendes Ergebnis:
| Ansatz | Ergebnis |
|---|---|
| Kombinierte Features (COMB) | In ML-Modellen ueberlegen — ML kann den Venue-Effekt ueber ein separates Binary-Feature automatisch lernen |
| Getrennte H/A Features | Fuer Poisson-Modelle essenziell — dort gibt es keinen anderen Mechanismus fuer Venue-Effekte |
Unser Ansatz: Primaer kombinierte Rolling Averages (Feature #8 PPG) plus Heim/Auswaerts-Splits als ergaenzende Features. Das Heim/Auswaerts-Signal wird durch die Match-Differenz home_team_home_ppg - away_team_away_ppg und das implizite Heim-Binary-Feature abgedeckt. Gradient Boosted Trees lernen die Interaktion automatisch.
Korrelation mit vorhandenen Features
| H/A-Feature | Korreliert mit | Erwartete r | Redundanz |
|---|---|---|---|
| home_ppg | PPG Gesamt | r ~ 0.75–0.85 | Hoch |
| away_ppg | PPG Gesamt | r ~ 0.70–0.80 | Hoch |
| ppg_location_diff | ppg_diff | r ~ 0.60–0.75 | Moderat |
| home_away_gap | Elo-Diff, PPG | r ~ 0.20–0.40 | Niedrig |
Hoechster Zusatznutzen: Der home_away_gap hat die niedrigste Korrelation mit bestehenden Features und erfasst team-spezifische Asymmetrien, die weder PPG noch Elo messen. Ein Team mit Gap > 1.5 hat ein voellig anderes Heim-/Auswaerts-Profil als eines mit Gap ~ 0.
Quellen
- Berrar et al. (2019): "Evaluating Soccer Match Prediction Models" — PPG Heimteam in optimalem 6-Feature-Set
- Pi-Ratings: "The Smarter Way to Rank Football Teams" — Separate Heim/Auswaerts-Ratings (penaltyblog)
- Dixon & Coles (1997): "Modelling Association Football Scores" — Heimvorteil-Multiplikator e^0.297 = 1.35x
- Beat the Bookie: "Combined vs. Home/Away Features" — Benchmark kombiniert vs. getrennt
- FootyStats Academy: "Match Feed — Understanding PPG, Form and Stats" — Heim-/Auswaerts-PPG in der Praxis
- COVID-19 and Home Advantage: Systematic Review (PMC) — Zuschauereinfluss auf Heimvorteil