Heim/Auswaerts-Performance

Feature #17–18

Separate PPG-Werte fuer Heim- und Auswaertsspiele sowie die Differenz zwischen beiden. Erfasst team-spezifische Spielort-Effekte — manche Teams sind zuhause dominant, aber auswaerts schwach. Das Match-Feature ppg_location_diff liefert ein praeziseres Signal als der Gesamt-PPG-Vergleich.

Ueberblick

Der Heimvorteil ist einer der staerksten und konsistentesten Effekte im Fussball. Er variiert aber stark zwischen Teams — manche Teams sind zuhause nahezu unschlagbar, aber auswaerts schwach. Heim/Auswaerts-PPG erfasst diese team-spezifische Asymmetrie, die im Gesamt-PPG (Feature #8) verloren geht.

In einer Studie mit 205 potenziellen Features wurde point_per_match_HT (PPG des Heimteams) in das optimale Feature-Set von nur 6 Features aufgenommen — neben Pi-Ratings, Expected Goals und Siegquote. Das zeigt: spielort-spezifisches PPG gehoert zum Kern starker Vorhersagemodelle.

Pi-Ratings als Vorbild: Pi-Ratings fuehren separate Heim- und Auswaerts-Ratings pro Team, wobei beide Ratings bei jedem Update leicht voneinander beeinflusst werden ("catch-up learning rate"). Pi-Ratings erreichten RPS 0.199 vs. Standard-Elo 0.204 auf Eredivisie-Daten.

Enthaltene Features

#FeatureBeschreibungWindows
17Home PPG / Away PPGPunkte getrennt nach Spielort5, 10, Season
18Home-Away GapDifferenz: Heim-PPG minus Auswaerts-PPG5, 10, Season

Berechnung

Grundformel

home_ppg = sum(Punkte in Heimspielen) / Anzahl_Heimspiele
away_ppg = sum(Punkte in Auswaertsspielen) / Anzahl_Auswaertsspiele
home_away_gap = home_ppg - away_ppg

Wertebereich: 0.0 (alles verloren) bis 3.0 (alles gewonnen)
Home-Away Gap: -3.0 bis +3.0 (positiv = staerker zuhause)

Rolling Windows

Wie bei allen Features werden drei Zeitfenster berechnet, aber hier nur ueber Spiele des jeweiligen Typs (nur Heim- oder nur Auswaertsspiele):

home_ppg_5      — Letzte 5 Heimspiele
home_ppg_10     — Letzte 10 Heimspiele
home_ppg_season — Alle Heimspiele der aktuellen Saison

away_ppg_5      — Letzte 5 Auswaertsspiele
away_ppg_10     — Letzte 10 Auswaertsspiele
away_ppg_season — Alle Auswaertsspiele der aktuellen Saison

Gewichteter Avg: 0.5 * val_5 + 0.3 * val_10 + 0.2 * val_season

Match-Level Feature

ppg_location_diff = home_team_home_ppg_avg - away_team_away_ppg_avg

→ Vergleicht Heimstaerke des Heimteams mit Auswaertsstaerke
  des Gastteams — praeziseres Signal als Gesamt-PPG-Vergleich

In ML-Benchmarks liefert home_team_home_ppg - away_team_away_ppg ein praeziseres Signal als home_team_overall_ppg - away_team_overall_ppg.

Simpson's Paradox

Ein Team mit starker Heimform und schwacher Auswaertsform hat ein Gesamt-PPG, das fuer beide Kontexte irrefuehrend ist. Das ist der Hauptgrund fuer die Existenz dieses Features.

MetrikWertProblem
Heim-PPG2.50
Auswaerts-PPG0.80
Gesamt-PPG~1.65Zu niedrig fuer Heimspiel, zu hoch fuer Auswaertsspiel

Die Loesung: Immer Heim/Auswaerts-getrennte PPGs berechnen und als separate Features verwenden. Das Gesamt-PPG (Feature #8) bleibt als komplementaeres Feature erhalten, wird aber durch die spielort-spezifischen Werte ergaenzt.

Empirischer Heimvorteil

LigaHeim-Sieganteil (ca.)
Serie A (Italien)62.25% — am staerksten
La Liga (Spanien)~61%
Ligue 1 (Frankreich)~61%
Premier League (England)~60%
Bundesliga (Deutschland)58.35% — am schwaechsten der Big 5

Der Heimvorteil bei Toren ist substanziell: Das Dixon-Coles-Modell quantifiziert ihn als Multiplikator von e^0.297 = 1.35x — Heimteams erzielen im Schnitt 35% mehr Tore. COVID-Studien zeigten, dass Zuschauerunterstuetzung ca. 23% des Heimvorteils ausmacht.

Trend: Der Heimvorteil sinkt seit Jahren (aktuell ca. 52% Heim-Siegrate). Aufsteiger und kleinere Teams haben oft einen staerkeren Heimvorteil. Der Effekt variiert stark zwischen Teams (Stadiongroesse, Fankultur, Hoehendifferenz).

Stabilisierung und Sample Size

Das Kernproblem der Heim/Auswaerts-Splits ist die halbierte Stichprobe. In einer 34-Spiele-Saison hat jedes Team nur 17 Heim- und 17 Auswaertsspiele.

WindowEffektive SpieleMoegliche WerteZuverlaessigkeit
5 Spiele (Heim)~3 Heimspiele7 Werte (0.0–3.0)Sehr unzuverlaessig
10 Spiele (Heim)~5 Heimspiele16 WerteMarginal nuetzlich
Season (Heim)~17 HeimspieleKontinuierlichAm zuverlaessigsten

Die Kombination mit dem Gesamt-PPG (Feature #8) ist daher wichtig — der gewichtete Durchschnitt (0.5/0.3/0.2) fungiert als implizite Regularisierung. Bei kurzen Windows ist die hohe Varianz der Heim/Auswaerts-Splits das groesste Risiko.

Kombiniert vs. Getrennt: ML-Benchmark

Der "Beat the Bookie"-Blog testete kombinierte (COMB) vs. getrennte Heim/Auswaerts-Features (HA) und fand ein ueberraschendes Ergebnis:

AnsatzErgebnis
Kombinierte Features (COMB)In ML-Modellen ueberlegen — ML kann den Venue-Effekt ueber ein separates Binary-Feature automatisch lernen
Getrennte H/A FeaturesFuer Poisson-Modelle essenziell — dort gibt es keinen anderen Mechanismus fuer Venue-Effekte

Unser Ansatz: Primaer kombinierte Rolling Averages (Feature #8 PPG) plus Heim/Auswaerts-Splits als ergaenzende Features. Das Heim/Auswaerts-Signal wird durch die Match-Differenz home_team_home_ppg - away_team_away_ppg und das implizite Heim-Binary-Feature abgedeckt. Gradient Boosted Trees lernen die Interaktion automatisch.

Korrelation mit vorhandenen Features

H/A-FeatureKorreliert mitErwartete rRedundanz
home_ppgPPG Gesamtr ~ 0.75–0.85Hoch
away_ppgPPG Gesamtr ~ 0.70–0.80Hoch
ppg_location_diffppg_diffr ~ 0.60–0.75Moderat
home_away_gapElo-Diff, PPGr ~ 0.20–0.40Niedrig

Hoechster Zusatznutzen: Der home_away_gap hat die niedrigste Korrelation mit bestehenden Features und erfasst team-spezifische Asymmetrien, die weder PPG noch Elo messen. Ein Team mit Gap > 1.5 hat ein voellig anderes Heim-/Auswaerts-Profil als eines mit Gap ~ 0.

Quellen

  • Berrar et al. (2019): "Evaluating Soccer Match Prediction Models" — PPG Heimteam in optimalem 6-Feature-Set
  • Pi-Ratings: "The Smarter Way to Rank Football Teams" — Separate Heim/Auswaerts-Ratings (penaltyblog)
  • Dixon & Coles (1997): "Modelling Association Football Scores" — Heimvorteil-Multiplikator e^0.297 = 1.35x
  • Beat the Bookie: "Combined vs. Home/Away Features" — Benchmark kombiniert vs. getrennt
  • FootyStats Academy: "Match Feed — Understanding PPG, Form and Stats" — Heim-/Auswaerts-PPG in der Praxis
  • COVID-19 and Home Advantage: Systematic Review (PMC) — Zuschauereinfluss auf Heimvorteil