Average Goals
Durchschnittliche Tor-Statistiken bilden die Grundlage fuer Tor-basierte Vorhersagen. SHAP-Analysen identifizieren Goals Scored und Goals Conceded als Features mit der hoechsten Signal-Staerke — besonders relevant fuer Over/Under- und BTTS-Maerkte.
Ueberblick
Average Goals umfasst vier eng verwandte Metriken, die auf historischen Torergebnissen basieren. Sie sind die fundamentalsten Tor-Features und bilden die Grundlage fuer Poisson-Modelle und Expected-Goals-Vergleiche.
| Metrik | Formel | Wertebereich | Primaer fuer |
|---|---|---|---|
| Avg Goals For | Eigene Tore / Spiele | 0.0 – ~4.0 | O/U, BTTS |
| Avg Goals Against | Kassierte Tore / Spiele | 0.0 – ~4.0 | O/U, BTTS |
| Avg Total Goals | (Eigene + Kassierte) / Spiele | 0.0 – ~7.0 | O/U |
| Avg Goal Difference | (Eigene - Kassierte) / Spiele | -3.0 – +3.0 | 1X2 |
"Goals, Conceded and Goal Preventions directly determine the match outcome and thus possess the highest signal strength, effectively reducing model entropy."
— Journal of Big Data (2024)
Berechnung
Rolling Windows
Wie beim Form-Index werden alle vier Metriken ueber drei Zeitfenster berechnet:
avg_goals_for_5 = sum(eigene Tore, letzte 5) / 5
avg_goals_for_10 = sum(eigene Tore, letzte 10) / 10
avg_goals_for_season = sum(eigene Tore, Saison) / Saisonspiele
Gewichteter Durchschnitt:
avg = 0.5 * feature_5 + 0.3 * feature_10 + 0.2 * feature_seasonKuerzere Windows (5 Spiele) sind bei Tor-Features volatiler als bei PPG, da Tore eine hoehere Varianz pro Einzelspiel haben. Ein einzelnes 5:0-Ergebnis verschiebt den Avg Goals For um +0.6.
Match-Level Features
goals_for_diff = home_avg_gf_avg - away_avg_gf_avg (Angriffsdifferenz)
goals_against_diff = home_avg_ga_avg - away_avg_ga_avg (Verteidigungsdifferenz)
total_goals_sum = home_avg_total_avg + away_avg_total_avg (Kombinierte Torerwartung)
goal_diff_diff = home_avg_gd_avg - away_avg_gd_avg (Relative Staerke)Poisson-Verteilung und Lambda-Parameter
Die Poisson-Verteilung modelliert die Wahrscheinlichkeit von k Toren bei einer erwarteten Rate Lambda. Der Avg Goals-Wert ist der Lambda-Parameter — das macht Tor-Features so zentral.
P(X = k) = (lambda^k * e^(-lambda)) / k!
Lambda = Avg Goals (erwartete Torrate pro Spiel)| Metrik | EPL-Daten | Poisson-Erwartung | Bewertung |
|---|---|---|---|
| Heimtore Mean | 1.58 | — | — |
| Heimtore Varianz | 1.90 | 1.58 (= Mean) | Leichte Ueberdispersion |
| Auswaertstore Mean | 1.20 | — | — |
| Auswaertstore Varianz | 1.44 | 1.20 (= Mean) | Leichte Ueberdispersion |
Die leichte Ueberdispersion (Varianz > Mean) ist innerhalb akzeptabler Grenzen. Das einfache Poisson-Modell unterschaetzt allerdings Unentschieden (v.a. 0:0). Dixon & Coles (1997) korrigierten dies mit einem Faktor rho fuer niedrig-torende Ergebnisse.
Praediktive Kraft nach Wettmarkt
Over/Under 2.5
Tor-Features sind fuer den O/U-Markt der wichtigste Feature-Typ. Avg Total Goals beider Teams ist der direkteste Praediktor. Das Goals-basierte Poisson-Modell erreicht einen Brier Score von 59.7 — nur 2.5 Punkte hinter dem Buchmacher-Benchmark (57.2).
BTTS (Both Teams to Score)
Die Kombination aus Avg Goals For (offensive Staerke) und Avg Goals Against (defensive Verwundbarkeit) ist entscheidend. Wenn beide Teams im Schnitt >0.7 Tore kassieren und >0.7 erzielen, steigt die BTTS-Wahrscheinlichkeit signifikant.
1X2 (Match Result)
Avg Goal Difference ist das wertvollste Feature dieser Gruppe fuer Ergebnis-Vorhersagen. Allerdings sind Elo-Rating und Implied Probability fuer 1X2 insgesamt staerker als reine Tor-Features.
| Modell | Brier Score |
|---|---|
| Buchmacher-Benchmark (Bet365) | 57.2 |
| xG-basiertes Poisson-Modell | 58.6 |
| Goals-basiertes Poisson-Modell | 59.7 |
Vergleich mit Expected Goals (xG)
xG-basierte Modelle uebertreffen Goals-basierte Modelle, da xG eine niedrigere Varianz hat und die Qualitaet der kreierten Chancen erfasst. Die Top-10-Modelle in Benchmarks sind allesamt xG-Modelle.
Dennoch behalten tatsaechliche Tore ihren Wert: Sie sind verfuegbar, wenn xG-Daten fehlen, enthalten ein Finishing-Ability-Signal, und beeinflussen Teamvertrauen und Gegneransatz.
FiveThirtyEight-Ansatz: Nutzt einen Kompositwert aus vier Metriken — tatsaechliche Tore, angepasste Tore (reduziertes Gewicht bei Fuehrung), Shot-basiertes xG und Non-Shot xG. Dies erkennt an, dass jede Metrik leicht unterschiedliche Informationen erfasst.
Liga-Normalisierung
Tore pro Spiel variieren erheblich zwischen Ligen. Ein Team mit 1.8 Toren/Spiel in der Bundesliga liegt unter dem Ligadurchschnitt, waere aber in der Serie A ueberdurchschnittlich.
| Liga | Tore/Spiel | Abweichung vom Mittel |
|---|---|---|
| Bundesliga | 3.14 | +17% |
| Ligue 1 | 2.96 | +10% |
| Premier League | 2.93 | +9% |
| La Liga | 2.62 | -3% |
| Serie A | 2.56 | -5% |
Daten: Saison 2024/25. Da unser Match-Feature home_avg_gf - away_avg_gf immer zwei Teams derselben Liga vergleicht, ist die Liga-Normalisierung implizit gegeben.
Quellen
- Dixon & Coles (1997): "Modelling Association Football Scores and Inefficiencies in the Football Betting Market"
- Data-driven prediction of soccer outcomes (Journal of Big Data, 2024)
- Beat the Bookie: "The Predictive Power of xG" und "Inflated ML Poisson Model"
- FiveThirtyEight: "How Our Club Soccer Predictions Work"
- SBO: "Poisson Distribution for Football Prediction"
- Significance Magazine: "How to Identify Goal Scoring Ability in Football"