Average Goals

Feature #5

Durchschnittliche Tor-Statistiken bilden die Grundlage fuer Tor-basierte Vorhersagen. SHAP-Analysen identifizieren Goals Scored und Goals Conceded als Features mit der hoechsten Signal-Staerke — besonders relevant fuer Over/Under- und BTTS-Maerkte.

Ueberblick

Average Goals umfasst vier eng verwandte Metriken, die auf historischen Torergebnissen basieren. Sie sind die fundamentalsten Tor-Features und bilden die Grundlage fuer Poisson-Modelle und Expected-Goals-Vergleiche.

MetrikFormelWertebereichPrimaer fuer
Avg Goals ForEigene Tore / Spiele0.0 – ~4.0O/U, BTTS
Avg Goals AgainstKassierte Tore / Spiele0.0 – ~4.0O/U, BTTS
Avg Total Goals(Eigene + Kassierte) / Spiele0.0 – ~7.0O/U
Avg Goal Difference(Eigene - Kassierte) / Spiele-3.0 – +3.01X2

"Goals, Conceded and Goal Preventions directly determine the match outcome and thus possess the highest signal strength, effectively reducing model entropy."

— Journal of Big Data (2024)

Berechnung

Rolling Windows

Wie beim Form-Index werden alle vier Metriken ueber drei Zeitfenster berechnet:

avg_goals_for_5    = sum(eigene Tore, letzte 5) / 5
avg_goals_for_10   = sum(eigene Tore, letzte 10) / 10
avg_goals_for_season = sum(eigene Tore, Saison) / Saisonspiele

Gewichteter Durchschnitt:
avg = 0.5 * feature_5 + 0.3 * feature_10 + 0.2 * feature_season

Kuerzere Windows (5 Spiele) sind bei Tor-Features volatiler als bei PPG, da Tore eine hoehere Varianz pro Einzelspiel haben. Ein einzelnes 5:0-Ergebnis verschiebt den Avg Goals For um +0.6.

Match-Level Features

goals_for_diff     = home_avg_gf_avg - away_avg_gf_avg    (Angriffsdifferenz)
goals_against_diff = home_avg_ga_avg - away_avg_ga_avg    (Verteidigungsdifferenz)
total_goals_sum    = home_avg_total_avg + away_avg_total_avg  (Kombinierte Torerwartung)
goal_diff_diff     = home_avg_gd_avg - away_avg_gd_avg    (Relative Staerke)

Poisson-Verteilung und Lambda-Parameter

Die Poisson-Verteilung modelliert die Wahrscheinlichkeit von k Toren bei einer erwarteten Rate Lambda. Der Avg Goals-Wert ist der Lambda-Parameter — das macht Tor-Features so zentral.

P(X = k) = (lambda^k * e^(-lambda)) / k!

Lambda = Avg Goals (erwartete Torrate pro Spiel)
MetrikEPL-DatenPoisson-ErwartungBewertung
Heimtore Mean1.58
Heimtore Varianz1.901.58 (= Mean)Leichte Ueberdispersion
Auswaertstore Mean1.20
Auswaertstore Varianz1.441.20 (= Mean)Leichte Ueberdispersion

Die leichte Ueberdispersion (Varianz > Mean) ist innerhalb akzeptabler Grenzen. Das einfache Poisson-Modell unterschaetzt allerdings Unentschieden (v.a. 0:0). Dixon & Coles (1997) korrigierten dies mit einem Faktor rho fuer niedrig-torende Ergebnisse.

Praediktive Kraft nach Wettmarkt

Over/Under 2.5

Tor-Features sind fuer den O/U-Markt der wichtigste Feature-Typ. Avg Total Goals beider Teams ist der direkteste Praediktor. Das Goals-basierte Poisson-Modell erreicht einen Brier Score von 59.7 — nur 2.5 Punkte hinter dem Buchmacher-Benchmark (57.2).

BTTS (Both Teams to Score)

Die Kombination aus Avg Goals For (offensive Staerke) und Avg Goals Against (defensive Verwundbarkeit) ist entscheidend. Wenn beide Teams im Schnitt >0.7 Tore kassieren und >0.7 erzielen, steigt die BTTS-Wahrscheinlichkeit signifikant.

1X2 (Match Result)

Avg Goal Difference ist das wertvollste Feature dieser Gruppe fuer Ergebnis-Vorhersagen. Allerdings sind Elo-Rating und Implied Probability fuer 1X2 insgesamt staerker als reine Tor-Features.

ModellBrier Score
Buchmacher-Benchmark (Bet365)57.2
xG-basiertes Poisson-Modell58.6
Goals-basiertes Poisson-Modell59.7

Vergleich mit Expected Goals (xG)

xG-basierte Modelle uebertreffen Goals-basierte Modelle, da xG eine niedrigere Varianz hat und die Qualitaet der kreierten Chancen erfasst. Die Top-10-Modelle in Benchmarks sind allesamt xG-Modelle.

Dennoch behalten tatsaechliche Tore ihren Wert: Sie sind verfuegbar, wenn xG-Daten fehlen, enthalten ein Finishing-Ability-Signal, und beeinflussen Teamvertrauen und Gegneransatz.

FiveThirtyEight-Ansatz: Nutzt einen Kompositwert aus vier Metriken — tatsaechliche Tore, angepasste Tore (reduziertes Gewicht bei Fuehrung), Shot-basiertes xG und Non-Shot xG. Dies erkennt an, dass jede Metrik leicht unterschiedliche Informationen erfasst.

Liga-Normalisierung

Tore pro Spiel variieren erheblich zwischen Ligen. Ein Team mit 1.8 Toren/Spiel in der Bundesliga liegt unter dem Ligadurchschnitt, waere aber in der Serie A ueberdurchschnittlich.

LigaTore/SpielAbweichung vom Mittel
Bundesliga3.14+17%
Ligue 12.96+10%
Premier League2.93+9%
La Liga2.62-3%
Serie A2.56-5%

Daten: Saison 2024/25. Da unser Match-Feature home_avg_gf - away_avg_gf immer zwei Teams derselben Liga vergleicht, ist die Liga-Normalisierung implizit gegeben.

Quellen

  • Dixon & Coles (1997): "Modelling Association Football Scores and Inefficiencies in the Football Betting Market"
  • Data-driven prediction of soccer outcomes (Journal of Big Data, 2024)
  • Beat the Bookie: "The Predictive Power of xG" und "Inflated ML Poisson Model"
  • FiveThirtyEight: "How Our Club Soccer Predictions Work"
  • SBO: "Poisson Distribution for Football Prediction"
  • Significance Magazine: "How to Identify Goal Scoring Ability in Football"