Kontext-Features

Feature #7

Kontextuelle Features erfassen den situativen Rahmen eines Spiels jenseits historischer Team-Leistungen. Die Erholungszeit zwischen Spielen und der Saisonfortschritt beeinflussen Spielergebnisse messbar — wenn auch als sekundaere Faktoren hinter Elo, Form und Quoten.

Ueberblick

Kontext-Features sind punktuelle Features (pro Fixture), nicht rollierende Durchschnitte. Sie ergaenzen die leistungsbasierten Features (Elo, Form, Goals, Rates) um situative Informationen.

#FeatureBeschreibungWertebereichPrimaer fuer
21Tage seit letztem SpielErholungs-/Ermuedungs-Indikator pro Team0 – 21 Tage (gekappt)O/U, 1X2
22Spieltag der SaisonNormalisierter Saisonfortschritt0.0 – 1.01X2

"Teams with only 2 days of preparation were 40% less likely to win their next game compared to teams with 3 days."

— Verheijen (2012), 20-Jahres-Studie zu Fixture Congestion

Erholungszeit (Rest Days)

Nicht-linearer Zusammenhang

Die Forschung zeigt eine umgekehrte U-Beziehung zwischen Erholungszeit und Leistung. Zu wenig Pause schadet (Ermuedung), zu viel Pause ebenfalls (Spielrhythmus-Verlust).

ErholungstageEffektEinordnung
0–2 TageSchwere Ermuedung, 40% reduzierte SiegchanceErmuedung
3 TageSuboptimal, High-Intensity-Output sinktKurze Pause
4–5 TageOptimale ErholungszoneOptimal
6–7 TageStandard-Wochenrhythmus, keine ErmuedungsstrafeNormal
8–14 TageAngemessene Ruhe, kaum MarginalnutzenLaengere Pause
14+ TagePotentieller Verlust des SpielrhythmusRost-Risiko

Feature Importance

Die Settembre et al. (2024) Studie analysierte 61.000+ Fixtures mittels XGBoost. Erholungstage rangierten auf Platz 8–10 der Feature Importance — messbar, aber 4–8x geringer als die Top-3 (Spielort, Elo-Differenz, aktuelle Form).

Der Effekt ist am deutlichsten bei Mittelklasse-Teams. Top-Teams mit tieferen Kadern koennen Spieler rotieren, was den Belastungseffekt teilweise mildert. Bei schwachen Teams ueberwiegen andere Faktoren.

Effekt auf Tore

Ermuedung manifestiert sich in den letzten 15–20 Minuten: mehr spaete Gegentore und Verlust defensiver Struktur. Stuttgen (2025) fand, dass Offensivstaerke unter Belastung sinkt, waehrend die Defensivstaerke bei Heimspielen paradoxerweise steigt — taktischer Konservatismus als Schutzmechanismus.

Saisonfortschritt (Season Progress)

Saisonphasen-Effekte

Die Position in der Saison beeinflusst Spielergebnisse ueber verschiedene Mechanismen. Das Feature normalisiert den Spieltag auf 0.0–1.0, sodass Ligen mit unterschiedlichen Spieltagsanzahlen vergleichbar sind.

PhaseSpieltageTor-MusterBesonderheiten
Fruehe Saison1–6Leicht erhoehte Tore, hohe VarianzNeue Zugaenge nicht integriert, Form-Features unzuverlaessig
Mitte Saison7–30Stabilste PhaseNaechste an wahrer Teamstaerke, beste Vorhersagbarkeit
Spaete Saison31–38Divergent nach KontextAbstiegskampf = weniger Tore, bedeutungslose Spiele = mehr Tore

Motivations-Effekte

Teams mit gesicherten Positionen holen weniger Punkte, erzielen aber paradoxerweise mehr Tore (offensiverer Stil) und kassieren noch mehr (nachlassende Defensivarbeit). Teams im Abstiegskampf zeigen erhoehte Defensivanstrengung und koennen ihre Saisonform dramatisch uebertreffen.

Warum isoliert geringe Importance?

Saisonfortschritt rangiert isoliert im unteren Quartil der Feature Importance. Seine Staerke liegt in Interaktionen: Saisonphase × Abstiegsstatus, Saisonphase × Form, Spieltag × Elo-Differenz. Gradient Boosted Trees lernen diese Interaktionen automatisch.

Berechnung

Erholungszeit

rest_days_home = fixture_date - last_fixture_date_home
rest_days_away = fixture_date - last_fixture_date_away
rest_days_diff = rest_days_home - rest_days_away

Capping: min(rest_days, 21) — daempft Ausreisser
Default: 7 Tage wenn kein vorheriges Spiel (Saisonstart)

Die relative Differenz (rest_days_diff) ist das primaere Signal: Ein Team mit 7 Tagen Pause gegen eines mit 3 Tagen hat einen spuerbaren Vorteil. Gradient Boosted Trees entdecken die nicht-linearen Schwellenwerte (2–3 Tage Ermuedung, 14+ Tage Rost) automatisch aus den Rohwerten.

Saisonfortschritt

season_progress = (round_position - 1) / (max_rounds - 1)

Beispiele:
  Spieltag 1 von 34 (Bundesliga)  → 0.0000
  Spieltag 17 von 34 (Bundesliga) → 0.4848
  Spieltag 19 von 38 (EPL)        → 0.4865  (vergleichbar!)
  Spieltag 34 von 34 (Bundesliga) → 1.0000

Zusaetzlich werden der rohe Spieltag (matchday) und die verbleibenden Spiele (matches_remaining) gespeichert. Die Normalisierung stellt sicher, dass Ligen mit 34 (Bundesliga) und 38 (Premier League) Spieltagen vergleichbar sind.

Match-Level Features

rest_days_home       — Tage seit letztem Spiel (Heimteam)
rest_days_away       — Tage seit letztem Spiel (Auswaertsteam)
rest_days_diff       — home - away (positiv = Heim ausgeruhter)
season_progress      — 0.0 bis 1.0
matchday             — Roher Spieltag (Integer)
matches_remaining    — Verbleibende Spieltage
has_context          — 1/0 Sentinel

Physiologische Erholungs-Timeline

Die sportwissenschaftliche Forschung zeigt klare Erholungs-Phasen nach einem Fussballspiel:

Stunden nach SpielErholungsstatus
0–24hAlle Marker erhoeht, signifikante Leistungseinschraenkung
24–48hHerzfrequenz-Erholung noch verschoben
48–72hPhysische Leistung erholbar, Muskelschaeden-Marker noch erhoeht
72h+ (3+ Tage)Pre-Match-Werte generell erreichbar
96h+ (4+ Tage)Volle Erholung, Wettbewerbsvorteil wiederhergestellt

Spieler fuehren bei nur 3 Tagen Pause weniger hochintensive Sprints aus. Da 45% aller Tore ein Sprint vorausgeht, verbindet dies reduzierte physische Leistung direkt mit Tor-Wahrscheinlichkeiten.

Sprint 4 — Ergaenzende Statistiken

Geplant
#FeatureBeschreibungRelevant fuer
35Avg PossessionDurchschnittlicher BallbesitzKontext
36Yellow Card AvgGelbe Karten pro SpielKartenmaerkte
37Red Card AvgRote Karten pro SpielKartenmaerkte
38Attack Index0.7 × Schuesse + 0.3 × EckenO/U
39Fouls per GameFouls pro SpielKartenmaerkte
40Saves per GameTorwartparaden pro SpielKontext
41Shots Inside Box RatioSchuesse aus dem Strafraum / GesamtO/U
42Offsides per GameAbseits pro SpielKontext

Tier-4-Features werden als einfache Rolling Averages ueber die Standard-Windows (5, 10, Season) berechnet. Sie benoetigen Advanced/Standard Match Statistics — verfuegbar fuer 20–30 Ligen.

Quellen

  • Verheijen (2012): 20-Jahres-Studie zu Fixture Congestion und Siegwahrscheinlichkeit
  • Settembre, Buchheit, Verheijen et al. (2024): "Factors associated with match outcomes in elite European football" — Journal of Sports Analytics
  • Stuttgen (2025): "The Impact of Scheduling and Match Congestion on Team Performance" — Journal of Sports Economics
  • Springham et al. (2020): "Effect of Fixture Congestion: Systematic Review with Meta-Analysis" — Sports Medicine
  • Dixon & Coles (1997): "Modelling Association Football Scores" — Zeitabhaengige Parameter fuer Saisoneffekte
  • Expecting Goals: "What Happens When Teams Have Nothing to Play For"