Kontext-Features
Kontextuelle Features erfassen den situativen Rahmen eines Spiels jenseits historischer Team-Leistungen. Die Erholungszeit zwischen Spielen und der Saisonfortschritt beeinflussen Spielergebnisse messbar — wenn auch als sekundaere Faktoren hinter Elo, Form und Quoten.
Ueberblick
Kontext-Features sind punktuelle Features (pro Fixture), nicht rollierende Durchschnitte. Sie ergaenzen die leistungsbasierten Features (Elo, Form, Goals, Rates) um situative Informationen.
| # | Feature | Beschreibung | Wertebereich | Primaer fuer |
|---|---|---|---|---|
| 21 | Tage seit letztem Spiel | Erholungs-/Ermuedungs-Indikator pro Team | 0 – 21 Tage (gekappt) | O/U, 1X2 |
| 22 | Spieltag der Saison | Normalisierter Saisonfortschritt | 0.0 – 1.0 | 1X2 |
"Teams with only 2 days of preparation were 40% less likely to win their next game compared to teams with 3 days."
— Verheijen (2012), 20-Jahres-Studie zu Fixture Congestion
Erholungszeit (Rest Days)
Nicht-linearer Zusammenhang
Die Forschung zeigt eine umgekehrte U-Beziehung zwischen Erholungszeit und Leistung. Zu wenig Pause schadet (Ermuedung), zu viel Pause ebenfalls (Spielrhythmus-Verlust).
| Erholungstage | Effekt | Einordnung |
|---|---|---|
| 0–2 Tage | Schwere Ermuedung, 40% reduzierte Siegchance | Ermuedung |
| 3 Tage | Suboptimal, High-Intensity-Output sinkt | Kurze Pause |
| 4–5 Tage | Optimale Erholungszone | Optimal |
| 6–7 Tage | Standard-Wochenrhythmus, keine Ermuedungsstrafe | Normal |
| 8–14 Tage | Angemessene Ruhe, kaum Marginalnutzen | Laengere Pause |
| 14+ Tage | Potentieller Verlust des Spielrhythmus | Rost-Risiko |
Feature Importance
Die Settembre et al. (2024) Studie analysierte 61.000+ Fixtures mittels XGBoost. Erholungstage rangierten auf Platz 8–10 der Feature Importance — messbar, aber 4–8x geringer als die Top-3 (Spielort, Elo-Differenz, aktuelle Form).
Der Effekt ist am deutlichsten bei Mittelklasse-Teams. Top-Teams mit tieferen Kadern koennen Spieler rotieren, was den Belastungseffekt teilweise mildert. Bei schwachen Teams ueberwiegen andere Faktoren.
Effekt auf Tore
Ermuedung manifestiert sich in den letzten 15–20 Minuten: mehr spaete Gegentore und Verlust defensiver Struktur. Stuttgen (2025) fand, dass Offensivstaerke unter Belastung sinkt, waehrend die Defensivstaerke bei Heimspielen paradoxerweise steigt — taktischer Konservatismus als Schutzmechanismus.
Saisonfortschritt (Season Progress)
Saisonphasen-Effekte
Die Position in der Saison beeinflusst Spielergebnisse ueber verschiedene Mechanismen. Das Feature normalisiert den Spieltag auf 0.0–1.0, sodass Ligen mit unterschiedlichen Spieltagsanzahlen vergleichbar sind.
| Phase | Spieltage | Tor-Muster | Besonderheiten |
|---|---|---|---|
| Fruehe Saison | 1–6 | Leicht erhoehte Tore, hohe Varianz | Neue Zugaenge nicht integriert, Form-Features unzuverlaessig |
| Mitte Saison | 7–30 | Stabilste Phase | Naechste an wahrer Teamstaerke, beste Vorhersagbarkeit |
| Spaete Saison | 31–38 | Divergent nach Kontext | Abstiegskampf = weniger Tore, bedeutungslose Spiele = mehr Tore |
Motivations-Effekte
Teams mit gesicherten Positionen holen weniger Punkte, erzielen aber paradoxerweise mehr Tore (offensiverer Stil) und kassieren noch mehr (nachlassende Defensivarbeit). Teams im Abstiegskampf zeigen erhoehte Defensivanstrengung und koennen ihre Saisonform dramatisch uebertreffen.
Warum isoliert geringe Importance?
Saisonfortschritt rangiert isoliert im unteren Quartil der Feature Importance. Seine Staerke liegt in Interaktionen: Saisonphase × Abstiegsstatus, Saisonphase × Form, Spieltag × Elo-Differenz. Gradient Boosted Trees lernen diese Interaktionen automatisch.
Berechnung
Erholungszeit
rest_days_home = fixture_date - last_fixture_date_home
rest_days_away = fixture_date - last_fixture_date_away
rest_days_diff = rest_days_home - rest_days_away
Capping: min(rest_days, 21) — daempft Ausreisser
Default: 7 Tage wenn kein vorheriges Spiel (Saisonstart)Die relative Differenz (rest_days_diff) ist das primaere Signal: Ein Team mit 7 Tagen Pause gegen eines mit 3 Tagen hat einen spuerbaren Vorteil. Gradient Boosted Trees entdecken die nicht-linearen Schwellenwerte (2–3 Tage Ermuedung, 14+ Tage Rost) automatisch aus den Rohwerten.
Saisonfortschritt
season_progress = (round_position - 1) / (max_rounds - 1)
Beispiele:
Spieltag 1 von 34 (Bundesliga) → 0.0000
Spieltag 17 von 34 (Bundesliga) → 0.4848
Spieltag 19 von 38 (EPL) → 0.4865 (vergleichbar!)
Spieltag 34 von 34 (Bundesliga) → 1.0000Zusaetzlich werden der rohe Spieltag (matchday) und die verbleibenden Spiele (matches_remaining) gespeichert. Die Normalisierung stellt sicher, dass Ligen mit 34 (Bundesliga) und 38 (Premier League) Spieltagen vergleichbar sind.
Match-Level Features
rest_days_home — Tage seit letztem Spiel (Heimteam)
rest_days_away — Tage seit letztem Spiel (Auswaertsteam)
rest_days_diff — home - away (positiv = Heim ausgeruhter)
season_progress — 0.0 bis 1.0
matchday — Roher Spieltag (Integer)
matches_remaining — Verbleibende Spieltage
has_context — 1/0 SentinelPhysiologische Erholungs-Timeline
Die sportwissenschaftliche Forschung zeigt klare Erholungs-Phasen nach einem Fussballspiel:
| Stunden nach Spiel | Erholungsstatus |
|---|---|
| 0–24h | Alle Marker erhoeht, signifikante Leistungseinschraenkung |
| 24–48h | Herzfrequenz-Erholung noch verschoben |
| 48–72h | Physische Leistung erholbar, Muskelschaeden-Marker noch erhoeht |
| 72h+ (3+ Tage) | Pre-Match-Werte generell erreichbar |
| 96h+ (4+ Tage) | Volle Erholung, Wettbewerbsvorteil wiederhergestellt |
Spieler fuehren bei nur 3 Tagen Pause weniger hochintensive Sprints aus. Da 45% aller Tore ein Sprint vorausgeht, verbindet dies reduzierte physische Leistung direkt mit Tor-Wahrscheinlichkeiten.
Sprint 4 — Ergaenzende Statistiken
| # | Feature | Beschreibung | Relevant fuer |
|---|---|---|---|
| 35 | Avg Possession | Durchschnittlicher Ballbesitz | Kontext |
| 36 | Yellow Card Avg | Gelbe Karten pro Spiel | Kartenmaerkte |
| 37 | Red Card Avg | Rote Karten pro Spiel | Kartenmaerkte |
| 38 | Attack Index | 0.7 × Schuesse + 0.3 × Ecken | O/U |
| 39 | Fouls per Game | Fouls pro Spiel | Kartenmaerkte |
| 40 | Saves per Game | Torwartparaden pro Spiel | Kontext |
| 41 | Shots Inside Box Ratio | Schuesse aus dem Strafraum / Gesamt | O/U |
| 42 | Offsides per Game | Abseits pro Spiel | Kontext |
Tier-4-Features werden als einfache Rolling Averages ueber die Standard-Windows (5, 10, Season) berechnet. Sie benoetigen Advanced/Standard Match Statistics — verfuegbar fuer 20–30 Ligen.
Quellen
- Verheijen (2012): 20-Jahres-Studie zu Fixture Congestion und Siegwahrscheinlichkeit
- Settembre, Buchheit, Verheijen et al. (2024): "Factors associated with match outcomes in elite European football" — Journal of Sports Analytics
- Stuttgen (2025): "The Impact of Scheduling and Match Congestion on Team Performance" — Journal of Sports Economics
- Springham et al. (2020): "Effect of Fixture Congestion: Systematic Review with Meta-Analysis" — Sports Medicine
- Dixon & Coles (1997): "Modelling Association Football Scores" — Zeitabhaengige Parameter fuer Saisoneffekte
- Expecting Goals: "What Happens When Teams Have Nothing to Play For"