Compito della statistica è quello di analizzare la realtà tramite modelli matematici che possano in qualche modo non solo definirla, ma anche “predirla”, se non altro in termini di probabilità.
In campo sportivo i numeri sono più che mai determinanti per valutare al meglio prestazioni di squadre e giocatori, nonché per cercare di comprendere tutte le possibili dinamiche degli sviluppi presenti e futuri.
L’importanza dei grandi numeri
Detto quindi che non stiamo parlando di “chiaroveggenza” magica, ma di probabilità che un determinato evento o situazione si realizzi, risulta facile immaginare come all’aumentare dei numeri e dei dati a disposizione, maggiore sarà anche l’accuratezza con cui la statistica riuscirà a fare queste previsioni.
Questo è anche il motivo per cui il calcio non è tra le discipline sportive più facili da analizzare, avendo a disposizione molti meno dati individuali su molti parametri fondamentali, primo tra tutti, quello dei “Gol”.
Se in sport come il Baseball per esempio, possiamo contare a fine stagione su un numero incredibile di informazioni su ogni singola azione di ogni giocatore (avendo a che fare con posizioni e dinamiche più frequenti e fisse), nel calcio abbiamo qualche difficoltà in più.
Basti pensare per esempio che se da una parte possiamo contare su almeno 500 presenze sul “piatto” di battuta per ogni giocatore, sul campo da calcio è già difficile poter vedere atleti che arrivano a 30 o 40 conclusioni in porta nel corso di un campionato (per di più ulteriormente divisibili per posizione, modalità e altro).
La metrica fondamentale: il “Gol”
Quindi impossibile fare analisi statistica nel mondo del pallone? Certo che si può, dobbiamo solo analizzare i dati in maniera ancora più accurata cercando di darne una quanto più possibile corretta lettura. In particolare di quelli che sono i suoi parametri fondamentali, primo tra tutti ovviamente, il “Gol”.
Non c’è dubbio infatti che per quanto siano importanti tutti i vari parametri di gioco, quello del “Gol” è certamente il dato che più va a influire non solo sul risultato finale (banalmente), ma anche su tutte le ulteriori analisi di gioco della squadra e dei singoli giocatori.
Questo però non significa valutare solo il dato finale, ovvero quanti tiri e quanti gol vengono effettivamente fatti, ma capire quanto quel dato sia influenzato da altri parametri che sul lungo periodo possono dirci se il giocatore o la squadra stanno vivendo semplicemente un momento fortunato o se siano invece al top della prestazione.
Per valutare tutto questo nel migliore dei modi, ci viene in aiuto uno dei dati più importanti del calcio: l’Expected Goal.
Che cos’è l’Expected Goal
Capita spesso di leggere alcune statistiche che si riferiscono a qualche giocatore che “non segna da dieci partite”, oppure che viceversa di intere squadre che “prendono gol da x partite”. Questo genere di dati possono certamente essere utili dal punto di vista comunicativo, ma non sempre sono accurati per un’analisi efficace.
Non ci dicono infatti se quel determinato giocatore non sta segnando perché gioca male, perché è poco preciso, se perché proprio non ha avuto occasioni e nemmeno che tipo di occasioni ha eventualmente avuto (erano facili o difficili?).
Per avere un quadro decisamente più accurato sulla situazione, meglio allora utilizzare il parametro degli “Expected Goal”.
Questo dato è definito da OPTA come:
“Gli Expected Goal, misurano la qualità di un tiro in base a diverse variabili come il tipo di assist, l’angolo di tiro e la distanza dalla porta, se si trattava di un tiro di testa o se di una grande occasione. Sommando i goal previsti di un giocatore o di una squadra, può darci un’indicazione di quanti goal avrebbero dovuto segnare in media un giocatore o una squadra, dati i tiri che ha effettuato.”
Fonte OPTA
In parole povere, con questo dato (indicato generalmente con “xG“), abbiamo la possibilità oggettiva di valutare in che percentuale ogni tiro avrebbe potuto diventare un Gol. Per estensione, quanto la somma dei tiri di un giocatore o di una squadra siano in linea con l’effettiva percentuale di realizzazione (ovvero quanto sia stato merito del giocatore e della fortuna, o quanto di imprecisione e sfortuna).
Come si calcola l’Expected Goal
Detto che non c’è un unico modo di calcolare questo parametro, parliamo comunque di un “modello matematico“, una sorta di algoritmo capace di tradurre in un unico numero (compreso tra 0 e 1) una serie di dati inseriti in entrata.
Si parte da una banca dati che comprende tutta l’analisi di una serie di conclusioni verso la porta, in un numero ormai maggiore a 300 mila tiri effettuati.
Di queste situazioni si indicano in particolare specifiche importanti quali la posizione in campo (quindi la distanza dalla porta e l’angolo di tiro), la parte del corpo con cui si colpisce il pallone (se di destro, di sinistro o di testa), se frutto di un assist o di un dribbling, se arriva da un cross alto o da un passaggio basso, se arriva da un contropiede o da un’azione manovrata, e via dicendo.
Tutti questi parametri influenzano la “qualità” della conclusione analizzata e di conseguenza la sua possibilità di finire effettivamente in fondo alla rete. Più il valore di xG tende a 1, più ovviamente quella conclusione analizzata ha probabilità di finire in Goal. Un calcio di rigore per esempio (conclusione su cui ci sono ancora più dati visto che si parte sempre da una posizione fissa), avrà un Expected Goal intorno allo 0,79 visto che le statistiche parlano di poco più di 3 gol ogni 4 rigori calciati.
L’utilità degli xG
Ma come può esserci utile il dato degli Expected Goal per l’analisi di un calciatore o di una squadra? A livello statistico questo dato è in effetti uno degli indicatori più efficaci per stabilire quanto una squadra o un giocatore stiano viaggiando sopra o sotto le aspettative.
Nel corso di una singola partita per esempio, è facile per molti limitarsi al numero di conclusioni effettuate, osservando come se una squadra ne ha fatte 25 avrà probabilmente dominato l’incontro a prescindere dal risultato finale che magari ha premiato i suoi rivali con solo un paio di occasioni.
Nel dettaglio però, utilizzando il valore di “xG” si potrebbe scoprire magari che di quei 25 tiri quasi tutti sono con valori molto bassi (quindi possibilmente tiri da lontano, conclusioni poco efficaci e con scarsa possibilità di finire in gol), mentre quelli della squadra avversaria potrebbero essere tutte occasioni valide da gol, con valori di xG molto alti (un contropiede, una grande occasione).
Allargando il discorso possiamo quindi analizzare meglio lo stato di forma di un periodo, al di là degli effettivi risultati raggiunti (o mancati). Pensiamo per esempio agli attaccanti della Serie A, con riferimento a Dusan Vlahovic e Tammy Abraham. Ovvero il capocannoniere del torneo e osannato da tutti come tra i più cinici attaccanti della stagione, e il nuovo arrivato delle Roma accusato spesso di non soddisfare le attese della vigilia.
Tutti giudizi basati principalmente sui 16 gol segnati dal serbo e i soltanto 8 segnati invece dall’inglese. Analizzando però il dato complessivo dei rispettivi xG (ovvero la somma dei singoli xG di tutti i tiri effettuati dai due giocatori) dopo la ventunesima giornata di Serie A, scopriamo che il valore di Vlahovic per i suoi gol previsti è di 11.2 (quasi cinque gol in meno) mentre quello di Abraham è di 10.5 (due gol e mezzo in più). Se togliessimo dal modello di previsione i tiri dal dischetto, il dato di Vlahovic si abbasserebbe addirittura a 7.4 (mentre per l’inglese resterebbe invariato, visto che non ne ha calciato nemmeno uno).
In buona sostanza, quelle che sembrerebbero due stagioni quasi opposte per rendimento, non sono poi così distanti a livello di aspettative matematiche. Ovvero ragionando su un periodo di tempo più lungo, la probabilità che Abraham tenda a migliorare il suo dato di gol effettivi mentre Vlahovic tenda ad abbassarlo, è piuttosto alta.
Parimenti tramite gli Expected Goal si può analizzare anche lo stato di forma di intere squadre, verificando se il numero di gol e relativa classifica di campionato, sia in linea con quella prevista dai dati. A fine stagione i due dati dovrebbero essere abbastanza vicini, ma ci sono sicuramente spezzoni di campionato dove le variazioni possono essere anche molto alte.
Ricordiamo per esempio l’avvio della Juventus nella stagione 2015-2016, quando dopo dieci giornate si trovava negli ultimi posti della Serie A, con solo 11 gol fatti e 9 subiti. Il dato dei gol attesi però, diceva ben altro: avrebbe infatti dovuto segnarne 19, subendone solo 5. Un rendimento quindi decisamente sotto media, che infatti ha portato poi a un filotto di vittorie e allo scudetto finale, equilibrando pian piano quella discrepanza.
In maniera simile, anche quest’anno abbiamo vissuto un momento magico del Verona, che dopo l’arrivo di Tudor stava facendo segnare numeri da alta classifica. Anche troppo rispetto alle prestazioni in campo, tanto che non a caso è arrivato poi un settore di campionato deludente dove il dato dei gol è tornato vicino a quello previsto: ancora dopo la ventunesima giornata però, a fronte dei 36 gol segnati sul campo, il valore di xG complessivo recitava un 28.2 (ovvero ha segnato quasi otto gol più di quelli previsti).
Niente formule magiche
Attenzione però, che non si pensi che questo xG (come qualsiasi altra statistica) sia una sorta di oracolo magico. Stiamo pur sempre parlando di previsioni e di percentuali di possibilità. Uno strumento utile per analizzare in maniera più approfondita e oggettiva le prestazioni di singoli e squadre.
Sapendo che i numeri tenderanno sempre alla media prevista, possiamo se non altro renderci conto di quanto il valore reale si discosta da quello teorico, prevedendo trend generali più che singole prestazioni.
Si tratta inoltre di un modello matematico che, per quanto sempre più accurato (e si lavora affinchè lo sia sempre di più), non tiene conto di tutta una serie di variabili in gioco, specialmente in uno sport come il calcio dove appunto sono tantissime le possibili variazioni di una dinamica in campo (manca ancora per esempio, tutta la parte riguardante la difesa degli avversari).
Nè del resto offre una “soluzione” a eventuali discordanze statistiche (ci dice forse che un attaccante è più cinico e sta rendendo sopra la media, mentre un altro no, ma non fornisce indicazioni sui motivi che portano questa differenza).
Ciò nonostante, gli Expected Goal (e statistiche derivate, come gli Expected Assist), offrono sicuramente un quadro più completo e realistico della fotografia calcistica, malgrado appunto i dati non siano sempre sufficienti (il basso numero di tiri e di reti non aiuta).