10 min read

Di cosa parliamo quando parliamo di expected threat?

Un modello per misurare la pericolosità offensiva oltre a tiri e passaggi chiave
Di cosa parliamo quando parliamo di expected threat?

Originalmente pubblicato nel settembre 2021

Negli ultimi anni le statistiche avanzate hanno facilitato la comprensione dei pesi di forza mostrati da squadre e giocatori sul campo. Ci aiutano a quantificare volume e qualità di occasioni create da squadre e individui, ci dicono qualcosa in più sull’efficacia difensiva o offensiva di un collettivo.

Il grosso del lavoro è però spesso legato all’atto finale della manovra, alla produzione del tiro o alla conclusione stessa. Gli expected goals offrono informazioni relative alla pericolosità dell’occasione e aiutano a tracciarne il volume nell’arco di una o più partite ma non vanno oltre il passaggio precedente al tiro.

Come possiamo quindi valutare distintamente il contributo delle giocate che avvengono prima che la squadra vada al tiro?

Quante volte abbiamo visto un filtrante venir sprecato banalmente da una rifinitura mal abbozzata? In passato quel filtrante sarebbe rimasto semplicemente un filtrante. Sarebbe stato conteggiato come passaggio progressivo, la distanza guadagnata verso la porta avversaria avrebbe contribuito al totale di metri guadagnati dalle giocate del singolo individuo ma il valore intrinseco di quella giocata si sarebbe persa nell’anonimità del vasto mondo delle statistiche aggregate.

Oggi però possiamo contare sui modelli di expected threat.

Expected che?

Se gli expected goals utilizzano il contesto di un’occasione per misurarne la pericolosità, i modelli di expected threat (o xT) utilizzano dati storici per assegnare ad ogni zona di campo un valore uguale alla probabilità che avere il possesso in quella zona porti a concludere l’azione con un gol.

Gli ingredienti dei modelli xT sono tali da permettere una valutazione che va oltre il tiro e di misurare così l’evoluzione della pericolosità di una squadra all’interno della partita in base alle porzioni di campo battute, o di apprezzare le singole giocate che spostano il pallone da una zona poco pericolosa — a basso xT— ad una molto pericolosa — ad alto xT.

L’applicazione dei modelli xT a giocate singole come passaggi e dribbling permette di quantificare il valore che il singolo giocatore aggiunge alla fase di possesso spostando il pallone da una zona all’altra del campo, colma una lacuna latente nel mondo del calcio andando a premiare quei giocatori che incidono in maniera determinante in fase di impostazione o in rifinitura, ma che, per compiti e caratteristiche, rimangono lontani dall’ultimissima fase della manovra.

Ma come viene calcolato il valore xT di un singolo evento?

Il valore della singola azione non è altro che la differenza tra la probabilità realizzativa della zona di arrivo e quella della zona di partenza.

Il campo qui sotto è stato suddiviso in tante piccole porzioni. Ad ogni microarea viene assegnato un valore dato dalla probabilità che, con la squadra in possesso in quella zona del campo, l’azione possa concludersi con un gol.

Ogni zona del campo ha un valore xT dato dalla probabilità che controllare il pallone in quella zona del campo porti a concludere l’azione con un gol. In questo caso la zona di partenza ha una probabilità realizzativa del 0.9%, quella di arrivo del 18.4%

In questo caso la giocata da valutare è un passaggio che nasce da una zona di campo dal valore xT pari a 0.009 (ovvero dato il possesso in quella specifica zona, la squadra ha soltanto lo 0.9% di probabilità di concludere l’azione con il gol) e che sposta il pallone giusto in fronte alla porta avversaria, in una fetta di campo dal valore xT pari a 0.184 (a questo punto il possesso è diventato più pericoloso e la probabilità che l’azione si concluda con un gol è salita al 18.4%).

Il valore xT del passaggio sarà quindi calcolato come la differenza tra la probabilità realizzativa nel punto di arrivo e quella del punto di partenza. La giocata ha aumentato la probabilità che l’azione si possa concludere con un gol del 17.5% (dal 0.9% al 18.4%).

Il concetto di xT ha una storia breve, nasce dal lavoro di Karun Singh che in questo blog espandeva l’applicazione del calcolo delle probabilità ad azioni lontane da tiro o passaggio chiave per meglio valutare il contributo dei talentuosi o laboriosi figuri che instancabilmente incidono sulla pericolosità dell’azione ben prima che questa trovi compimento.

La struttura dietro all’xT ha però origini più lontane che in molti riconducono al lavoro svolto da Sarah Rudd (oggi Direttrice del dipartimento di Analytics e Software Development dell’Arsenal), la prima nel settore ad utilizzare le Catene di Markov per assegnare un valore ad ogni singola giocata in fase di possesso.

L’idea di base è la stessa: quantificare il valore di tutte le giocate individuali che contribuiscono a comporre il valore complessivo di un azione.

Prendiamo come esempio questo filtrante di Di Maria. L’argentino si abbassa incontro al pallone mentre Icardi gli sfreccia affianco. La palla è appena oltre il centrocampo, ancora lontana dalle zone pericolose.

via GIPHY

Basta una finezza del Fideo per spostare il possesso dalla trequarti al cuore dell’area di rigore. Icardi in scivolata cerca di rimetterla dentro l’area ma non trova nessun compagno. L’ex capitano dell’Inter non trova l’assist e a Di Maria non verrà riconosciuto nulla se non un +1 sulla casella dei passaggi filtranti.

La giocata può essere però correttamente valutata grazie ai modelli di expected threat.

Nella zona di campo da cui parte il passaggio di Di Maria il valore del possesso parigino è ancora basso, a quell’altezza la probabilità che l’azione si concluda con un gol è di poco superiore all’1%.

Con la palla appena oltre il centro del campo, il PSG ha una probabilità dell'1.1% di concludere l’azione con un gol

La zona in cui riceve palla Icardi è invece sicuramente più vantaggiosa. A pochi passi dal portiere avversario — seppur al lato dell’area piccola — il possesso vale di più. A questo punto il Paris ha una probabilità di andare a segno pari al 7.3%

Il filtrante di Di Maria mette Icardi davanti alla porta, in una zona sì defilata ma sicuramente più vantaggiosa rispetto al punto di partenza. Con il PSG in possesso in questa zona del campo i francesi hanno ora il 7.3% di probabilità di concludere l’azione con un gol.

La giocata di Di Maria è così quantificabile come la differenza tra le due probabilità. Con il suo filtrante il Fideo ha aumentato del 6.2% la probabilità che il PSG concludesse l’azione con un gol (il valore xT del passaggio sarà quindi pari a 0.062).

L’xT nella Serie A 20/21

Per ora abbiamo utilizzato i modelli di expected threat nel contesto della singola giocata ma quali informazioni possiamo ricavare se aggreghiamo i valori dei singoli giocatori nell’arco di un intero campionato?

La top 20 dei giocatori con il maggior xT accumulato attraverso passaggi nella Serie A 20/21 è il risultato della somma del valore xT aggiunto dei singoli passaggi completati nel campionato italiano nella passata stagione.

Ricordate il passaggio di Di Maria? Quello con un valore xT pari a 0.062? Il totale del valore xT di Di Maria nella scorsa Ligue 1 sarà la somma dei valori xT di tutti i passaggi completati dall’argentino che hanno spostato il pallone in una zona più pericolosa del campo.

Nella Serie A 20/21, la classifica dei giocatori a più alto xT aggiunto attraverso passaggi vede Dimarco e De Paul davanti a tutti.

Il 9.64 di Dimarco è dato dalla somma del valore xT incrementale dei singoli passaggi effettauti dal terzino ex-Verona nello scorso campionato.

Entrambi hanno assunto ruoli da protagonisti nelle fasi di impostazione, sviluppo e rifinitura di Verona e Udinese ma se per De Paul il valore è equamente distribuito tra cross ed altri passaggi, per Dimarco l’alto xT ha nel crossing game una fonte principale (il 66% del totale xT del terzino oggi all’Inter nasce infatti da cross).

L’importanza dei cross per Dimarco è tale da escluderlo dalla top 20 quando riduciamo il campione al valore xT accumulato attraverso passaggi diversi dai cross stessi. Una top 20 comandata da Luis Alberto, a conferma dell’importanza dello spagnolo nell’aumentare la pericolosità della manovra della Lazio anche in una stagione in cui ha effettuato il passaggio decisivo per il gol in soltanto 2 occasioni (ma in cui la sua importanza in rifinitura è comunque testimoniata dagli 8.2 xG assistiti).

La stessa classifica evidenzia anche l’importanza di Hakimi nell’aggiungere valore alle combinazioni della catena di destra dell’Inter, sottolinea come il peso di Cuadrado sulla manovra della Juve nella scorsa stagione andasse ben oltre i traversoni dalla trequarti e quantifica la verticalità di un Manuel Locatelli su cui ancora oggi pesa la targhetta di giocatore “troppo orizzontale” (soltanto Luis Alberto e De Paul tra i centrocampisti hanno registrato un xT superiore a quello dell’ex Sassuolo).

Il passaggio è però soltanto uno degli strumenti a disposizione di squadre ed individui per manipolare la struttura difensiva avversaria, per avanzare il campo, per entrare in zone più pericolose.

Gli stessi valori xT assegnati ad ogni singola microarea del campo da gioco possono aiutarci a quantificare il valore delle corse progressive (progressioni palla al piede che avvicinano il pallone alla porta avversaria del 15% o più).

In questo caso la top 20 della Serie A 20/21 presenta alcuni dei nomi già visti nella classifica dei passaggi ma introduce anche alcuni giocatori che fanno della progressione in zone pericolose del campo una delle caratteristiche distintive.

È il caso del Tucu Correa, primo nello scorso campionato per xT accumulato attraverso progressioni per 90' ma anche di Ronaldo (terzo con un valore xT non lontano da quello di Correa), Lukaku e Lozano.

Mettendo insieme le due cose, progressioni e passaggi, possiamo ottenere il classifichino finale con i valori xT per 90' complessivi per ogni singolo giocatore.

Al comando troviamo ancora Dimarco ma in questo caso tallonato da un Insigne che, rispetto al terzino oggi all’Inter, riesce a incidere maggiormente con il pallone incollato al piede, progredendo verso la porta avversaria.

Il numero al fianco delle barre indica il totale per 90'

Come si nota dalla grafica qua sopra, la norma tende ad indicare una preponderanza del contributo xT proveniente dai passaggi. È così per i primi venti contributori della Serie A 20/21 anche se il peso delle corse progressive varia molto da interprete ad interprete.

Spinazzola, per esempio, ha avuto un ottimo contributo in termini di passaggi (nella top 10 se escludiamo i cross, nella top 30 se consideriamo tutti i passaggi) ma l’alto valore delle sue sgroppate sulla corsia di sinistra lo rende il giocatore in top 20 con la più alta percentuale di xT proveniente da corse progressive (con Lozano e Berardi alle sue spalle).

Alcune cose da considerare quando si utilizzano i modelli xT

La limitazione di base è sempre legata alla natura dei dati evento. Non prendono in considerazione la posizione di compagni e avversari ma solo quella del pallone.

In contesti avanzati come quelli dei reparti di analisi dei club più importanti al mondo è probabile che l’integrazione di dati provenienti dal player tracking permetta di costruire modelli di expected threat o modelli alternativi di valutazione della qualità del possesso più complessi e con un valore descrittivo migliore rispetto a quello utilizzato dal sottoscritto.

I dati aggregati da me utilizzati qui sopra sono il frutto dell’applicazione del modello di Karun Singh al contesto della Serie A 20/21, un modello che tende a premiare eccessivamente giocatori che completano un alto numero di cross in quanto soluzioni in fase di rifinitura che hanno di per sè un valore xT elevato in quanto nascono da zone di campo a bassa pericolosità e spostano il pallone nelle zone più calde dell’area di rigore.

La percentuale di cross che portano però al gol è tendenzialmente inferiore a quella degli altri passaggi chiave e la differente efficacia tra le due soluzioni andrebbe fatta valere anche nel modello xT.

Altre risorse per capire meglio i modelli xT

L’idea di introdurre il concetto di expected threat è nata dalla moltitudine di contenuti pubblicati negli ultimi mesi sulla materia al di fuori del contesto italiano.

Il blog di Karun Singh già sopra citato è un ottimo punto di partenza per chi volesse comprendere a fondo il modello da lui utilizzato mentre gli ottimi contenuti realizzati da “The Athletic” (Introducing ‘expected threat’ (or xT), the new metric on the block — The Athletic) o Tifo (Football’s New Stat — What is Expected Threat?) rendono l’avvicinamento al mondo dell’expected threat ancora più godibile.

I modelli che si prefiggono di assegnare un valore alle singole azioni dei giocatori o di misurare la pericolosità di un’azione a prescindere dalla sua conclusione sono sempre più comuni e, come per quelli relativi agli expected goals, andranno ad affinarsi nel tempo raggiungendo livelli di accuratezza sempre più vicini alla realtà.

Pur con i limiti evidenziati in precedenza, i modelli di expected threat si propongono come un ulteriore strumento per quantificare il peso di ciò che succede sul campo da gioco. Nell’attesa che Fbref aggiunga alla sua banca dati Statsbomb anche quelli relativi all’expected threat, i valori xT utilizzati dal sottoscritto per questo articolo verranno aggiornati e riproposti in grafici ed analisi nel corso della stagione.

Eriksen nell’Inter di Conte
Era lecito aspettarsi qualcosa in più dal danese?