Statistix, Episode 03 : Big Chances

Crédits : Jeff PACHOUD / AFP

Ça faisait longtemps que je voulais écrire une série d’articles visant à rendre plus accessible certains termes fréquemment utilisés dans les articles mêlant statistiques et football et qui ne sont pas systématiquement expliqués ou francisés. L’objectif est de créer une porte d’entrée pour les personnes souhaitant s’intéresser à ce vaste sujet.

En parallèle, ça va me permettre de lier chaque terme obscur à sa définition dans mes futurs articles et donc de rendre leur lecture plus facile pour les nouveaux venus. Mais également moins lourde pour les habitués qui n’auront pas à lire la description de termes qu’ils connaissent déjà.

Pour ce troisième épisode, on enchaîne sur le second sujet à avoir reçu le plus de votes lorsque je vous ai posé la question : les « Big Chances » ou occasions nettes.

 

Définition

Là on arrive sur un terme statistique qui est spécifique à un fournisseur de données, Opta. On va donc commencer par regarder ce que nous dit la définition officielle :

« Une situation où l’on peut raisonnablement s’attendre à ce que le joueur marque, généralement une action de face à face avec le gardien ou très proche du but lorsque le chemin vers la cage est dégagé et qu’il y a assez peu de pression sur le tireur. Les penaltys sont toujours considérés comme des “big chances“. »

On retombe sur ce que l’on appelle naturellement une occasion nette dans le vocabulaire du football. Celle qui est « plus dure à louper qu’à réussir » selon l’expression consacrée.

 

Usage

L’avantage principal est de pouvoir ajouter une couche d’informations qui n’est pas capté de base par les statistiques : le nombre de joueurs sur la trajectoire du tir et la pression mise sur le tireur.

Ça permettrait alors d’améliorer les modèles qui visent à estimer les chances de chaque tir de finir en but, comme les Expected Goals, en rajoutant des paramètres supplémentaires.

On peut aussi faire un focus spécifique sur ces big chances afin d’observer quelles équipes/joueurs arrivent à se créer régulièrement des occasions de grande qualité mais également leur taux de réussite dans l’exercice.

Cette saison, c’est le PSG qui est largement devant sur le pourcentage de tirs qui sont des occasions nettes (sans surprise) avec 25,6% suivis de St Etienne et Lille (16,8%). Lyon ne se retrouve que 8ème sur cette mesure (12,8%), signe possible de trop nombreux tirs de faible dangerosité.

 

Inconvénients

Il y a cependant une ombre au tableau. On est ici sur une appréciation subjective, même si elle s’appuie sur des éléments objectifs, qui est laissé à l’interprétation de la personne qui va s’occuper de renseigner les données.

Même si ce n’est pas la seule statistique dans ce cas (on reparlera un jour des dribbles), c’est sans doute la notion la plus difficile à définir de manière homogène.

On a donc une définition assez floue qu’il est difficile d’appliquer de manière parfaitement régulière. L’autre problématique, qui en découle, est que l’opérateur va juger l’occasion une fois la finalité connue.

C’est-à-dire qu’il sait déjà si le joueur a marqué ou non ce qui peut influencer sa décision, même de manière involontaire. C’est une forme de ce que l’on appelle le biais rétrospectif.

 

Conclusion

Les big chances ressemblent donc à une solution imparfaite pour compenser le manque d’informations sur le nombre de joueurs sur la trajectoire du tir ou la pression mise sur le tireur. Mais qui reste utiles si on est conscient de leurs limites.

Mais ça c’était avant, les principales sources de data (Opta, StatsBomb, StrataBet) recueillant maintenant ce type de statistiques. On devrait donc continuer à voir des modèles de plus en plus élaborés et qui répondent mieux aux critiques émises, à juste titre, à leur encontre.

Mais ça sera le sujet d’un autre article, chaque chose en son temps.

 

Autres articles sur le sujet

How accurate are xG models II: the ‘Big Chance’ dilemma (en anglais)

Une réflexion sur “Statistix, Episode 03 : Big Chances

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.