Très souvent, l’utilisation des statistiques dans le football se concentre sur les tirs (et les buts qui en découlent), ce qui est logique quand on veut analyser le résultat d’un match qui est énormément influencé par ces facteurs. De nombreux articles ont été écrit et il existe maintenant de nouvelles statistiques, comme les Expected Goals, qui permettent d’approfondir le sujet.
A côté de ça, beaucoup moins de choses ont été écrites sur les passes (le travail récent de @SaturdayOnCouch est d’ailleurs à lire) et peu de statistiques liées à celles-ci sont utilisées régulièrement en dehors des passes clés. Je me lance donc dans une série d’articles sur de nouvelles statistiques dérivées des passes.
Ce dont je voulais parler en premier est une statistique dont le but est de contextualiser le pourcentage de passes réussies, avec un concept proche des Expected Goals. De la même manière qu’il est assez intuitif de se dire que tous les tirs ne sont pas égaux, il est logique que toutes les passes n’aient pas la même probabilité d’arriver à leur destinataire. Une longue transversale ou une passe à l’intérieur de la surface ont moins de chance de réussir qu’une passe courte dans son tiers défensif.
En découpant le terrain en zones et prenant en compte l’origine et la destination de la passe, on peut donc assigner à chaque passe tentée une valeur qui, comme pour les Expected Goals, se situe entre 0 et 1. Une passe avec 0.72 “Expected Passes” correspond donc à un pourcentage de 72% de réussite pour un joueur moyen.
Un des intérêts principaux est d’utiliser cette statistique et de la comparer avec le pourcentage de passes réussies réel pour repérer les équipes/joueurs qui sont au-dessus, ou en-dessous, de la valeur estimée. Pour ça, j’utilise le ratio Passes réussies / Expected Passes * 100
. La valeur moyenne est donc de 100.
Voilà le top 20 des joueurs pour la saison dernière (minimum 100 passes réussies) :
La première remarque c’est la présence de nombreux joueurs de Paris (9) et Marseille (4), qui pose la question de la pertinence d’ajuster la statistique par rapport à l’équipe. Ce qui revient à se demander si c’est le joueur qui a de bonnes statistiques grâce au style de l’équipe ou si c’est l’équipe en additionnant les bons joueurs. Probablement un peu des deux, surtout dans le cas de Paris, mais le fait que les bonnes équipes aient aussi des joueurs en-dessous de la moyenne et la bonne répétabilité de la statistique d’une année à l’autre m’a décidé à ne pas l’ajuster. Surtout après quelques tentatives peu convaincantes.
La seconde observation c’est qu’on retrouve principalement dans ce classement des milieux relayeurs, des latéraux ou des défenseurs centraux. Pour les joueurs offensifs, le ratio est souvent plus bas, et c’est encore plus le cas pour les attaquants. Ce phénomène peut s’expliquer par le fait que ces joueurs offensifs touchent, en général, moins de ballons et dans des zones où la pression défensive est plus forte et où il est plus difficile de sortir du lot. Certains y arrivent cependant comme Maurice-Belay, Jouffre, L. Moura, Boufal ou B. Silva.
Le graphique précédent zoome sur les joueurs les plus performants mais il est aussi intéressant de regarder ce que ça donne au niveau des équipes :
Peu de grosses surprises ici, il est intriguant de voir que St Etienne ne se retrouve que 9ème de ce classement, derrière des équipes comme Rennes ou Lorient, mais ça semble confirmer leur besoin de joueurs plus techniques. On peut aussi remarquer que c’est Bordeaux qui se retrouve 4ème grâce, notamment, au recrutement récent de Chantôme ou au prêt d’Ilori.
Continuons à regarder équipe par équipe, en s’attardant sur la valeur médiane, le pourcentage de joueurs au-dessus de la moyenne et l’écart en les valeurs minimum et maximum, toujours parmi ceux ayant réussis plus de 100 passes, pour évaluer plus en profondeur chaque effectif.
Equipe | Joueurs | Median | 100+% | Ecart |
---|---|---|---|---|
Bastia | 19 | 95,2 | 10,5 | 14,27 |
Bordeaux | 22 | 103,98 | 68,2 | 16,47 |
Caen | 21 | 93,82 | 0,0 | 24,74 |
Evian Thonon Gaillard | 23 | 94,59 | 13,0 | 18,03 |
Guingamp | 19 | 95,3 | 10,5 | 22,34 |
Lens | 18 | 95,98 | 16,7 | 18,27 |
Lille | 22 | 101,91 | 54,5 | 21,87 |
Lorient | 25 | 100,57 | 56,0 | 21,28 |
Lyon | 19 | 103,01 | 84,2 | 15,74 |
Marseille | 16 | 104,4 | 68,8 | 16,90 |
Metz | 19 | 94,43 | 15,8 | 16,46 |
Monaco | 19 | 102,24 | 68,4 | 14,13 |
Montpellier | 15 | 98,98 | 40,0 | 17,96 |
Nantes | 18 | 98,76 | 27,8 | 19,88 |
Nice | 18 | 98,74 | 33,3 | 16,45 |
Paris Saint-Germain | 20 | 106,72 | 85,0 | 10,95 |
Reims | 20 | 97,93 | 35,0 | 18,75 |
Rennes | 18 | 100,2 | 50,0 | 21,35 |
St Etienne | 20 | 100,15 | 45,0 | 23,02 |
Toulouse | 22 | 98,05 | 22,7 | 18,68 |
Pas de bouleversements dans la hiérarchie mais quelques observations : Caen ne possède aucun joueur avec un ratio au-dessus de 100 et à un grand écart dans son effectif, à l’inverse de Paris qui a un effectif très homogène. Quand on s’intéresse au pourcentage de joueurs avec un ratio supérieur à la moyenne, on voit que Paris et Lyon sont largement au-dessus du reste du championnat, ces derniers n’ont que Mvuemba dans le top20 mais la majorité de leurs joueurs sont bien placés.
Pour finir sur cette statistique, j’ai regardé si les valeurs de chaque joueur étaient constantes d’une année à l’autre et le résultat est satisfaisant de ce point de vue avec un coefficient de détermination de 0.71, ce qui signifie grossièrement que les valeurs relevées lors de la saison 2013/2014 expliquent 71% des valeurs trouvées en 2014/2015.
Le but est évidemment de continuer à améliorer cette statistique, notamment en rajoutant des informations supplémentaires pour chaque passe si possible, mais les résultats qu’elle renvoie me semblent déjà intéressants à analyser. Quand on regarde la liste des joueurs ayant une valeur élevée, quelques noms seront intéressants à suivre. Tout en gardant en mémoire que ce qui est mesuré ici s’apparente plus à de la justesse technique et ne cherche pas à attribuer une valeur aux passes d’un joueur. Je garde ça pour une autre fois.
C’est vraiment cool. J’ai une question ceci-dit: comment cela se fait qu’il y ait principalement des milieux relayeurs ou des defenseurs dans les ‘meilleurs’ passeurs. La position sur le terrain, ou la construction de l’expected passe selon origine et destination, ne devrait pas controller pour ca?
L’utilisation des Expected Passes permet de prendre en compte la position sur le terrain oui mais j’ai l’impression que les milieux et défenseurs qui touchent beaucoup de ballons et réalisent la majorité de leurs passes dans des zones plus faciles sont légèrement avantagés par ça. Ils ont plus souvent l’occasion de faire mieux que leurs Expected Passes que les attaquants. C’est un des points que j’aimerais améliorer.
C’est interessant. Je me demande si cela vient pas du fait qu’un defenseur ou milieu peut optimiser en choisissant la passe qui est interessante en termes de progression (good expected passe theorique) mais qui est facile a realiser dans un contexte specifique (notamment en fonction du placement des adversaires). Un defenseur a generalement 3-4 options de passes (lateraux, autre DC, milieux), alors qu’un attaquant a beaucoup moins de choix dans des zones avancees, et du coup ne peux pas optimiser. J’imagine que ce type de correction est impossible a implementer.
Bon boulot en tout cas, meme si je t’avoue que voir dja-djedje au top est curieux 🙂
Oui, je pense aussi que c’est une des raisons et, effectivement, impossible de prendre en compte ce paramètre pour l’instant. Dja Djédjé m’étonne aussi mais c’est aussi ça l’intérêt des stats, faire ressortir ce qui n’est pas évident à l’oeil.
Je me permets de revenir vers toi apres tant de temps. J’ai un peu de temps devant moi (these enfin soutenu 🙂 ) et aimerais regarder ces histoires de stats.
Tu as une source particuliere pour tes donnees ? notamment celles sur la localisation des passes qui ont l’air assez difficile a recuperer.
Merci d’avance
Bravo pour la thèse !
Pour les passes, la référence c’est évidemment StatsZone : http://www.fourfourtwo.com/statszone/results/24-2015.