OPTA Pro Forum 2017 (2) – Probabilité de réussite d’une passe

Vue d'ensemble de la présentation.
Vue d’ensemble de la présentation

En collaboration avec OMalytics, on a décidé de vous faire un tour d’horizon des différentes présentations de l’édition 2017 de l’OPTA Pro Forum, un ensemble de conférences réalisées par des analystes statistiques à l’aide de données fournies par OPTA.

Comment évaluer la probabilité de réussite d’une passe ?

Pour sa deuxième présentation à l’Opta Pro Forum, William Spearman (@the_spearman) a combiné les statistiques d’Opta et les données de tracking de TRACAB pour estimer les chances de complétion d’une passe, afin de mieux évaluer le talent de passeur.

Pour ça, il faut d’abord définir ce qui fait une bonne passe. Ici, le premier critère choisie est la précision : la vitesse et la direction de la passe doivent être bien choisis sinon elle sera interceptée. Mais il y a aussi la valeur de la passe, c’est-à-dire sa capacité à donner lieu à une bonne opportunité de marquer.

En dehors de ces aspects, le modèle s’intéresse aussi à la capacité d’un receveur à contrôler le ballon malgré la pression des joueurs adverses et à celle d’un défenseur à intercepter la passe en étant positionné au bon endroit sur le terrain.

Les données d’Opta sont utilisés pour trouver les passes et identifier la prochaine personne qui contrôle le ballon alors que celles de TRACAB servent à définir les paramètres initiaux de la passe : emplacement/vitesse de la balle et du joueur.

Le modèle a besoin de calculer le temps que va mettre un joueur pour intercepter le ballon. C’est généralement la personne la plus proche qui va y arriver en premier mais ça dépend aussi de la vitesse des joueurs concernés, de leur volonté à produire l’effort ou de leur vitesse de réaction.

Exemple des probabilités d'intercepter le ballon.

Le deuxième élément est le temps nécessaire pour contrôler le ballon. Ça se complique lorsque la balle est en mouvement puisque le joueur le plus proche possède la première opportunité de contrôler le ballon mais un joueur plus éloigné au départ à l’avantage de voir le ballon ralentir au moment d’arriver vers lui.

Chaque dixième de seconde, le modèle assigne un pourcentage de probabilité à chaque joueur d’intercepter le ballon dans ce délai. Ce sont des concepts physiques réels qui sont utilisés pour avoir un résultat le plus proche de la réalité possible.

La quantification des différents critères

Valeur de la passe : Pour présenter le calcul de la valeur de la passe, William Spearman a utilisé deux exemples : une première situation avec une passe difficile à réussir mais en direction de la surface adverse alors que la seconde est une passe plus simple mais à l’intérieur de son propre tiers défensif mais vers un coéquipier qui court le risque de perdre le ballon dans une zone dangereuse.

Il faut donc prendre en compte à la fois l’apport si la passe est réussie mais aussi la pénalité si le ballon est perdu. Ce qui donne une formule qui prend la forme :

(valeur de la passe si réussie x probabilité de réussite) – (pénalité si manquée x probabilité d’échec)

Précision de la passe : Pour quantifier la précision des passes, le modèle compare un ensemble de passes hypothétiques que le joueur pourrait réaliser depuis sa position en faisant varier différents critères (angle, vitesse, etc) et la passe réellement tentée.

Passes hypothétiques et passe réelle.

Si la probabilité de réussite de la passe choisie est plus importante que la moyenne des passes hypothétiques, c’est que le joueur a choisit la meilleure option. Ici, les qualités de contrôle du coéquipier n’influe pas sur la précision de la passe ce qui est assez logique.

Efficacité à réceptionner les passes : Concernant la réception des passes, le modèle confronte la probabilité de réussite des passes vers le joueur et le nombre de ballons réellement reçus. Plus le ratio est élevé, plus le joueur est un receveur efficace.

Efficacité à intercepter les passes : Du côté défensif, le modèle fonctionne de la même façon mais en prenant la probabilité d’échec des passes et en la comparant avec le nombre réel d’interceptions.

Résultats

Les conférenciers avaient comme contrainte de garder les noms des joueurs anonymes en échange de l’opportunité d’utiliser les données de tracking. William Spearman a donc dû contourner cette limitation en présentant les résultats par poste.

En séparant les joueurs selon leur position et en regardant lesquelles font les meilleurs scores dans les différents critères listés ci-dessus, on tombe sur des observations plus ou moins logiques.

Performance par critère et par position.

Concernant la capacité à recevoir le ballon, ce sont les milieux offensifs/attaquants de soutien qui se démarquent alors que les défenseurs centraux sont ceux qui passent le plus plus vers les zones dangereuses. Plus surprenant, ce sont les attaquants qui ont la meilleure précision dans les passes.

Selon William Spearman, la capacité à intercepter le ballon et à réussir des passes pouvant amener des occasions dangereuses sont les deux caractéristiques les plus fortement corrélées avec la réussite au classement.

Parmi les questions auxquelles ce modèle permet de répondre, on a, par exemple, la possibilité de quantifier les passes risquées (<40% de chance de réussite) tentées par un joueur ou bien d’identifier les passes longues (15+ mètres) vers l’attaquant/ailier qui ont le pourcentage de réussite le plus élevé.

Des informations qui peuvent modifier l’approche d’un match contre une équipe spécifique mais aussi servir d’axe de développement pour certains joueurs ou influencer le recrutement.


Notre avis

@Birdace : Je me répéterai probablement plus tard, j’aime les recherches qui s’intéressent aux passes plutôt qu’aux tirs puisque ça permet de reculer d’un cran et d’observer comment un joueur s’est retrouvé en position de tir en premier lieu.

Ici, j’aime beaucoup l’apport des données de tracking qui dépasse le simple fait de regarder le nombre d’adversaires proches du ballon sur un tir. Ça permet de mesurer les qualités de passeur d’un joueur de manière bien plus efficace que les modèles actuels. En étudiant le pressing adverse mais aussi en isolant les qualités de contrôle de la cible que le passeur ne maîtrise pas.

Je trouve aussi bien de prendre en compte le risque lié à une perte de balle quand on s’intéresse à la valeur d’une passe même si c’est étonnant de voir les défenseurs au-dessus du lot. Surtout si c’est lié aux longs ballons vers la surface qui doivent avoir une valeur positive mais ne sont pas à privilégier pour autant.

Pour finir, c’est vraiment dommage de ne pas avoir de noms à mettre en face de ces chiffres mais c’est le prix pour avoir accès à de telles données.

@OMalytics : Une présentation qui va selon moi dans le bon sens, celui d’un modèle holistique d’évaluation des passes et qui en plus tient compte des tracking data et de la physique de la balle.

Je trouve que les quatres axes d’analyse sont assez bien choisis et permettent de capturer l’essentiel :

  • Précision de la passe
  • Qualité de contrôle
  • Interception
  • Valeur de la passe

J’ai en revanche beaucoup plus de doutes sur la façon de calculer la valeur d’une passe. Non pas que la méthode ne soit pas rigoureuse, bien au contraire. Ce qui me perturbe ici c’est le postulat de l’auteur selon lequel une passe qui a de fortes chances d’être interceptée perd de la valeur. A mon sens ça devrait quasiment être l’inverse puisque plus on se rapproche du but adverse plus il est compliqué de faire circuler le ballon vers l’avant.

Ceci a pour conséquence directe de retrouver les défenseurs centraux comme joueurs dont les passes ont le plus de valeur et ce dès le début de la présentation. Pour moi, l’essence même de la passe qui a de la valeur c’est la passe en profondeur, et elle est rarement l’œuvre de défenseurs centraux.

Cela ne remet pas fondamentalement en cause le travail présenté, mais je me mets à la place de l’analyste qui présenterait ce type de conclusions à un coach, je pense que sa crédibilité footballistique serait un peu écornée.

C’est d’ailleurs un des écueils à éviter quand on s’intéresse aux stats : tirer des conclusions fausses de raisonnements/modèles statistiquement valides car les prémisses n’ont pas de sens footballistique.

La vidéo de la conférence de William Spearman


Sur le même sujet

Physics-Based Modeling of Pass Probabilities in Soccer : le papier commun, à l’occasion de la conférence MIT Sloan, avec d’autres employés de Hudl à la base de cette présentation.
Plus loin avec les passes : le pourcentage de passes réussies : un peu de pub pour mon article qui présente un modèle visant également à évaluer la probabilité de réussir une passe, les données de tracking en moins.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *