OPTA Pro Forum 2017 (1) – Evaluer la prise de décision d’un joueur

Diagramme de Voronoï
Diagramme de Voronoï

En collaboration avec OMalytics, on a décidé de vous faire un tour d’horizon des différentes présentations de l’édition 2017 de l’OPTA Pro Forum, un ensemble de conférences réalisées par des analystes statistiques à l’aide de données fournies par OPTA.

Comment évaluer la prise de décision d’un footballeur pendant un match ?

C’est la question à laquelle Martin Eastwood (@penaltyblog) a voulu répondre en vue de l’OPTA Pro Forum 2017 où, pour la première fois, OPTA mettait à disposition des participants des “tracking data” : données détaillées qui suivent la position des 22 acteurs et du ballon.

D’un pur point de vue technique, il a utilisé un algorithme d’intelligence artificielle, qui agit comme un robot assimilant des centaines de milliers de situations footballistiques et en déduit les plus efficaces. Dans la mesure où ces techniques sont relativement complexes, il a fallu rendre les résultats accessibles au plus grand nombre via un outil suffisamment intuitif pour être utilisé dans la pratique quotidienne d’un club de foot. C’est pourquoi il a développé une application dont une démonstration vidéo est montrée plus bas.

Le délai accordé aux participants du forum étant de 6 semaines, M. Eastwood a dû concentrer son effort sur la prise de décision aux abords de la surface pour l’équipe qui attaque. Toutefois, avant d’évaluer et mesurer la prise de décision d’un joueur il faut déjà pouvoir distinguer une bonne et une mauvaise décision. Sans surprise, M. Eastwood considère qu’une bonne décision est une action qui augmente pour l’équipe la probabilité de marquer, en d’autres termes, qui maximise la valeur de l’Expected Goal.

Tirer le meilleur parti des tracking data

Le cheminement de l’auteur pour arriver au résultat le plus probant est intéressant en soi. Il a d’abord utilisé un réseau neuronal pour calculer la probabilité de marquer à partir de la position du joueur avec le ballon et des adversaires. Malgré des résultats extrêmement satisfaisants, il a préféré changer d’outil pour une plus classique régression logistique.

Contrairement aux réseaux neuronaux qui opèrent comme une boîte noire, la régression logistique permet d’expliquer pourquoi par exemple ce joueur avait 5% de chance de marquer. Il est en effet possible de décomposer cette probabilité en ces constituants (les fameux coefficients), par exemple, l’angle du tir ou la position des défenseurs.

(Pour l’anecdote, la simulation a pris plusieurs jours de calcul sur l’ordinateur individuel de l’auteur afin de pouvoir expliquer les variations de probabilités !)

Pour présenter ses résultats M. Eastwood a créé une webapp qui montre en temps réel la position de tous les joueurs et la probabilité de marquer.

Aperçu de l'application développée par Martin Eastwood
Aperçu de l’application développée par Martin Eastwood

Contrairement à ce qu’on pourrait croire de prime abord, l’illustration ci-dessus ne montre pas, pour les coéquipiers du porteur du ballon, la probabilité de marquer à chaque position mais la probabilité que la passe leur arrive PUIS qu’ils marquent de là où ils sont.

Pour tenir compte des passes en profondeur, l’auteur a ajouté en bas à gauche la probabilité totale de marquer dans cette situation, celle-ci permettant de suivre “en direct” comme elle s’adapte en fonction des mouvements des joueurs et du ballon.

Martin Eastwood a eu la chance de montrer son outil à des clubs professionnels dont les réactions ont été extrêmement positives, surtout chez les coachs de jeunes. Ces derniers ont été séduits par l’aspect pédagogique de l’outil, qui permet de montrer en temps réel l’influence de telle ou telle action (centre, dribble,…) sur les chances de marquer.

Les prochaines étapes pour l’auteur sont de regarder, à l’inverse, les aspects défensifs et sur un tout autre plan de tenter de surimposer les chiffres directement sur la vidéo. Ce qui faciliterait encore davantage l’adoption au sein des clubs.


Notre avis

@OMalytics : A ma connaissance c’est la 1ère fois qu’un modèle combine xG et position des joueurs. On peut dire avec une certaine confiance que l’auteur vient de construire ce vers quoi toute l’industrie va tendre ces prochaines années, ce qui est absolument fascinant. J’imagine que d’ici quelque temps, tous les clubs disposeront de modèles similaires et entraîneront leurs joueurs sur cette base.

Le potentiel disruptif d’un tel outil est massif dans la mesure où une fois ces données intégrées par les coaches, les oppositions tactiques prendront une toute autre tournure, avec, peut-être, le risque d’être stéréotypées ? Au-delà de la formule simpliste, il y aura probablement un avant et un après le déploiement massif de ce type d’outil et le football pourrait très bien prendre un autre visage.

Je vois aussi dans l’utilisation de l’intelligence artificielle un énorme potentiel (avec des adaptations) pour l’évaluation des joueurs et le recrutement, puisqu’on pourra mesurer la qualité de leurs décisions sur le terrain ce qui fait aujourd’hui défaut dans l’évaluation statistique classique. Une sorte de pont est construit entre observation traditionnelle et analyse statistique.

Quelque chose qui semble manquer en revanche c’est la prise en compte et l’évaluation de la solution individuelle, c’est-à-dire l’élimination de l’adversaire par le dribble. Elle n’est pas évoquée par l’auteur donc je ne sais pas s’il l’intègre mais on pourrait imaginer voir la probabilité de réussite du dribble et l’impact sur les chances de marquer affichés quelque part.

Autre remarque, bien que ce soit adressé dans l’article je ne suis pas sûr de comprendre comment il tient compte des passes en profondeur ou passes dans le dos. On sait que celles-ci sont souvent fatales bien que dures à exécuter et je ne vois pas comment le modèle les intègre dans la mesure où elles supposent un futur déplacement du coéquipier et une passe dans l’espace.

Enfin, on peut se demander combien de temps mettront ces technologies pour arriver au sein des clubs pros et de leur équipe première. Il faudra probablement attendre une nouvelle génération d’entraîneurs, qui sont davantage familiers avec les outils modernes pour en voir les effets sur le terrain.

@Birdace : L’ajout des données de position des joueurs est évidemment une avancée considérable dans l’utilisation de statistiques dans le football mais il faut bien préciser qu’elles sont ici utilisées de manière très spécifique, c’est-à-dire qu’on part du principe qu’une bonne décision est celle qui augmente les chances de marquer.

Ce n’est pas un problème en soi mais ça ne concerne que les situations où l’équipe court après le score et qu’elle est en possession du ballon près de la surface adverse. On est encore très loin de pouvoir quantifier la qualité des décisions d’un joueur de manière globale, ce qui n’était d’ailleurs pas le but ici.

On peut aussi estimer que même si une passe est réalisée à destination d’un joueur en meilleur position, elle peut être contre-productive si le joueur se retrouve isolé. Une limitation qui vient du fait que le système ne prend pas en compte la suite de l’action dans ses calculs. Alors qu’il est régulièrement utile de s’écarter du but pour mieux y revenir.

Ça n’enlève rien à la qualité de cette présentation mais c’est juste un rappel que la route est encore très longue avant de vraiment utiliser ces nouvelles données au maximum de leurs capacités.

Entre autres aspects positifs, l’utilisation des diagrammes de Voronoï pour évaluer la pression autour d’un joueur est une très bonne idée et le total des chances de marquer (en bas, à gauche) est intéressant pour montrer qu’un joueur en possession du ballon qui garde la balle plus longtemps peut permettre à ses coéquipiers d’atteindre des positions plus dangereuses.

Pour finir sur l’intérêt des “tracking data”, en plus d’apporter des précisions importantes, elles permettent de donner un côté très visuel et donc une compréhension plus rapide de leur apport.

Le poster de présentation de Martin Eastwood


Sur le même sujet

Football and Voronoi Diagrams : explication interactive des diagrammes de Voronoï.
Le blog de Martin Eastwood : moins actif récemment mais il reste le seul à mélanger football et des méthodes comme les machines à vecteurs de support.

4 réflexions sur “OPTA Pro Forum 2017 (1) – Evaluer la prise de décision d’un joueur

  1. Bonjour,
    merci pour l’article, c’est assez intéressant.
    Je vois que vous parlez d’intelligence artificielle, je me suis posé une question, un peu HS.

    Est-ce que le modèle d’Expected Goals (et les stats prédictives du foot en général) pont de l’influence sur les jeux-vidéos (FIFA, PES) et vice versa?

    1. À ma connaissance, pas de passerelle entre jeux vidéos et IA utilisée dans les statistiques. La notion d’expected goals n’est pas non plus utilisée dans un jeu comme Football Manager qui fait pourtant la part belle aux chiffres. Peut-être dans un futur proche ?

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.