Grouper les équipes par style

Charly Triballeau / AFP / Getty Images
Charly Triballeau / AFP / Getty Images

Pour ce premier article post-championnat, on va changer un peu les habitudes et aborder un article trouvé sur le blog d’OptaPro. Cet article s’attache à identifier certaines statistiques caractéristiques du style de jeu d’une équipe afin de regrouper celles qui se ressemblent le plus entre elles.

J’ai traduit l’explication de la méthode et on analysera ensuite les particularités des clubs de Ligue 1. Pour lire l’article original (en anglais), c’est par ici. Et pour suivre l’auteur sur Twitter.

 

Concept

L’idée de l’article original est que, à l’intérieur de l’analyse statistique dans le football, identifier que votre adversaire se procure des occasions de grande qualité, grâce aux Expected Goals par exemple, est aussi important que de comprendre comment il les crée. Les statistiques descriptives qui essayent d’identifier le « comment » dans cet exemple peuvent apporter une connaissance tactique additionnelle et être utilisées pour influencer un match.

Savoir, par exemple, que notre prochain adversaire obtient ses meilleures opportunités à l’aide de centres en retrait permet de mieux se préparer que de juste savoir le nombre d’occasions qu’il a l’habitude de se créer. Cette même approche pourrait être plus tard appliquée aux entraîneurs pour mieux comprendre un style de jeu en particulier mais pourrait aussi apporter une connaissance approfondie de la façon dont un joueur convoité pourrait s’adapter à un nouvel environnement.

Un des exemples de travail dans ce domaine qui a inspiré cet article est l’analyse de Dustin Ward chez StatsBomb autour des similarités entre les équipes. Pour résumer, Ward a imaginé une série de statistiques qui lui semblait caractériser le style de jeu d’une équipe et a utilisé une méthode pour grouper ensemble les clubs avec des caractéristiques similaires.

Cet article part donc de ces recherches en regardant comment, cette saison, les équipes à travers l’Europe étaient liées d’un point de vue offensif, en introduisant quelques nouveautés avec l’avantage d’un accès complet aux donnés d’Opta. L’auteur s’est concentré sur l‘attaque et a utilisé des statistiques permettant de couvrir une variété d’aspects du jeu mais a aussi vérifié que chaque statistique soit relativement constante d’une saison à l’autre.

 

Définitions

Voilà les statistiques qui ont été choisi :

Possession – La part du total des passes du match, selon la définition d’Opta.

Passes dans le tiers offensif – La part du total de passes dans le derniers tiers. Il y a une forte corrélation avec la possession mais, ayant son intérêt pour séparer les groupes, ça a été inclut.

Tirs / Possession – Comme son nom l’indique. Il y a un décalage entre les tirs et la possession (qui est elle exprimée en pourcentage) mais ça colle avec ce que l’auteur essayait de mesurer, c’est à dire l’utilisation de la possession ou la tendance à privilégier le jeu direct.

Importance des centres – Le nombre de centres vers la surface divisé par le nombre de passes vers la surface.

Attaques vers la surface – Total des centres et des passes vers la surface.

Impatience dans le tiers offensif – Le nombre d’attaques vers la surface divisé par le total de passes commençant et terminant dans le dernier tiers. Le but de cette statistique est de mesurer la patience, ou le manque de patience, pour transformer sa possession offensive en occasions dangereuses.

Largeur des attaques – Pour chaque passe dans le tiers offensif, on mesure la distance absolue depuis le centre du terrain et on prend la valeur médiane pour chaque équipe.

Largeur de la relance – Comme au-dessus mais avec les passes qui se terminent dans les deux premiers tiers du terrain.

Longueur de la relance – Longueur médiane des passes qui partent des deux premiers tiers du terrain.

Entrées dans le tiers offensif – Total des actions où l’équipe atteint le tiers défensif adverse.

 

Observations

Je vais m’intéresser ici principalement aux équipes de Ligue 1, je vous encourage donc à aller lire l’article original pour un zoom sur des équipes comme Leicester, Ingolstadt, Naples ou Tottenham.

Pour chaque statistique, c’est le z-score (expression de l’écart par rapport à la moyenne, en déviation standard) qui est utilisé. Cette standardisation permet de comparer différentes statistiques qui n’utilisent pas la même unité. Une valeur de zéro correspond à la moyenne et 3.0 (ou -3.0) aux extrêmes.

  • Possession & Passes dans le tiers offensif

Le Paris Saint-Germain est évidemment l’équipe avec le plus de possession en Ligue 1, et assez largement : seul le Bayern Munich (z-score de 3,35) fait mieux. Suivent ensuite Lyon et la surprise Nice. En bas de classement, des équipes comme Angers ou Caen montrent que laisser le ballon à l’adversaire n’empêche pas d’obtenir des résultats. L’extrême se trouve encore en Allemagne avec Darmstadt (-2,62).

Cluster_Poss

Comme expliqué dans les définitions, possession et passes dans le tiers offensif sont souvent liées mais il y a certains clubs qui échappent à cette règle (la troisième colonne correspond ici à la différence entre passes dans le tiers offensif et possession).

Les exemples de Paris et Nice sautent aux yeux : deux équipes qui savent conserver le ballon mais ont plus de mal quand il s’agit de le porter dans des zones dangereuses tout en défendant leur tiers défensif. Ça n’empêche pas Paris de rester la deuxième meilleure équipe du championnat mais Nice passe en-dessous de la moyenne.

A l’inverse, la réussite de Caen s’explique beaucoup mieux selon ce critère et correspond bien à leur style direct et hyper pénétrant. Lille fait aussi partie des équipes qui s’en sortent beaucoup mieux en ce concentrant sur le tiers offensif.

A l’échelle des cinq grands championnats, peu d’équipes font mieux que Lyon et la liste est prestigieuse : Bayern Munich (3,70), Barcelone (2,52) et Naples (2,20). Chez les mauvais élèves, on a Frosinone (-1,77), Sunderland (-1,51) et Carpi (-1,48) avant Angers.

  • Tirs / Possession

Cluster_Direct

C’est assez logique de retrouver ici aussi Caen qui se classe cinquième en termes de tirs avec la possession la plus faible du championnat. Nice est aussi de la partie avec le deuxième plus faible nombre de tirs (seul Bastia fait pire) malgré une bonne possession.

On observe moins de valeurs extrêmes ici même si Bastia et Montpellier se démarquent. On remarque la volonté de Paris de privilégier la conservation du ballon, peut-être pour trouver la meilleur position de frappe avant de tenter sa chance.

Tout championnat confondu, le Real Madrid (3,43), Naples (2,25) et Tottenham (2,17) sont des excités de la gâchette et arrivent à avoir un ratio très largement au-dessus de la moyenne alors qu’ils font déjà tous partie des équipes avec le plus de possession dans leur championnat respectif.

Il n’y a que le Hertha Berlin (-2,00) pour faire moins bien que Nice et Montpellier dans ce domaine. Autre exemple intéressant, Manchester United (-1,57) qui s’intercale entre Montpellier et Bastia et dont la prise de risque offensive a été minimale depuis la prise de fonction de Louis van Gaal.

  • Attaques vers la surface & Impatience dans le tiers offensif

Quand on regarde le total des centres et passes vers la surface, un nom assez surprenant apparaît tout en haut de la liste avec Marseille, pas forcément auteur d’une saison réussie. C’est déjà moins étonnant quand on apprend que c’est l’équipe qui  a le plus centré en Ligue 1, cette saison.

Cluster_Attacks-minOn retrouve ensuite l’inévitable Paris Saint-Germain et encore Caen avant la paire Lyon/Monaco. Tout en bas, Bastia et Angers ont encore une fois été assez peu actifs.

Les meilleurs dans ce domaine sont le Real Madrid (2,53) et Arsenal (2,47) alors que la Bundesliga place huit clubs parmi les dix équipes avec le moins d’attaques dans la surface.

Une statistique qui prend tout son intérêt quand on la compare à l’impatience de ces équipes, c’est à dire le nombre d’attaques divisé par le total de passes commençant et terminant dans le dernier tiers.

Caen fait donc le choix de pratiquement systématiquement tenter de rentrer dans la surface plutôt que d’attendre une ouverture alors que c’est tout l’inverse pour Lyon qui sait se montrer extrêmement patient, une caractéristique apparemment rare en Ligue 1.

Seul le Torino fait encore plus fort que Caen avec un z-score de 3,29 et le Rayo Vallecano (2,37) n’est pas loin. Le plus « patient » n’est pas un nom connu puisqu’il s’agit de Ingolstadt (-1,87) suivi de près par le Borussia Mönchengladbach (-1,80).

  • Largeur des attaques & Importance des centres

Là-aussi, on a deux statistiques qui semblent avoir un lien évident entre elles mais ce n’est pas toujours aussi clair.

Cluster_Cross-redim

La relation est assez classique pour Marseille qui adopte énormément de largeur dans ses attaques et utilise effectivement beaucoup de centres pour atteindre la surface mais ce n’est pas autant le cas pour Troyes ou Lorient.

Le Gazélec et Nice sont aussi deux cas intéressants qui jouent assez central mais profitent des centres : deux 4-4-2 losange qui construisent dans l’axe avant de décaler les latéraux dans les espaces créés ?

Paris et Lyon sont quant à eux encore une fois assez proche et partagent des attaques centrales (surtout Paris) et une aversion pour les centres (surtout Lyon).

Un recours aux centres qu’il n’est pas idiot de limiter étant donné le peu d’efficacité de ceux-ci, en général.

Dans les cinq grands championnats, quatre équipes de Liga occupent le haut du tableau en termes de largeur des attaques : la Real Sociedad (2,41), le Rayo Vallecano (2,31), Getafe (2,14) et le Sporting Gijón (1,83). Derrière Paris, Empoli (-2,24), Hoffenheim (-2,04) et Cologne (-2,03) attaquent très centralement.

Sur l’importance des centres, le Rayo Vallecano est encore là (1,07) alors que Barcelone explose tout les records à l’inverse (-4,11) suivi de beaucoup de clubs allemands.

  • Largeur & Longueur de la relance

Si on s’intéresse maintenant à la relance, on voit apparaître certaines spécificités parmi les clubs de Ligue 1.

Cluster_Relance-redimDe ce point de vue, Nice et Paris sont extrêmement proches : ça joue court et ça passe beaucoup par le centre du terrain avec un milieu défensif qui vient chercher le ballon bas avec l’aide des relayeurs alors que les latéraux se placent assez hauts.

Du côté de Troyes et Lorient, on préfère utiliser les ailes : en allongeant pour Troyes et plus court pour Lorient. Enfin, le Gazélec est adepte des grands ballons vers l’avant.

Ça joue aussi très large en Italie avec le Genoa (2,49) et l’Atalanta (2,16) en haut de classement alors que le Bayern Munich (-1,99) et Empoli (-1,85) se trouvent juste derrière Paris dans la préférence pour l’axe. C’est aussi le Paris Saint-Germain qui relance le plus court et Empoli (-1,95) est encore là juste derrière.

Pour le Torino (2,51) et Ingolstadt (2,14), le but semble être d’allonger au maximum. Peut-être pour aller chercher Immobile et Hinterseer, respectivement.

 

Conclusion

J’aime bien cette article car il permet de se pencher sur des aspects qui sont assez peu étudiés, notamment la « patience » des équipes aux abords de la surface ou la largeur préférentielle au niveau de la relance.

Pour la Ligue 1, il y a une poignée de clubs avec une identité forte et que l’on retrouve souvent dans les extrêmes : Paris, Nice et Lyon dans une volonté de conserver le ballon et de repartir de derrière et Caen dans un style totalement différent et qui détonne même au niveau européen.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *