Discipline et prise de décision au bâton en MLB
Honus accueille un vrai article technique sur la discipline au bâton, c’est rare et c’est en plus en français ! On remercie Julien Demeaux pour l’écriture, fort de son expérience de coach en Middle School à San Diego et directeur sportif de Leguevin, et qui nous fait réfléchir sur notre approche au bâton. Et oui, il faut réfléchir pour être utile à l’équipe ! L’article était rédigé en anglais, "Swing area compactness and positive aggressiveness", en français cela donnera "Tentative d’évaluation de la discipline et de la qualité de la prise de décision des joueurs à la batte en baseball". Bonne lecture !
1. Introduction
Les statistiques offensives classiques en baseball telles que la moyenne offensive sont mensongères et décrivent uniquement ce qu’il s’est passé sans considérer les qualités des joueurs et leur prise de décision. Ainsi les éducateurs tendent à mettre en avant les At Bats de Qualité (Quality At Bats ou QAB) pour donner à leurs joueurs les clés d’une approche efficace.
Si la définition exacte de ce que sont les QAB varie d’un éducateur à un autre, d’un programme à un autre, les traits généraux se basent sur les mêmes grand principes.
Qu’est-ce qu’une approche efficace ? “Aies un plan”, “Attaque ton pitch dans ta zone préférentielle”, “Attaque l’intérieur de la balle”, “Chasse les balles rapides extérieures jusqu’à avoir 2 prises au compte” sont des approches fréquentes enseignées aux jeunes joueurs.
L’approche doit cependant évoluer selon la situation et le compte mais les grandes lignes sont celles-ci. Par conséquent, la situation dans laquelle il n’y a pas de coureur sur base et moins de deux prises au compte est la situation idéale pour développer sa propre stratégie.
Les meilleurs joueurs comprennent et maîtrisent ce processus de décision ce qui les amène à devenir des frappeurs réguliers aux niveaux professionnels.
Grâce aux données collectées par Statcast au cours de la saison 2019 de MLB, je vais examiner dans cet article l’approche des joueurs et leur discipline au bâton en proposant des évaluation chiffrées.
Pour ce faire je vais définir deux métriques que j’appelerai Swing Zone Compactness et Positive Aggresiveness.
2. Comment évaluer la discipline à la batte ?
Depuis 2006 de nombreux articles traitent de l’évaluation de la discipline à la batte. David Appelman de Fangraphs s’est intéressé au taux de swing dans et hors de la zone de prise (1). Dr. Carleton (@pizzacutter4) a proposé de nouveaux métriques basés sur la théorie de la détection du signal (2). Un autre modèle mesurant la capacité de laisser passer les balles et de s’élancer sur les strikes a été proposé par Neil Paine avec FiveThirtyEight.com créant ainsi le “Good Decision ratio” (3).
Même si ces approches sont intéressantes elles contiennent toute des biais qui rendent les conclusions hasardeuses.
D’une part elles se basent sur le résultat des actions et non pas sur la volonté d’action, ce que maîtrise le joueur. Ainsi l’analyse repose autant sur la capacité des joueurs à faire contact avec la balle lorsqu’ils s’élancent que sur leur prise de décision. Or, évaluer la discipline ne devrait pas être dépendant de la capacité à faire contact, ce sont deux aptitudes différentes.
Il est toutefois important de noter que les choix faits par les auteurs sont tout à fait en ligne avec la précision des données disponibles à l’époque. Il ne s’agit pas ici de dénigrer leur travail mais de proposer un nouveau point de vue en s’appuyant sur la qualité des données actuelles.
Par ailleurs, les approches évoquées ci-dessus considèrent l’ensemble des lancers vus par les joueurs au cours d’une saison, quelle que soit la situation. Une prise peut être laissée passer à la demande de l’instructeur de troisième base. Bien que signe de discipline au yeux de l’encadrement, cette prise laissée passer serait négative dans les modèles présentés.
C’est pourquoi l’ensemble de l’étude ci-après se base sur la situation la plus simple en baseball : personne sur base et moins de deux retraits. Ainsi les joueurs étudiés n’ont à prendre en compte que leur propre stratégie et sont censés être en contrôle de leur prise de décision pour s’élancer ou pas.
La première question à laquelle on cherche à répondre dans cette situation serait donc de savoir si les joueurs s’élancent plus souvent sur des balles rapides (fastballs ou FBs) ou des balles à changement de vitesse (Off Speed Pitches).
Pour cet article, les balles rapides sont composées des quatre coutures, deux coutures, cutters, split-fingered et sinkers. Tous les autres types de lancer tombent dans la catégorie changement de vitesse.
Fig.1 – Distribution des types of lancers sur lesquels les joueurs s’élancent dans la situation définie. Données: Statcast
La saison régulière de MLB a compté pour un peu plus de 730 mille lancers. Sur ce total, 296 117 lancers ont été éxécutés sans personne sur base et moins de deux prises au compte et un batteur s’est élancé sur 118 988 d’entre eux.
Comme le montre la distribution de ces élans, 44% ont été réalisés sur des lancers à changement de vitesse.
Dans un premier temps j’ai considéré me concentrer uniquement sur les balles rapides pour cette étude mais la distribution étant plus équitable que ce que je pensais naïvement, je l’étude se base donc sur l’ensemble des 296 117 lancers.
Maintenant que les deux types de lancers sont définis et conservés, la question suivante est de savoir quelle est la taille de la zone dans laquelle les joueurs s’élancent.
L’hypothèse principale ici est de considérer que plus la taille d’élan est compacte, plus elle est synonyme de discipline et d’un processus de décision maîtrisé par le joueur.
En effet, le processus de décision repose sur des étapes identifiées :
-
Reconnaître le type de lancer,
-
Évaluer la trajectoire et la vitesse du lancer,
-
Décider de s’élancer ou pas.
Ainsi une zone d’élan compacte doit être un indicateur cohérent de la capacité des joueurs à maîtriser ces trois étapes.
Pour commencer, il faut donc définir la localisation moyenne d’élan de chacun des joueurs. Ce point sera considéré comme le point référence pour la suite de l’étude.
Chaque joueur aura un point référence face à chacun des deux types de lancers (FBs et Off Speeds) et les joueurs ambidextres seront aussi considérés de manière distinctes selon qu’ils se placent d’un côté ou de l’autre de la plaque. Ainsi un même joueur pourra apparaître quatre fois dans l’étude.
Fig.2 – Tous les lancers reçus par Joey Votto en 2019 dans la situation étudiée. Les points rouges montrent les élans, les points gris montrent les lancers regardés et la croix noire montre le point de référence des élans.Données: Statcast
Fig.3 – Tous les lancers reçus par Robinson Cano en 2019 dans la situation étudiée. Les points rouges montrent les élans, les points gris montrent les lancers regardés et la croix noire montre le point de référence des élans.Données: Statcast
Les figures 2 and 3 montrent les lancers reçus par Joey Votto et Robinson Cano dans la situation étudiée en 2019. Les points rouges montrent les lancers sur lesquels les joueurs se sont élancés. Les points gris montrent les lancers que les joueurs ont regardé. La croix noires est le point de référence.
Un premier indice visuel laisse à penser que Joey Votto est plus discipliné que Robinson Cano car ses zones d’élan sont moins éparses. Quantifier cette impression visuelle est l’objet de cette première partie d’étude.
A partir de là l’idée est de mesurer la distance de tous les lancers avec le point de référence et de calculer la distance moyenne à ce point de référence.
3. Swing Area Compactness
Fig.4 – La distance entre chaque lancer sur lesquels le joueur s’est élancé et le point de référence est calculée pour définir la zone d’élan. Données: Statcast
La Swing Area Compactness consiste alors à calculer la distance moyenne au point référence. Plus le chiffre est petit, plus la zone de swing est compacte et par conséquent plus le joueur est discipliné dans sa prise de décision.
Le jeu de données utilisé ici contient un total de 973 couples [joueurs-côté de frappe]. Chacun de ces “joueurs” obtient un indice de Swing Area Compactness lorsqu’il fait face au balles rapides et un autre indice lorsqu’il fait face aux changements de vitesse. Cette approche produit par conséquent un total de 1816 triplets [joueur-côté de frappe-type de lancer] que l’on appellera joueur par la suite.
A partir de ce pool de joueurs, j’ai filtré les joueurs qui ont vu moins de 100 lancers ce qui ramène le nombre de joueurs étudiés à 893.
Voici le top 30 en terme de Swing Area Compactness.
Fig.5 – Top 30 players in Swing Area Compactness in 2019. Data: Statcast
Avec une SAC de 6,64 pouces, Greg Garcia émerge comme étant le joueur ayant la zone d’élan la plus compacte des joueurs qualifiés. Cette distance de 6,64 pouces représente environ la taille de deux balles de baseball, là où la moyenne observée est de 8,76 pouces (environ 3 balles).
Autre point à noter, Luis Arraez (Twins) est le seul à intégrer ce top 30 en faisant face à des changements de vitesse avec une SAC de 7,23 (alors que sa SAC face aux FBs est de 7,53 ce qui est aussi plutôt consistant).
Fig.6 – Tous les lancers reçus par Luis Arraez en 2019 dans la situation étudiée. Les points rouges montrent les élans, les points gris montrent les lancers regardés et la croix noire montre le point de référence des élans.Données: Statcast
Visuellement, la discipline d’Arraez est assez impressionnante avec très peu d’élans en dehors de la zone de prise.
Voici ce qui concerne les joueurs avec les plus grandes zone d’élan.
Fig.7 – Bottom 30 players in Swing Area Compactness in 2019. Data: Statcast
A l’inverse, ce sont ici les changements de vitesse qui sont plutôt représentés ce qui fait sens tant les lanceurs utilisent ce type de lancer pour duper les batteurs.
Il peut aussi être surprenant de voir des noms comme Yelich ou Arenado dans ce “Flop 30”. Cependant, considérant que la capacité de faire contact et la reconnaissance des lancers sont fondamentaux dans l’efficacité à la batte, il peut être entendu que les joueurs avec des qualités supérieures dans ces domaines puissent se permettre d’avoir une zone préférentielle plus large.
Ce qui nous amène au second point de cette analyse : à quel point les joueurs sont agressifs dans leur zone préférentielle (power zone) ?
4. Positive Aggressiveness
Tout d’abord il faut définir ce qu’est la zone préférentielle pour chaque joueur. Pour ce faire j’ai défini arbitrairement une zone représentant l’équivalent de 2 balles de rayon autour du point de référence. Cette taille me paraît être acceptable – bien qu’ambitieuse en terme de discipline comme on vient de le voir – car elle représente un tiers de la largeur de la zone. Il faudra donc éventuellement revoir cette approche dans un second temps mais voyons ce que ça donne pour le moment.
Voyons ce que représente cette zone préférentielle observée chez Votto et Cano.
Fig.8 – Zone préférentielle observée chez Joey Votto selon le type de lancer. Data: Statcast
Fig.9 – Zone préférentielle observée chez Robinson Cano selon le type de lancer. Data: Statcast
On peut se poser la question de la zone préférentielle de Cano ici car étant un joueur qui s’élance beaucoup, sa SAC est conséquente. On peut donc avoir un point référence où peu d’élans sont réalisés.
Une fois que la zone préférentielle observée est définie, l’idée est de se concentrer sur le taux d’élan dans la zone. Ce taux sera appelé Power Zone Aggressiveness (PZA%) et représente l’agressivité du joueur dans sa zone préférentielle, d’où l’idée d’agressivité contrôlée.
Pour m’assurer des résultats concluant, j’ai filtré les joueurs qui ont vu moins de 15 lancers dans leur zone préférentielle.
Fig.10 – Top 30 players in Power Zone Aggressiveness in 2019. Data: Statcast
Ainsi Tim Anderson, Shohei Ohtani, Raimel Tapia, Khris Davis and Jay Bruce proposent un PZA% à 100% selon le type de lancer.
Cette approche est cependant biaisée par le fait que les “free swingers” s’élancent beaucoup et partout, y compris dans et hors de leur zone préférentielle. Un haut chiffre de PZA% n’est peut donc être signe d’agressivité générale et pas forcément d’agressivité contrôlée.
C’est pourquoi j’ai décidé d’explorer un autre métrique qui s’appelle Positive Aggressiveness et qui compare le taux d’élan dans et en dehors de la zone préférentielle. Cet indice va de -100 à 100. Un score positif montre un taux d’élan plus important dans la zone préférentielle qu’en dehors et par conséquent est signe d’un joueur discipliné. Un score négatif représente l’inverse.
Fig.11 – Top 30 des joueurs en Positive Aggressiveness in 2019. Data: Statcast
A ce jeu c’est Joey Gallo qui remporte la palme de l’agressivité positive avec un score de 65,4%.
Fig.12 – Élans et lancers regardés par Joey Gallo dans et en dehors de sa zone préférentielle observée. Data: Statcast
Les 53,4% proposés par Josh Donaldson sur les changements de vitesse peuvent être considérés comme le signe d’une reconnaissance des lancers très affutée chez le joueur.
De l’autre côté de l’agressivité, on retrouve 19 joueurs avec un indice négatif.
Fig.13 – Bottom 30 players in Positive Aggressiveness in 2019. Data: Statcast
Seulement 2 des ces 19 joueurs a vu plus de 200 lancers dans la situation étudiée, il faut donc prendre ces résultats avec des pincettes.
Zobrist par exemple a un indice de -30,2% face au balles rapides (154 lancers) alors qu’il propose un indice de +76,4% sur les changements de vitesse (114 lancers).
La taille de l’échantillon a sûrement une incidence ici donc il faudrait pousser l’étude sur de plus grandes périodes.
5. Pour la suite
A ce point, je serai ravi d’avoir des retours sur ces deux métriques (Swing Area Compactness and Positive Aggressiveness) avant d’entrer dans la partie analyse de performance en elle-même.
Est-ce qu’ils font sens ?
Comment les améliorer ? Que manque-t-il ?
Il y a aussi des biais potentiels à traiter :
-
Y-a-t-il une meilleure façon de définir le point de référence ? Une approche par densité et pas par moyenne (j’ai écarté volontairement l’approche par médiane) ?
-
Est-ce que la manière de définir la zone préférentielle est correcte ? Y-aurait-il une approche plus scientifique ?
Une fois ces questions traitées, il sera intéressant de s’intéresser au gain réel et potentiel en terme de performance qu’apportent ces métriques.
Il sera aussi intéressant de les confronter dans le temps en étudiant plusieurs saisons de données.
La dernière question que je vois à cet instant est de savoir si ces métriques peuvent être extrapolés d’une façon ou d’une autre à d’autres situations de jeu car c’est bien avec des coureurs sur base que la discipline et l’agressivité contrôlée sont primordiales.
Merci à Garrett Smith et John Edman votre aide et vos conseils précieux lors de l’écriture de cet article.
(1) Plate Discipline, fangraphs.com, Steve Slowinski, February 18th, 2010: https://library.fangraphs.com/offense/plate-discipline/
(2) The Adam Dunn debate: Defining plate discipline, MVN.com, Dr. Carleton, May 24th, 2007: https://web.archive.org/web/20080911225907/http://mvn.com/mlb-stats/2007/05/24/the-adam-dunn-debate-defining-plate-discipline/
(3)The Most Disciplined MLB Batters, fivethirtyeight.com, Neil Paine, April 25th, 2014: https://fivethirtyeight.com/features/the-most-disciplined-mlb-batters/