Au terme de sa carrière de patineur artistique, l’ex-olympien Craig Buntin a voulu doter son sport d’une application qui permettrait de mesurer les mouvements des patineurs et qui, espérait-il, diminuerait le côté arbitraire des notes attribuées par les juges.
Il s’est vite rendu compte que pour attirer les investisseurs, il devait se consacrer à un sport au créneau plus large. Or, le hockey avait un vide énorme à combler en ce qui concerne la cueillette de données.
« On voudrait finir par desservir les cinq grands sports d’équipe – football, baseball, basketball, soccer et hockey –, mais on s’est dit qu’il fallait d’abord dominer un sport en particulier avant d’attraper tous les gros poissons », explique Buntin.
De gros poissons, remarquez, l’ancien patineur en a trouvé parmi ses investisseurs. Pour sa deuxième ronde de financement, Buntin s’est attiré le soutien du milliardaire Mark Cuban, qui a donné à SportLogIQ les fonds nécessaires pour prendre son envol.
En l’espace de six mois, la compagnie comptant une quarantaine d’employés a obtenu des contrats avec le tiers des équipes de la LNH. Le Canadien n’en fait toutefois pas partie. Elle a aussi établi des partenariats avec les réseaux RDS et Sportsnet et est en voie de faire de même avec NBC.
La collecte de données par reconnaissance automatisée (expliquée en détail dans la section Techno sous la plume de Jean-François Codère) a permis à SportLogIQ de donner un contexte aux statistiques qu’elle comptabilise.
Le travail de SportLogIQ est un croisement entre un rapport de recrutement et une analyse de statistiques avancées. Chaque match de la LNH est décortiqué en des centaines d’événements individuels qui, à la longue, permettent de déterminer les tendances des joueurs, leurs forces et leurs faiblesses.
SportLogIQ est donc à même d’établir la valeur des joueurs en fonction de leurs véritables actions sur la glace.
Étape suivante : la compilation de ces données permet de déceler les tendances d’une équipe. Comment s’y prend-elle pour sortir de sa zone ? De quelle manière crée-t-elle ses chances de marquer ? Etc.
Selon Christopher Boucher, le responsable de l’analyse hockey chez SportLogIQ, les 120 unités de mesure recensées permettent d’en apprendre beaucoup plus sur un joueur que si un recruteur décidait d’aller observer un espoir en vue du repêchage.
En fait, dit-il, les recruteurs ont raison d’être inquiets de l’avenir.
« Si j’étais gestionnaire d’une équipe, je ne me contenterais pas d’utiliser les données de SportLogIQ pour déterminer qui l’on repêche. Ce sera toujours pertinent qu’un dépisteur fasse de la recherche pour connaître l’origine d’un joueur, ses habitudes de vie, son éthique de travail, etc. Mais envoyer un recruteur observer un joueur pour un match ou deux de façon arbitraire, c’est un peu ridicule.
« C’est un bien petit échantillon sur lequel baser son jugement… »
Cette année, SportLogIQ fournira des données à trois équipes en vue du repêchage. Ce sont les mêmes données que celles retenues pour la LNH, mais appliquées à des matchs de hockey junior.
SportLogIQ n’entre pas dans la catégorie des « statistiques avancées » telles qu’on les connaît depuis quelques années. En premier lieu parce qu’elle fait avancer les statistiques beaucoup plus loin que les blogueurs spécialisés ne l’ont fait jusqu’à maintenant !
Par exemple, les recherches en statistiques avancées, qui portent principalement sur les tentatives de lancers, ont cherché à amalgamer ces tentatives et la possession de la rondelle. Ce sont deux choses différentes.
« Nous sommes capables de mesurer la véritable durée de possession de la rondelle, entre le moment où un joueur récupère une rondelle libre et celui où sa passe rejoint la palette d’un coéquipier, décrit Christopher Boucher. On peut aussi diviser le temps de possession en fonction du territoire.
« Comme le démontre un gars comme Lars Eller, avoir la possession de la rondelle n’est pas suffisant. Il a beaucoup de temps de possession en zone offensive, il exerce un bon mouvement de rondelle, mais n’arrive pas pour autant à créer des chances de marquer. C’est la raison pour laquelle il est plus à sa place ailleurs que sur les deux premiers trios… »
Faire sa propre cueillette de données a permis à SportLogIQ de s’éloigner des fichiers sources produits par la Ligue nationale, qui sont truffés d’erreurs. Alors que les blogueurs de statistiques avancées, eux, se fient à ces renseignements de base qui sont erronés. Ça ne peut que maintenir le caractère approximatif de leurs conclusions !
Le temps de jeu des joueurs, qui est déterminé « à la mitaine » par des officiels mineurs de la ligue, n’est pas véridique. Et c’est sans compter les mises en échec, les revirements et même le nombre de lancers, qui varient en fonction de l’amphithéâtre où se déroule le match.
« C’est incroyable à quel point le déroulement des événements sur le site de la LNH n’est pas fiable, avance Boucher. On a déjà recensé deux occasions de marquer de Vladimir Tarasenko sur une même séquence alors que, selon le site de la LNH, il n’était même pas sur la glace ! »
Au-delà des tentatives de lancers, la firme montréalaise se penche sur tous les aspects du jeu. Elle travaille entre autres à créer des unités de mesure pour le jeu défensif, le plus gros défi dans le domaine. Pour y arriver, elle a divisé la zone défensive en secteurs. Il y a la « zone rouge » qui correspond au bas de l’enclave et d’où n’importe quel lancer est considéré comme une chance de marquer. Le haut de l’enclave et la périphérie sont aussi divisés en secteurs.
Parmi les statistiques comptabilisées, il y a la « suppression de lancers », qui détermine, dans chacun des secteurs, quel joueur aide à diminuer le nombre de lancers de l’adversaire lorsqu’il est sur la patinoire.
Certaines de ces données permettent de démontrer, par exemple, que P.K. Subban est bien meilleur défensivement que ce qu’on pourrait imaginer.
« Pour chacune des zones, on détermine aussi quel est le taux d’efficacité du gardien quand tel ou tel joueur est sur la glace, indique Boucher. Subban, qui est un défenseur droitier, se soucie surtout du haut de l’enclave à droite ainsi que de la zone rouge. Or, quand il est sur la glace, le taux d’efficacité du gardien grimpe de 10 % dans la zone rouge et de 8 % du haut de l’enclave à droite. Ça vous donne une idée de l’impact qu’il a sur la qualité des tirs offerts à l’adversaire… »
Christopher Boucher a mis sur pied certains regroupements de statistiques, par exemple les « jeux qui génèrent des chances de marquer ». Ce terme regroupe les passes dans l’enclave, les lancers, les passes en entrée de zone, les déviations…
« Vladimir Tarasenko est premier de la ligue pour le nombre de jeux qui génèrent des chances de marquer, suivi de Patrick Kane, confie Boucher. Et Alex Galchenyuk figure dans le .
« Ce qui est intéressant, c’est qu’en isolant ces actions-là, un joueur qui génère ce type de jeu n’est pas affecté négativement par le fait que son coéquipier n’est pas capable d’y donner suite. »
Pour les défenseurs, Boucher regarde davantage le regroupement de statistiques réunies sous le vocable « jeux qui stimulent la possession de rondelle ».
« Ce sont tous les jeux où un joueur fait progresser le disque sans en perdre le contrôle. Ça inclut les passes en sortie de zone, les sorties de zone contrôlées, la possession à la ligne rouge, les passes à un attaquant en zone neutre, etc. Des gars comme Roman Josi, P.K. Subban et Erik Karlsson dominent cette possession de rondelle depuis la zone défensive. »
On dit souvent qu’on peut faire dire n’importe quoi aux chiffres. Mais le degré de précision qu’est en mesure d’obtenir SportLogIQ ne laisse pas de place à la subjectivité. Les données sont là, concrètes et réelles.
Et elles sont en train de donner à la Ligue nationale un tout nouvel éclairage sur la performance de ses athlètes.