ZOOM science

Combien de calories dans 140 caractères ?

Les habitants de la Virginie-Occidentale utilisent Twitter pour parler de biscuits et de télévision. Les Californiens, eux, gazouillent davantage à propos des tomates et de la danse. Et devinez qui est en meilleure santé ? Des chercheurs viennent d’inventer un instrument qui calcule les calories contenues dans les messages Twitter. Et qui s’avère un excellent indicateur de la santé des populations.

ZOOM science

Twitter, baromètre de la santé des américains

Les habitants de la Virginie-Occidentale utilisent Twitter pour parler de biscuits et de télévision. Les Californiens, eux, gazouillent davantage à propos des tomates et de la danse. Et devinez qui est en meilleure santé ? Des chercheurs viennent d’inventer un instrument qui calcule les calories contenues dans les messages Twitter. Et il s’avère un excellent indicateur de la santé des populations.

Calculer les calories des gazouillis

Un message sur Twitter peut-il contenir des calories ? C’est en tout cas l’idée derrière le lexico-calorimètre, instrument pondu par une équipe de chercheurs provenant notamment de l’Université du Vermont, de Berkeley et du MIT. La machine a fouillé 50 millions de messages géolocalisés publiés sur Twitter à partir des États-Unis en 2011 et 2012. Chaque fois qu’elle détectait un terme lié à la nourriture, la machine comptabilisait un nombre de calories correspondant à 100 g de cette substance. Un gazouillis qui contient l’expression « gâteau au chocolat », par exemple, contient ainsi 371 calories. Quand le lexico-calorimètre détecte plutôt un terme décrivant une activité physique, il comptabilise des calories brûlées (correspondant à une heure de cette activité). Un message qui contient le mot « danse » compte ainsi pour 630 calories brûlées.

Une « idée folle »

Pour chaque État américain, les chercheurs ont comptabilisé le ratio des calories brûlées contre les calories ingérées véhiculées par les messages Twitter. On vous entend protester. Ce n’est pas parce que vous écrivez « soccer » sur Twitter que vous avez nécessairement joué une heure au soccer. Pas plus qu’écrire « croustille » implique qu’on a mangé 100 g de Ruffles.

« C’est un instrument très macroscopique, convient à La Presse Peter Dodds, professeur au Computational Story Lab de l’Université du Vermont et l’un des auteurs de l’étude. Et je conviens avec vous que c’est une idée folle. Mais nous avons fait le pari qu’en regardant l’ensemble des messages qui émanent d’une population, on parviendrait à montrer que ça reflète quand même quelque chose. »

Un miroir de la santé

Les chercheurs ont remporté leur pari. Ils ont montré que les calories associées aux messages Twitter sont fortement liées aux taux d’embonpoint, d’obésité, de diabète, d’hypertension et de mortalité pour cause de maladie cardiovasculaire des différents États américains. « D’un point de vue de santé publique, c’est un outil vraiment puissant », commente le professeur Dodds, qui souligne que l’un des avantages du lexico-calorimètre et qu’il peut fournir des informations en temps réel. « On ne dit pas qu’il faut remplacer les sondages qu’on mène actuellement pour recueillir des informations, précise le professeur Dodds. Mais comme un pilote d’avion a plusieurs indicateurs sur son tableau de bord, on a besoin de plusieurs outils pour cerner les problématiques de santé publique. »

Pizza, télé et haricots verts

L’instrument développé par les scientifiques a permis de faire ressortir plusieurs particularités régionales. Selon les résultats obtenus, ce sont les habitants du Colorado, du Wyoming et du Vermont qui dépensent le plus de calories par rapport à celles ingérées. Ceux du Mississippi, de la Louisiane et l’Alabama sont derniers de classe. En analysant les mots liés à la bouffe et aux activités qui circulent sur Twitter, les chercheurs se sont heurtés à une tendance lourde. « À quelques très rares exceptions, les expressions “pizza” et “regarder la télé” » dominent dans tous les États pour chaque catégorie. On ne peut pas dire que la vague de fond soit très saine », rigole le chercheur. Les scientifiques ont néanmoins dégagé, dans chaque État, les termes caractéristiques qui ont influencé les résultats. C’est ainsi qu’on a appris que les habitants du Tennessee aiment tweeter à propos d’être assis, que ceux du Montana raffolent du beurre d’arachide, que « se faire faire les ongles » est populaire au New Jersey et qu’on gazouille à propos des haricots verts dans l’Oregon.

Une tendance lourde

C’est loin d’être la première fois que le contenu des réseaux sociaux est utilisé comme miroir de ce qui se passe dans la population. Dès 2008, Google a commencé à prédire la progression du virus de la grippe en analysant les termes de recherche tapés par les utilisateurs. D’autres ont montré que le langage utilisé sur Twitter pouvait surpasser certains indicateurs socioéconomiques pour prédire les maladies cardiovasculaires. Avant ce projet, le chercheur Peter Dodds et son équipe avaient eux-mêmes lancé un « hédonomètre » visant à mesurer le bonheur de la population à partir du contenu diffusé sur les réseaux sociaux. Ils pensent maintenant à un « insomniomètre » pour documenter les problèmes de sommeil et à un détecteur de lendemains de veille pour étudier la surconsommation d’alcool.

Ce texte provenant de La Presse+ est une copie en format web. Consultez-le gratuitement en version interactive dans l’application La Presse+.