recherche

Pour un meilleur accès aux mégadonnées

La Coalition avenir Québec poursuit plusieurs objectifs simples, que tout gouvernement social-démocratique devrait poursuivre, même si leur atteinte est difficile, et la mesure du degré de leur réalisation, complexe et périlleuse.

Ils méritent d’être rappelés : mieux gérer les politiques et interventions avec de plus hauts standards de qualité ; développer l’utilisation des nouvelles technologies et des entreprises associées ; améliorer le niveau de vie relatif et de bien-être des Québécois, tout en s’attaquant aux inégalités socioéconomiques. 

Nous estimons que chaque ministre, sans exception, dispose d’instruments pouvant être mis en œuvre rapidement, simplement et avec peu de ressources : ceux-ci reposent sur le partage de leurs données. 

Comme chercheurs en sciences sociales, nos travaux empiriques s’appuient sur des données d’enquêtes ou administratives. Notre objectif général est d’analyser les phénomènes sociaux sous-jacents afin d’identifier des orientations des politiques publiques qui mériteraient changements, bonifications ou abandons. Nous ne souhaitons pas ici suggérer des pistes d’intervention à suivre, mais plutôt attirer l’attention sur une richesse sous-exploitée que possède le secteur public, alors que la société dispose de ressources humaines qui peuvent en tirer parti pour contribuer aux objectifs visés. 

Tous les paliers de gouvernement génèrent par leurs activités des mégadonnées, aussi appelées données massives (« Big Data »).

Elles sont pour le moment peu valorisées, mais peuvent fournir, après analyse, des outils innovants pour les décideurs, les partenaires et les utilisateurs des services.

Elles peuvent permettre de générer des connaissances pour mieux décider (où faire passer un tramway), prévenir (épidémie, pharmacovigilance), sécuriser (maintenance prédictive, crimes, accidents) ou informer sur l’avenir prévisible (vieillissement, climat, environnement). 

Des exemples concrets

Elles ont trois qualités par rapport à d’autres types de données : leur volume, leur vélocité (elles deviennent disponibles rapidement) et leur diversité (santé, éducation, transport, électricité, etc.). Les exemples sont trop nombreux pour en faire la liste ; donnons plutôt quelques illustrations des potentialités. 

Dans le domaine des transports, dont les effets indirects influencent la mobilité et l’environnement, les données massives peuvent provenir des passagers du transport en commun (titres et trajets), de la géolocalisation des personnes (par leur téléphone) et des voitures (SAAQ), etc. Modéliser les déplacements des populations permet d’adapter les infrastructures et les services (horaires et fréquence des bus, par exemple) ; les accidents informent sur la sécurité. 

Dans le domaine de la gestion énergétique, les données d’Hydro-Québec sur les usagers domestiques, commerciaux et industriels sont uniques. On peut penser alors à la gestion de réseaux énergétiques complexes via les réseaux électriques intelligents (« smartgrids ») qui utilisent des technologies informatiques pour optimiser la production, la distribution et la consommation de l’électricité, et identifier les gains potentiels à l’efficacité. 

En santé, la production d’applications innovantes reposerait sur les millions d’observations recueillies par la Régie de l’assurance maladie du Québec (RAMQ), les hôpitaux et centres de soins sur les citoyens, leurs employés et les « producteurs ». On peut donner comme exemple (dont les résultats sont inconnus pour le moment) l’initiative de la coentreprise en santé fondée par trois géants américains (Amazon, JPMorgan, Berkshire Hathaway), qui entre eux comptent plus d’un million d’employés. 

Cette initiative vise à améliorer l’état de santé de leurs employés en identifiant des interventions plus avantageuses au niveau de la prévention, la détection, les soins et les traitements. Au Québec, compte tenu de la présence de l’État en santé, les données en santé (RAMQ, MED-ÉCHO, I-CSLC, etc.) ont plus de volume, de vélocité et de diversité. 

Le cancre de l’éducation

C’est certainement en éducation primaire et secondaire que les données administratives dans une forme structurée ou semi-structurée sont le moins facilement accessibles aux chercheurs du Québec. 

Aux États-Unis, depuis longtemps et sous la pression fédérale, les États ont construit des banques de données longitudinales de toutes les écoles accessibles aux chercheurs sur les élèves, les professeurs, les directeurs et les résultats à des tests standardisés. La recherche a montré que de telles données permettent d’identifier où sont les faiblesses et les interventions les plus efficaces. Heureusement, les enquêtes internationales en éducation apportent un éclairage sur la question et permettent de caractériser, habilement et de façon probante, des profils qu’on ne peut faire autrement. 

Le ministère de l’Éducation pourrait, en exploitant ses propres données administratives et celles des commissions scolaires, aller chercher encore plus d’information, et plus rapidement.

Mentionnons ici l’exemple, publié dans La Presse le 22 octobre 2018, de la commission scolaire du Val-des-Cerfs, qui a réussi à prédire le décrochage avec un taux de succès de 92 %. Imaginez ce qu’on pourrait faire avec plus ! 

Le Québec a pris un retard important à l’égard de l’accès à toutes ses données administratives par rapport aux autres provinces. Heureusement, une approche permettant de donner accès aux données aux chercheurs des secteurs public, académique ou privé via une infrastructure contrôlée existe. À travers le Canada, plusieurs dizaines de centres d’accès aux données administratives ou d’enquêtes sociales nationales ou provinciales existent ; il s’agit du Réseau canadien des Centres de données de recherche, avec ici le Centre interuniversitaire québécois de statistiques sociales. Les infrastructures existent depuis près de 20 ans ; on a mis en place trois des pratiques éprouvées pour assurer un contrôle sévère des informations qui sortent, de leur confidentialité et du respect de critères d’éthique par les chercheurs qui ont accès sans frais aux centres situés dans les universités. 

Il n’en revient qu’au nouveau gouvernement d’ouvrir l’accès à leurs données, afin de favoriser la génération de connaissances utiles au développement de la société.

* Signataires

Marie Connolly, Catherine Haeck, Nicholas Lawson, Pierre Lefebvre et Philip Merrigan, professeurs, département des sciences économiques, École des sciences de la gestion, Université du Québec à Montréal ; et Amélie Quesnel-Vallée, professeure, département de sociologie, Université McGill

Ce texte provenant de La Presse+ est une copie en format web. Consultez-le gratuitement en version interactive dans l’application La Presse+.