Accès aux données de recherche

Données sous haute sécurité

Des millions de renseignements délicats au sujet des Québécois sont désormais étudiés dans des laboratoires ultrasécurisés, dont ils ne peuvent sortir. Murs quasi blindés, fenêtres à l’épreuve des espions, contrôles et surveillance… Québec a la hantise des fuites. Au point de paralyser le travail des chercheurs, s’inquiètent plusieurs d’entre eux.

UN DOSSIER DE MARIE-CLAUDE MALBOEUF

Quand la recherche se déplace dans des forteresses

La petite pièce sera impénétrable. Des grilles renforcent les murs. Et de solides barreaux bloquent tous les conduits d’aération.

« L’entrepreneur a fait affaire avec un fournisseur de prisons », indique le professeur Sébastien Breau, rencontré sur le chantier.

Un film spécial recouvrira bientôt la grande fenêtre pour empêcher quiconque de voir à l’intérieur, même si la pièce se situe au 6e étage.

« En théorie, avec un zoom ou une longue-vue, quelqu’un pourrait voir les écrans d’ordinateur à partir de l’immeuble d’en face », explique le professeur de géographie.

Ici, dans un discret édifice de l’Université McGill, on s’apprête à protéger un trésor : des millions de renseignements délicats au sujet des citoyens québécois.

Dès septembre, les chercheurs ayant fait approuver leurs projets pourront y analyser des informations sur les consultations médicales, les séjours à l’hôpital, les naissances et décès, la prescription de médicaments, les résultats scolaires, etc.

Les données de Revenu Québec et d’autres ministères s’y ajouteront au fil du temps.

« Ce sont des données réelles très riches, qui permettront de répondre à toutes sortes de questions », se réjouit le professeur Breau.

On pourrait par exemple étudier l’impact des commotions cérébrales sur le parcours scolaire, illustre Sophie Balmayer, directrice de la gestion des données et de l’accès pour la recherche à l’Institut de la statistique du Québec (ISQ).

« Mais l’identité des individus est protégée. Tous les noms et adresses sont remplacés par  des chiffres. »

— Sophie Balmayer, directrice de la gestion des données et de l’accès pour la recherche à l’Institut de la statistique du Québec (ISQ)

Au cours des 20 dernières années, l’ISQ avait déjà ouvert trois autres centres d’accès aux données de recherche (CADRISQ) à Montréal et Québec. Mais on y trouvait surtout des informations tirées de ses propres enquêtes.

La quantité de renseignements gouvernementaux analysés dans ces petites forteresses explose, maintenant que l’ISQ gère en plus l’accès aux banques d’autres organismes ou ministères (pour le moment, Santé, Éducation et Régie de l’assurance maladie). Un mandat qui lui a été confié il y a deux ans, mais qui est seulement enchâssé dans sa loi depuis un mois.

D’ici peu, l’ISQ chapeautera 10 laboratoires, dont celui qui ouvrira à McGill. Et un nombre croissant de chercheurs sont contraints d’y travailler sous haute surveillance. Ce qui provoque bien des protestations.

Avant, ils analysaient les données dans leurs bureaux, à toute heure, avec leurs équipes.

Les règles ont radicalement changé.

« On doit éviter les fuites de données volontaires ou involontaires », justifie Mme Balmayer.

Chercheurs sous haute surveillance

Au CADRISQ de l’UdeM, ouvert de 8 h 45 à 16 h 45, les scientifiques doivent se départir de leur téléphone et de tout autre appareil électronique.

« Ils ne peuvent sortir aucune donnée brute. Les entrées USB de nos ordinateurs sont bloquées. Il n’y a pas d’accès internet. Un filigrane brouille les captures d’écran », explique Sylvain Lefebvre, l’un des analystes en poste.

Le bureau commun sera bientôt percé d’une fenêtre intérieure pour surveiller les chercheurs.

L’ISQ procède aussi à une « analyse de confidentialité » à la sortie des résultats. « C’est notre mandat d’éliminer toute information qui pourrait permettre de réidentifier quelqu’un », indique Patricia Caris, directrice générale de la méthodologie et de l’accès aux données.

Il pourrait s’agir, par exemple, de personnes centenaires ou souffrant d’un mal rarissime.

« Le remplacement du papier par des dossiers numériques facilite les recoupements et nous force à renforcer la sécurité, explique Mme Caris. C’est le prix à payer pour accéder à des fichiers de données fines1. »

Depuis un mois, la loi permet à d’autres ministères de rendre leurs données disponibles par l’entremise du guichet de l’ISQ, ce qui devrait se produire au fil des ans.

« Ça amènera beaucoup d’eau au moulin de la recherche, promet Mme Caris. Les secteurs de l’immigration, du travail et de la famille sont super importants. »

Frustrations et sécurité

Dans un mémoire remis à l’Assemblée nationale, un consortium représentant près de 150 chercheurs reproche à l’ISQ de les paralyser2.

Leurs études, soulignent-ils, ont eu un impact majeur sur la détection de l’autisme, la prescription de médicaments aux femmes enceintes, le traitement de maladies mentales et cardiaques, etc.

« Mais l’accès s’est dégradé avec l’ISQ. C’est hyper désolant ! Ils ralentissent l’innovation », accuse la Dre Anick Bérard, porte-parole de leur consortium et directrice du Réseau québécois de recherche sur les médicaments.

Les ordinateurs des CADRISQ ne s’avèrent pas assez puissants pour manipuler les mégadonnées, affirme la chercheuse du CHU Sainte-Justine, qui suit de grandes cohortes de mères et d’enfants depuis 20 ans.

« On ne peut même pas accéder à l’internet. En 2021, qui peut travailler dans un environnement aussi stérile ? »

— Anick Bérard, directrice du Réseau québécois de recherche sur les médicaments, et porte-parole d'un consortium représentant près de 150 chercheurs

Le contrôle des résultats l’indigne encore plus. « Des évènements lourds de conséquences, comme certaines malformations congénitales, arrivent une fois sur 100 000. Mais Big Brother à la porte nous empêche de publier et d’avoir un impact sur la vie des gens ! »

En près de 40 ans, ajoute la chercheuse, aucune fuite de données n’a pu être reprochée aux scientifiques québécois, encadrés par leurs universités et établissements. « Le climat de suspicion est injustifié », conclut-elle.

Bien au fait de ces critiques, Patricia Caris, de l’ISQ, rappelle que des fuites font sans arrêt la manchette. Et peuvent avoir des conséquences catastrophiques, même si elles sont rarement malveillantes.

« Ce ne sont pas les données que j’enferme dans les CADRISQ ! C’est la personne distraite qui prendra une photo des données à l’écran, en se disant que ce n’est pas si grave, et qui perdra son téléphone… »

— Patricia Caris, de l’ISQ

« On ne veut pas nuire aux chercheurs, lance Mme Caris. On veut les protéger eux aussi. Le jour où il y aura [une violation de la] confidentialité, le responsable sera dans l’embarras… On ne doit pas exposer les citoyens à des préjudices. »

Un processus trop long

Aux yeux des chercheurs, la population au complet est pénalisée quand l’accès aux données prend trop de temps.

Ils ont décrié pendant des années la complexité des démarches qu’on leur imposait. Soit frapper à plusieurs portes – dont celle de la Commission d’accès à l’information (CAI) – et attendre une éternité des réponses parfois contradictoires.

« J’ai déjà reçu trois ans de financement pour une étude sur le diabète, et deux ans et demi se sont écoulés juste pour avoir les données ! », relate la médecin-chercheuse Kaberi Dasgupta, du Centre de santé de l’Université McGill.

En Ontario, ses confrères accèdent de 10 à 15 fois plus rapidement au même type d’informations, dit-elle.

L’ISQ ne gère donc pas seulement la sécurité des données. Depuis juin 2019, il a aussi le mandat d’aider les scientifiques à les obtenir plus rapidement et facilement, grâce à un nouveau guichet d’accès3. C’est son personnel qui obtient les renseignements à la place des chercheurs et qui les combine pour eux dans un fichier de recherche.

Fin juin, la Dre Bérard a sondé ses confrères et consœurs au sujet de leur expérience. Environ 12 % des 225 chercheurs ayant déposé ou vu transférer leur demande au guichet d’accès de l’ISQ figurent au rapport qu’elle a remis au scientifique en chef du Québec4.

Plusieurs y évoquent des « embûches incompréhensibles », des « courriels discordants », de longs silences ou des interlocuteurs « débordés ».

« On nous avait dit que les projets COVID-19 étaient évalués en priorité, écrit une chercheuse de Sherbrooke, mais […] la COVID sera terminée avant que l’accès aux données nous soit accordé. »

Les mécontents ont déposé leurs projets avant que la loi change, après deux ans d’attente, souligne Mme Caris. Depuis le mois dernier, l’ISQ n’a plus besoin d’obtenir la bénédiction de la CAI avant de déposer des données dans un CADRISQ. Il s’assure à sa place que l’étude ne mettra pas la vie privée en péril. Ce qui fait économiser du temps. Le retard dans l’adoption de la loi « a constitué une entrave majeure » à la réduction des délais d'attente, dit Mme Caris.

Mais ils étaient déjà en diminution constante et continueront de s’améliorer, promet-elle.

« Si le processus s’accélère, les gens se plaindront moins ; on célébrera ! Autrement, la frustration demeurera », croit la Dre Dasgupta, qui est membre du comité d’usagers du guichet d’accès et demeure optimiste.

À l’automne, l’interniste a reçu des renseignements médicaux au sujet de 20 000 mères, pères et enfants. Elle doit maintenant aller et venir entre l’hôpital et le CADRISQ, pour valider les analyses de ses assistants. « Ce qui nécessitait une journée peut facilement prendre une semaine », constate-t-elle.

« Mais les données obtenues étaient adéquates et les gens de l’ISQ ont travaillé fort pour trouver des solutions à nos problèmes. »

Patricia Caris est heureuse de l’entendre. « On est les seuls à offrir une solution concrète pour répondre aux préoccupations des chercheurs et de la population. On ne prétend pas que c’est parfait. C’est un premier pas, qui nous permet d’avancer. »

« À mesure que la technologie nous donne le moyen d’alléger les souffrances des chercheurs, on cherche à le faire. »

La Dre Dasgupta rêve, comme ses collègues, d’un portail sûr, qui leur permettrait de traiter les données à distance, directement dans les systèmes où elles se trouvent, sans jamais les déplacer ni les télécharger.

« Oui, la technologie le permet, reconnaît Mme Caris. Mais on va y aller graduellement, on n’est pas rendus là. »

1. Lorsqu’un chercheur se connecte au réseau sécurisé de l’ISQ à distance, plutôt que de se rendre dans un CADRISQ, il accède à des données regroupées ou masquées.

L’intelligence artificielle paralysée

Québec finance la recherche en intelligence artificielle (IA) à coups de millions. « Mais les chercheurs qui utilisent cette technologie pour observer des tendances et comprendre ce qui arrive aux patients ne peuvent plus le faire avec un grand volume de données », constate la Dre Kaberi Dasgupta, du CUSM.

Sans données, ils ne peuvent entraîner leurs algorithmes afin d’améliorer la qualité de leurs prédictions et recommandations.

Autre problème : avant, les chercheurs appariaient eux-mêmes les millions de données qu’ils obtenaient de différentes banques, ou avec le consentement de patients, et manipulaient le tout dans leurs bureaux. De nombreuses données sont maintenant bloquées à des endroits différents, d’où elles ne peuvent sortir.

« Les hôpitaux et les cliniques ne veulent pas qu’on déplace leurs données dans le système des CADRISQ, et vice versa », résume la Dre Dasgupta.

Pour résoudre une partie du problème, l’ISQ fera construire cinq CADRISQ au sein d’hôpitaux universitaires – d’abord au CHU Sainte-Justine, puis au Centre hospitalier de l’Université de Montréal (CHUM) – afin que toutes les données se retrouvent entre les mêmes murs.

« On est dans le noir si on ne peut pas les utiliser »

Des lois changent. Des groupes déposent des mémoires. L’accès aux données gouvernementales par les chercheurs est un sujet chaud. Survol.

Quels renseignements personnels intéressent les chercheurs ?

Le gouvernement accumule toutes sortes de renseignements au sujet des citoyens lorsque ceux-ci reçoivent des services : diagnostics, résultats scolaires, etc. Le site de l’Institut de la statistique souligne le « grand potentiel scientifique et économique » de ces données réelles.

Leur analyse a déjà généré des milliers de découvertes. Par exemple, au sujet de la prise d’acide folique ou d’antibiotiques durant la grossesse.

« On est dans le noir si on ne peut pas les utiliser. On se tire dans le pied comme société », affirme la professeure Sylvana Côté, du CHU Sainte-Justine, directrice de l’Observatoire pour l’éducation et la santé des enfants.

Pourquoi préférer les données québécoises ?

Pour offrir les meilleurs soins et services possibles aux citoyens québécois, répond Carole Jabet, directrice scientifique des Fonds de recherche du Québec (FRQ) en santé. « Nos maladies rares ne sont pas systématiquement les mêmes que les maladies rares qu’on aura ailleurs dans le monde, et notre immigration, pas la même que dans les autres provinces. La recherche doit refléter la réalité et la diversité de notre population. »

Devrait-on recueillir le consentement de chaque citoyen ?

« C’est impossible de faire une recherche qui requiert les données d’une large partie des données de la population et de contacter tout le monde », indique Mme Jabet.

La Loi sur l’accès à l’information permet donc déjà aux chercheurs de décrocher une autorisation spéciale afin d’accéder aux grandes banques gouvernementales – à condition que les données soient dépersonnalisées et protégées.

Les scientifiques obtiennent ainsi des résultats plus complets. « Quand certaines catégories de gens refusent de participer aux études, cela réduit notre savoir à l’égard de ces groupes », affirme Mylène Deschênes, directrice des affaires éthiques et juridiques aux FRQ.

Quelles sont les craintes ?

De récents piratages et fuites ont effrayé la population et le gouvernement. Que ce soit chez Desjardins, au Tribunal administratif du logement, au ministère de la Famille. « Il y a un réel enjeu de sécurité », estime Dominic Cliche, de la Commission de l’éthique en science et en technologie du gouvernement du Québec.

Les chercheurs ignorent l’identité des gens dont ils analysent les données. Mais la multiplication de dossiers informatiques complique les choses, expose le philosophe. Les experts ont en effet démontré qu’on peut théoriquement réidentifier les individus, même quand leur nom n’apparaît pas, en croisant les informations qui les concernent.

Québec veut donc moderniser la Loi sur l’accès à l’information pour que quiconque tentant d’agir ainsi écope d’amendes costaudes.

Qu'en pensent les chercheurs ?

La sécurité des données est importante, mais celle de la population l’est aussi, plaident-ils. « Le citoyen admis à l’hôpital s’attend aux meilleurs soins de santé, et la recherche permet de les améliorer », rappelle Mylène Deschênes.

Dans un mémoire, les FRQ demandent au gouvernement d’accorder plus de latitude aux scientifiques à l’étape de l’analyse des données. « Actuellement, l’accès est accordé pour un projet très spécifique, explique Mme Jabet. Chaque fois qu’on veut introduire une modification, un ajout, le processus d’autorisation doit être repris. »

Que réserve l'avenir ?

Au fil des ans, les banques de données d’autres ministères devraient être rendues disponibles à travers le guichet d’accès de l’ISQ. « Plusieurs sont intéressés, car ils n’ont pas toujours les ressources pour gérer les demandes des chercheurs », rapporte Patricia Caris, directrice générale de l’accès aux données.

La loi a été changée pour que l’ISQ reçoive ces demandes et s’assure qu’elles respectent une série d’exigences en matière de vie privée (au lieu de la Commission d’accès à l’information).

Les ministères et organismes qui préféreront gérer eux-mêmes les demandes devront appliquer sensiblement les mêmes critères que l’ISQ lorsque la Loi sur l’accès à l’information aura été modifiée à son tour. Et ils devront aussi exiger que les données ne soient ni utilisées à d’autres fins que celles qui sont prévues ni appariées autrement que prévu. Ce que les chercheurs trouvent trop rigide.

Ce texte provenant de La Presse+ est une copie en format web. Consultez-le gratuitement en version interactive dans l’application La Presse+.