Données erronées sur la langue

La tendance se maintient, l’humain aussi

Le recul du français est moins marqué qu’on ne le pensait au Québec, mais l’érosion demeure, montrent les données corrigées publiées hier par Statistique Canada. L’esprit critique, par contre, n’est pas en baisse. Au contraire, ce malheureux épisode nous aura encore une fois démontré sa pertinence face aux processus automatisés.

Sur le fond, ça se confirme. Le français a perdu du terrain au Québec, aussi bien comme langue maternelle que comme langue le plus souvent parlée à la maison.

La tendance est simplement moins forte qu’on ne le croyait.

On a entendu les inquiétudes à la publication, le 2 août dernier, de ces chiffres tirés du dernier recensement. Les réactions auraient-elles été différentes si on avait eu les bonnes données ? Permettez-nous d’en douter. Apprendre que le pourcentage de Québécois ayant le français comme seule langue maternelle a fondu de « seulement » 1 % n’aurait certainement pas été salué comme une bonne nouvelle, même si c’est mieux que le déclin de 1,7 % qui a d’abord été annoncé.

Le problème, rappelons-le, a été provoqué par une erreur dans le traitement informatique de quelque 61 000 questionnaires québécois.

Les correctifs publiés hier ont aussi inversé certains mouvements chez les anglophones. La population déclarant l’anglais comme langue maternelle et langue le plus souvent parlée à la maison, qui paraissait en hausse le 2 août, a en réalité diminué, a-t-on appris hier. Au fond, on peut dire que la tendance se maintient là aussi, puisque c’est ce qu’on voyait déjà ailleurs au pays : l’anglais, comme le français, perd du terrain devant les langues des nouveaux arrivants. Sauf au Québec ? Cette étrange particularité avait intrigué plusieurs observateurs – assez pour en inciter certains à contacter l’agence fédérale. Mais les statisticiens pensaient que les explications viendraient d’autres données – celles sur l’immigration et la mobilité interprovinciale, qui ne seront pas disponibles avant l’automne.

Il a fallu que quelqu’un se mette à creuser les chiffres au pic et à la pelle, ou plutôt à la souris et au chiffrier Excel, pour qu’on envisage la véritable explication : il y avait forcément une erreur.

Le président de l’Association d’études canadiennes, Jack Jedwab, a passé environ deux jours à fouiller dans les fichiers pour comprendre d’où venait cette génération spontanée d’anglophones. Et il les a trouvés dans les endroits les plus improbables. Au Saguenay, à Rivière-du-Loup et à Drummondville, par exemple, où la population ayant déclaré l’anglais comme langue maternelle et langue parlée à la maison avait doublé ou triplé en cinq ans. Ou dans la région de Québec, où le nombre de petits anglophones de 0 à 14 ans avait soudainement bondi de 98 %. M. Jedwab a ensuite passé quelques heures au téléphone pour faire d’autres vérifications. Rien, ni dans les observations des gens sur le terrain, ni dans les statistiques d’immigration, ni dans les inscriptions aux écoles anglaises, n’allait dans le sens du recensement.

La source de toute cette confusion nous a finalement été expliquée hier. Une partie des formulaires québécois ont été mal « lus » par le nouveau programme informatique développé à l’interne. À des questions où les répondants avaient coché « français », le système a comptabilisé la réponse « anglais ». Dans une mer de francophones (près de 80 % de la population québécoise, ne l’oublions pas), ça ne retrousse pas trop. Mais dans de petits bassins comme Dolbeau-Mistassini, une croissance subite de plus de 200 % de la population anglophone, ce n’est pas banal. Encore faut-il se donner la peine d’y aller voir de plus près.

Statistique Canada le reconnaît : ses systèmes auraient dû détecter cette anomalie. Ils n’ont rien signalé. L’agence fédérale a cependant mis les bouchées doubles pour corriger ces erreurs rapidement, s’assurer qu’il ne s’en était pas glissé d’autres ailleurs et améliorer ses processus de validation. Rien n’indique qu’il y ait lieu de la blâmer dans cette histoire. Cet épisode nous rappelle toutefois que les procédures automatisées ont leur limites, et qu’un regard critique et conscient de la réalité qui se cache sous un jeu de données constitue souvent un détecteur d’aberrations autrement plus efficace.

Ce texte provenant de La Presse+ est une copie en format web. Consultez-le gratuitement en version interactive dans l’application La Presse+.