Démystifier le journalisme de données

Ces derniers temps, tout le monde semble parler de journalisme de données. Mais savons-nous vraiment de quoi il s’agit? Le principe en soi n’est pas sorcier: utiliser de l’information dans un format structuré et ordonné pour aider au travail journalistique. Mais comment faire du journalisme de données? Faut-il être un génie en mathématiques? Ou un programmeur prodige?

Par, Naël Shiab, journaliste de données, Journal Métro Montréal (collaboration spéciale). @NaelShiab

Pour la majorité des journalistes de données canadiens, jongler avec des chiffres et se perdre dans les milliers de lignes de fichiers Excel ne faisait pas du tout partie du plan de carrière. «Je voulais être un correspondant à l’international, je voulais être un journaliste de guerre, indique Roberto Rocha, qui était jusqu’à tout récemment journaliste de données pour Montreal Gazette. Je ne savais pas que j’avais à ce point un côté geek

Depuis ses débuts à Montreal Gazette en 2005, Roberto Rocha a publié de nombreux reportages qui ont mis à profit ses connaissances en journalisme de données. The most recalled foods in Canada and Quebec nous apprenait qu’un rappel d’aliments à lieu tous les trois jours en moyenne au Québec. Son article intitulé These are the most crowded emergency rooms in Montreal révélait que certaines salles d’urgences de Montréal sont débordées au point d’utiliser des civières qui n’existent même pas dans les registres officiels.

De nombreux médias canadiens ont déjà choisi de se lancer dans la grande aventure du journalisme de données. Global News, The Globe and Mail et le Toronto Star sont régulièrement mis en nomination pour des prix internationaux dans ce domaine. En 2012, l’Association canadienne des journalistes a créé la catégorie Data journalism (auparavant Computer-assisted journalism) pour ses prix annuels, afin de récompenser les adeptes de la discipline.

Toutefois, pour beaucoup, la pratique du journalisme de données est encore et toujours un mystérieux monde, où règnent en maître de complexes calculs statistiques et d’indéchiffrables codes informatiques.

Mythe #1: Le journalisme de données, c’est nouveau

Rien ne pourrait être plus faux! Le premier reportage de données connu à ce jour a été publié le 5 mai 1821, dans le Manchester Guardian (qui deviendra plus tard The Guardian).

À l’époque, le gouvernement soutenait que 8 000 enfants recevaient une éducation gratuite à Manchester. Mais une source anonyme a fourni au journal les registres sur lesquels se trouvait l’ensemble des inscriptions pour toutes les écoles de la région. Les journalistes se rendent alors compte que les contribuables payent en fait pour 25 000 enfants provenant de familles pauvres.

Le journal publie non seulement un article, mais aussi la liste complète des écoles, avec tous les chiffres. Pour la première fois, les journalistes donnent un accès direct aux données brutes qu’ils ont utilisées. Les données deviennent alors preuves.

Le but n’était pas de mettre le gouvernement dans l’embarras. C’était plutôt d’améliorer le système d’éducation. Comme le disait la source anonyme, citée dans l’article : «At all times such information it contains is valuable; because without knowing, the best opinions which can be formed of the condition and future progress of society must be necessarily incorrect.»

De nos jours, l’objectif reste le même: utiliser les données pour cerner la réalité avec plus de précision et mieux informer les citoyens, qui doivent choisir quelle voie la société doit prendre.

Au fil du temps, les outils des journalistes de données ont évolué. Dans les années 50 et 60, le journalisme assisté par ordinateur voit le jour. Le 4 novembre 1952, la chaine télévisée américaine CBS utilise un Remington Rand UNIVAC pour prédire les résultats de l’élection présidentielle. L’ordinateur soutient que le républicain Dwight Eisenhower remportera le vote populaire par une écrasante majorité. Et c’est exactement ce qui s’est passé!

Dans les années 70, c’est le terme journalisme de précision qui s’installe. Pour ses adeptes, la quête de vérité et d’objectivité des journalistes ne peut que profiter d’une démarche scientifique, basée sur l’analyse et, bien évidemment, des données.

De nos jours, les ordinateurs sont omniprésents dans nos vies et presque toutes les interactions entre les citoyens et leur gouvernement sont sauvegardées dans des bases de données. Avec un mouvement de plus en plus présent pour des données publiques ouvertes, toutes ces informations sont plus accessibles que jamais.

«Il y a deux grandes catégories de journalisme aujourd’hui, indique Philippe Gohier, rédacteur en chef Web du magazine L’Actualité. Il y a le journalisme qualitatif, pour lequel on recueille les motivations, les émotions des gens, et il y a le journalisme quantitatif, avec lequel on peut mesurer les opinions, les intentions et les faits. Ils sont complémentaires, parce que les données pour lesquelles il aurait fallu trois mois de travail il y a cinq ans, on peut désormais les avoir en un après-midi.»

Donc, la prochaine fois que vous entendrez quelqu’un vous dire que la discipline est toute nouvelle, corrigez-le! Les journalistes de données d’aujourd’hui sont les héritiers d’une longue tradition de professionnels qui ont adopté une approche scientifique plus rigoureuse dans leur travail.

Mythe #2: Si vous détestez les maths, passez à autre chose

Bien sûr, avoir quelques compétences en mathématiques est important en journalisme de données. Vous devriez au moins savoir comment calculer une moyenne, une variation en pourcentage et ce qu’est une médiane.

Cependant, il existe une différence fondamentale entre les mathématiques que vous avez détestées à l’école et les mathématiques appliquées au journalisme de données: c’est concret.

«J’ai toujours trouvé les mathématiques très ennuyantes au secondaire, parce qu’elles sont souvent enseignées de manière abstraite, indique Chad Skelton, journaliste de données pour le Vancouver Sun. On n’essayait pas de résoudre des problèmes réels.»

Chad Skelton non seulement haïssait les cours de maths, mais il faisait aussi tout son possible pour les éviter. «C’est drôle, j’ai choisi d’étudier en journalisme parce que c’était l’un des quelques diplômes pour lesquels les cours de maths n’étaient pas un prérequis, dit-il en riant. À l’université, un de mes professeurs me poussait à faire une majeure en économie mais je lui disais “Non, je ne veux plus faire de maths!” Aujourd’hui, je ne fais plus que ça!»

En 2014, Chad Skelton a gagné le prix du meilleur portfolio en journalisme de données lors du Global Editors Network Summit à Barcelone. Son travail a un but bien précis: expliquer aux résidents de Vancouver le monde dans lequel ils vivent. Et le journalisme de données lui permet de personnaliser l’information pour chacun de ses lecteurs.

Par exemple, un de ses récents reportages était accompagné d’une carte du taux de vaccination pour la rougeole dans toutes les écoles élémentaires de Vancouver. En travaillant sur les données, il a découvert que la moitié des écoles ont un taux de moins de 90%, pourtant nécessaire pour profiter d’une immunité collective. Les parents inquiets peuvent aller vérifier directement sur la carte le taux dans l’école de leurs enfants.

Pour un autre reportage, il a créé un calculateur en ligne pour aider les Vancouverois à estimer le coût de la nouvelle Congestion Tax. Les lecteurs tapent leur revenu annuel et le site web se charge de faire tous les calculs.

Pas mal pour quelqu’un qui a essayé d’éviter ses cours de maths au secondaire!

Mythe #3: Si vous ne vous codez pas, vous n’êtes qu’un imposteur

Pas besoin de parler en binaire pour analyser des données.

Il y a quatre ans, Leslie Young a rejoint le Data Desk de Global News, à Toronto. Depuis, elle fouille les bases de données publiques, en quête de reportages. Elle n’a pas de compétences en programmation et ça ne l’empêche pas de publier d’impressionnantes histoires d’un grand intérêt public.

Son reportage Crude Awakening retrace plus de 60 000 déversements pétroliers en Alberta, sur une période de 37 ans. «J’ai analysé le tout par compagnie et par emplacement, combien a été déversé, qu’est-ce qui a été déversé, et ainsi de suite, indique la journaliste. J’ai groupé les correspondances et fait des cartes. Sans compétences en analyse de données, ça aurait été impossible.»

Leslie Young a utilisé Microsoft Excel et Microsoft Access pour filtrer et trier les données. Grâce à son analyse, elle a été en mesure de trouver les pires déversements de l’histoire de la province.

[Rectificatif: Leslie Young a rencontré les agriculteurs de Sundre et non ceux de Peace River]

Leslie Young a publié ce qui est probablement l’un des reportages les plus précis et les plus complets sur les déversements pétroliers en Alberta. «Avec des compétences pour manipuler des données, il devient possible de trouver des histoires que les autres n’auront pas, dit-elle. Et si vous avez une base de données publique dans laquelle vous trouvez une tendance, vous avez une preuve que quelque chose se passe. Le gouvernement ne peut pas vous envoyer promener et vous dire “Vous n’avez parlé qu’à deux personnes. Ce sont des cas isolés.” Vous pouvez démontrer qu’il y a une tendance, ce qui vous donne un grand avantage.»

Et tout ça sans une ligne de code!

Mythe #4: Le journalisme de données, c’est juste pour les geeks

Si c’était le cas, Glen McGregor, journaliste sur la colline du Parlement pour le Ottawa Citizen, ne serait jamais devenu l’un des journalistes de données les plus connus au pays!

Les parents de Glen McGregor possédaient un Commodore 64, l’un des premiers ordinateurs personnels. «Au secondaire, j’ai essayé de créer mes propres jeux, comme Space Invaders, se rappelle-t-il. Je me souviens de certains élèves qui étaient beaucoup plus avancés que moi en programmation. Mais c’était des gens avec qui on ne voulait pas être vus, parce que c’était de pauvres types avec une mauvaise hygiène, ajoute-t-il en éclatant de rire. Je ne voulais pas être l’un d’entre eux!»

Mais en 2004, tout change. Alors qu’il est journaliste pour le Ottawa Citizen, Glen McGregor fait une erreur dans un article. Il se retrouve devant les tribunaux. «Une source m’a donné une fausse information. Ça m’a beaucoup ébranlé. J’ai perdu confiance en moi pendant un long moment. Je me suis dit que si un jour j’allais écrire un autre reportage, j’allais être absolument certain d’avoir des documents et des données pour tout contre-vérifier.»

À la même époque, il se rend à un événement de l’Association canadienne des journalistes, à Halifax, où se donne une présentation sur le journalisme de données. C’est une renaissance. Glen McGregor commence alors à apprendre à utiliser des feuilles de calculs, des bases de données et des langages de programmation.

Sept ans plus tard, Glen McGregor publie une série de reportages concernant les appels automatisés de l’élection fédérale de 2011, ce qui lui vaudra l’année suivante le prix Michener pour le journalisme d’intérêt public.

Donc, ne vous inquiétez pas si vous ne vous considérez pas comme un geek. Comme Glen McGregor le démontre si bien, tout ce qu’il faut pour devenir un journaliste de données, c’est de la curiosité, une ouverture d’esprit et la volonté d’apprendre de nouvelles choses.

Mythe #5: Le journalisme de données, c’est le futur

Vous avez sans doute déjà entendu un collègue affirmer que dans quelques années, savoir coder et jongler avec des données sera une condition sine qua none du métier. Selon les journalistes de données eux-mêmes, c’est sans doute exagéré, mais avec tout de même un brin de vérité.

Pour Steve Rennie, directeur de rédaction du journal Métro d’Ottawa et ancien reporter spécialisé en journalisme assisté par ordinateur pour la Presse Canadienne, la prochaine génération de journalistes devra apprendre les bases du journalisme de données.

«Aujourd’hui, on prend pour acquis que les jeunes journalistes savent comment faire de la radio et de la vidéo. Le journalisme de données va être le prolongement de ça. Je pense qu’il est tout à fait possible qu’on attende de la relève qu’elle soit à l’aise avec des bases de données simples et des feuilles de calculs. Selon moi, c’est un outil de plus et il vaut mieux l’avoir dans son sac.»

Toutefois, une chose est claire: le mot le plus important dans journalisme de données restera toujours journalisme. Les données font simplement partie de l’équation.

«C’est fantastique de pouvoir manipuler une base de données, mais il faut quand même être capable de produire un reportage à la fin de la journée, dit Steve Rennie. Le journalisme de données, c’est une partie du processus. Ce n’est pas le but en soi. C’est juste une façon d’arriver à ses fins, de faire du reportage.»

Roberto Rocha, de son côté, est persuadé que le journalisme de données est une spécialité qui a encore de beaux jours devant elle, et dont la valeur sera de plus en plus reconnue à l’avenir.

Stuart Thompson a obtenu un Bac en études des médias à la University of Western Ontario et a appris à coder par lui-même. S’il y a quelqu’un qui sait à quel point des compétences en journalisme de données peuvent être précieuses, c’est bien lui. Ce sont elles qui lui ont ouvert les portes du Globe and Mail en 2010.

«Je me souviens que quand j’étais jeune, j’avais l’habitude de passer devant les bureaux du Globe and Mail, en me disant qu’un jour, peut-être, j’aurais la chance d’y travailler. Puis j’y ai fait un stage. Et finalement j’y ai eu un poste. Je me disais: “Oh mon dieu, c’est extraordinaire!”»

Mais Stuart Thompson n’est pas resté très longtemps à Toronto. Trois ans plus tard, il a déménagé à New York. Il travaille désormais au Wall Street Journal, comme directeur par intérim de l’équipe interactive. «Je n’aurais jamais cru qu’un jour je viendrais ici. C’est complètement fou.»

Son travail consiste à analyser des données et à les présenter de la façon la plus claire et la plus interactive possible aux lecteurs. Par exemple, son travail sur la destruction de la bande de Gaza aide le public à comprendre une situation complexe, souvent bien difficile à expliquer via le journalisme traditionnel.

Maintenant gestionnaire, Stuart Thompson réalise à quel point les journalistes de données sont une espèce rare. «Les compagnies médiatiques n’ont pas besoin de gens avec d’extraordinaire diplôme en sciences informatiques. Elles ont besoin d’employés avec des compétences dans ce domaine, mais aussi avec un sens de la nouvelle et des qualités journalistiques. Il y a en a peu qui possèdent tout ça. On les appelle “les licornes” parce qu’on ne les trouve jamais.»

Tous les journalistes de données à qui nous avons parlé ont indiqué être principalement autodidactes. Et c’est peut-être une des raisons pour lesquels ils sont si peu nombreux. Explorer un nouveau domaine sans l’aide d’un mentor peut s’avérer très difficile.

Cependant, la situation change rapidement pour la prochaine génération de journalistes canadiens. Ces dernières années, plusieurs collèges et universités ont créé des programmes pour enseigner cette spécialité.

Les formations en ligne ouverte à tous (en anglais Massive Open Online Class ou MOOC) prennent aussi de l’ampleur, permettant aux étudiants, professionnels et curieux de découvrir le journalisme de données gratuitement. Le European Journalism Centre a par exemple attiré plus de 6 000 étudiants provenant de 170 pays en 2014, avec son cours Doing journalism with data.

Avec une telle démocratisation dans l’enseignement du journalisme de données, en plus de nombreux logiciels gratuits et ouverts, sans compter le mouvement pour les données ouvertes, il y a fort à parier que le nombre d’adeptes va aller en grandissant.

Et maintenant que les principaux mythes entourant le journalisme de données ont mordu la poussière, qui sait, peut-être que la prochaine licorne, ce sera vous!

À voir aussi:

Luce Julien: «Je vais continuer à inventer le journalisme de demain»

«Les Népalais ne s’épanchent pas beaucoup sur leurs émotions»

Maxime Landry: «Il faut faire confiance à son pif!»

Le journalisme de guerre à l’épreuve du djihadisme

Journalisme: les grands dossiers à surveiller, selon François Bugingo

Simon Van Vliet, nouveau président de l’AJIQ

You may also like...