Moissonnage du Journal Métro et de Métro Québec

Pour Le Trente, bimestriel de la Fédération professionnelle des journalistes du Québec (FPJQ), j'ai moissonné la totalité du contenu du Journal Métro et de son édition de Québec, Métro Québec, depuis leur renaissance le 1^er octobre 2025.

L'objectif de ce moissonnage était d'analyser la part de l'IA générative dans la production des deux médias en ligne. Au moment de relancer leurs activités, les artisans du journal avaient annoncé qu'ils seraient, à leur connaissance, « la première salle de presse d’une grande ville canadienne à utiliser l’intelligence artificielle pour générer directement une partie du contenu ». 🤖

Après sept mois d'activités, le moment était venu d'examiner cette utilisation.

Moissonner WordPress

Les deux journaux utilisent WordPress comme système de gestion du contenu. WordPress dispose d'une API cachée qui permet d'accéder à des données structurées en JSON sur un article donné. Il suffit de connaître les numéros d'identification unique de chaque article.

Pour s'assurer de moissonner l'ensemble de ce qui a été publié, il suffit de tester tous les numéros possibles à partir d'un numéro de départ correspondant à un article ayant été publié à la date à laquelle on souhaite commencer. Dans ce cas-ci, la date de départ est le 1^er octobre. J'ai donc pris les articles qui annonçaient la relance des activités du Journal Métro et de Métro Québec comme point de départ dans les deux cas.

Dans l'URL de l'article pour l'édition montréalaise, on voit que le numéro d'identification unique est 3202240 :

https://journalmetro.com/actualites/3202240/le-journal-metro-relance-officiellement-ses-activites/

Dans l'URL de l'article pour l'édition de Québec, on voit que le numéro d'identification unique est 395109 :

https://metroquebec.com/actualites/395109/metro-quebec-relance-officiellement-ses-activites/

Cet API caché a la structure suivante :

https://<nom de domaine>/wp-json/wp/v2/posts/<numéro d'idenfication>

Ainsi, pour chacun des articles annonçant le retour en ligne des sites de Métro, on obtient :

Les intervalles considérés pour m'assurer de ne rater aucun article sont :

Dans le cas du Journal Métro (Montréal), de 3202100 à 3213601 (ou 11 000 possibilités)
Dans le cas de Métro Québec, de 395000 à 402351 (ou 7 350 possibilités)

Le script qui accompagne ce répertoire (metro.py) fait donc 18 850 appels aux sites de Métro Média.

Trois types de réponse possibles

En testant tous ces numéros, j'ai obtenu trois réponses différentes.

`404`

Le numéro d'identification n'a jamais été utilisé. C'est le code HTTP de réponse le plus courant que j'aie obtenu, comme ici.

`401`

Le numéro d'identification a déjà été utilisé, mais l'article n'a jamais été publié ou a été retranché. En tous cas, on obtient le code 401, ce qui signifie Forbidden, comme ici.

`200`

Ça marche! Un article en ligne correspond à ce numéro. Je peux en extraire le contenu aux fins de cette recherche, incluant l'image principale utilisée par l'article, car l'IA dans la génération des images est également un enjeu dans la relance de ce média.

Cette image d'une patinoire qui n'existe pas est toujours en ligne sur le site de Métro Québec au moment de mettre ce répertoire en ligne (capture d'écran - 25 mai 2026).

Mon code génère un fichier CSV. Il est accessible dans ce répertoire.

Mais je l'ai modifié ainsi :

J'ai retranché le contenu des articles car, même s'il est en grande partie (plus de le moitié du contenu et des articles ont été rédigés par un « Agent IA »), il est protégé par la Loi sur le droit d'auteur du Canada.
J'ai ajouté une colonne (« mention ia dans texte ») pour signaler les textes qui se terminaient par une mention que le texte a été généré par l'IA. Cette mention est généralement celle-ci : « Cet article a été produit par l’intelligence artificielle et édité par un journaliste. Veuillez consulter notre Politique d’utilisation de l’intelligence artificielle à des fins journalistiques pour en savoir davantage sur nos pratiques concernant l’IA. Pour toute question, contactez Olivier Robichaud, rédacteur en chef, à l’adresse orobichaud@journalmetro.com. »

Name		Name	Last commit message	Last commit date
Latest commit History 13 Commits
LICENSE		LICENSE
README.md		README.md
articlesMetro_pourGithub.csv		articlesMetro_pourGithub.csv
metro.py		metro.py
patinoireSteFouilleOuilleOuille.png		patinoireSteFouilleOuilleOuille.png

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Moissonnage du Journal Métro et de Métro Québec

Moissonner WordPress

Trois types de réponse possibles

`404`

`401`

`200`

Cette image d'une patinoire qui n'existe pas est toujours en ligne sur le site de Métro Québec au moment de mettre ce répertoire en ligne (capture d'écran - 25 mai 2026).

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Moissonnage du Journal Métro et de Métro Québec

Moissonner WordPress

Trois types de réponse possibles

404

401

200

Cette image d'une patinoire qui n'existe pas est toujours en ligne sur le site de Métro Québec au moment de mettre ce répertoire en ligne (capture d'écran - 25 mai 2026).

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

`404`

`401`

`200`

Packages