IA et découvrabilité scientifique :

enjeux pour la francophonie​

Jeudi 30 avril 2026

UQAM, Montréal (Québec), Canada

– ÉVÉNEMENT HYBRIDE –

Infrastructures et outils pour la découvrabilité

de 11h05 à 12h05

11h05 - 11h25 | Limites, défis et solutions : la vérification factuelle et la découvrabilité
Ophélie Dénommée-Marchand – Journaliste indépendante

On ne peut pas découvrir ce qui n’est pas produit, et l’implantation de salles de vérification factuelle francophones traîne de la patte au pays. La nécessité d’assurer la vérification de faits s’est pourtant accentuée dans les années récentes. Peu de journalistes sont professionnellement bilingues au Canada, les budgets se resserrent et les salles rétrécissent – si elles ne ferment pas -, les enjeux pour les journalistes se multiplient avec la dégradation de la qualité des moteurs de recherche, entre autres. Disséminer des faussetés est peu coûteux et peut s’avérer très rentable, tandis que la vérification journalistique est freinée par son manque de rentabilité. Il est généralement reconnu que la manipulation des faits est l’un des grands défis ultracontemporains. Plusieurs chercheurs éminents présentent l’IA comme une solution viable à la lutte contre la désinformation. Ce qui n’est pas rapporté journalistiquement peut-il vraiment exister? Les biais des salles de nouvelles s’imbriquent-ils aux biais des machines, et vice versa? La machine peut-elle vraiment remplacer l’humain? Quelles sont ses limites, et quelles sont ses vulnérabilités contre les acteurs malveillants? Et, surtout, quels sont les défis à surmonter pour la vérification de faits francophone au Canada, et de manière plus générale? Est-il souhaitable pour les journalistes d’être financièrement sous la tutelle de compagnies technologiques ou du gouvernement, à une ère de montée observable des autoritarismes propulsés par les technologies? Peut-on s’inspirer de modèles ailleurs pour trouver des solutions ici?

Présenté par
Ophélie Dénommée-Marchand est une journaliste indépendante bilingue spécialisée en vérification, recherche et enquête. Vérificatrice de faits et recherchiste pour Lead Stories, elle a cumulé plusieurs années d’expérience avec cette importante salle de vérification factuelle basée aux États-Unis, membre signataire de l’International Fact-Checking Network. Elle a notamment fait partie des programmes de vérification de faits indépendante de tierce partie de Meta et TikTok, entre 2021 et 2025.
11h25 - 11h45 | Gouvernance des données de recherche et découvrabilité : défis à l’ère de l’IA
Jean-Philippe Carlos – Université de Sherbrooke (UdeS)

La mise en œuvre de la Politique des trois organismes sur la gestion des données de recherche (GDR) dans les universités canadiennes s’inscrit dans un contexte marqué par la science ouverte et l’essor des systèmes d’intelligence artificielle, dont le fonctionnement repose sur des données structurées, documentées et interopérables. Dans ce cadre, la découvrabilité des données devient un enjeu central, tant pour leur réutilisation scientifique que pour leur intégration dans des environnements algorithmiques. Toutefois, la littérature souligne que l’opérationnalisation des services de GDR demeure confrontée à des défis importants, notamment en matière d’appropriation par les chercheurs, d’intégration institutionnelle et d’usage des infrastructures.

Cette communication propose de déplacer le regard en considérant la GDR non seulement comme un enjeu de conformité, mais comme une infrastructure critique conditionnant la visibilité des données dans les écosystèmes d’intelligence artificielle. Elle soutient que les difficultés d’opérationnalisation observées ont des effets directs sur la capacité des systèmes d’IA à repérer et mobiliser les données, contribuant à renforcer certaines inégalités de visibilité, notamment pour les contenus francophones.

Trois dimensions sont mises en évidence : le décalage entre discours et pratiques, la fragmentation des services et des outils, et un encadrement institutionnel centré sur la conformité plutôt que sur la découvrabilité et la qualité des métadonnées. Cette analyse invite à reconsidérer la GDR comme un levier structurant, encore insuffisamment développé, de la visibilité scientifique à l’ère des systèmes algorithmiques.

Présenté par

Jean-Philippe Carlos travaille comme conseiller en gestion des données de recherche au Service d’appui à la recherche, à la création et à l’innovation de l’Université de Sherbrooke depuis 2022. Titulaire d’une maîtrise et d’un doctorat en histoire de l’Université de Sherbrooke (2015 et 2020), il a également effectué un stage postdoctoral à l’Université York de Toronto (2020-2023). Il complète actuellement une maîtrise en sciences de l’information à l’Université de Montréal, sous la direction de Vincent Larivière. Il s’intéresse à l’histoire des idées et des revues, à l’édition scientifique en milieu francophone, aux enjeux de la science ouverte ainsi qu’à la gouvernance universitaire.

11h45 - 12h05 | Diffusion des techniques d’apprentissage automatique dans les disciplines scientifiques (1990–2025)
Malena Méndez Isla – Université de Montréal (UdeM)
Diego Kozlowski – Université de Montréal (UdeM)
Vincent Larivière – Université de Montréal (UdeM)

L’intelligence artificielle (IA) transforme profondément la pratique scientifique. Alors que les avancées récentes des grands modèles de langage marquent un tournant, l’apprentissage automatique (AA) s’inscrit dans une trajectoire de développement de long terme au sein des sciences. Cette présentation analyse l’évolution de l’apprentissage automatique dans la science mondiale de 1990 à 2025, en examinant 4,9 millions d’articles issus d’OpenAlex. En s’appuyant sur une taxonomie de 252 techniques et architectures de AA, nous avons observé que, malgré l’essor fulgurant de l’apprentissage profond après 2015 et des grands modèles de langage après 2022, les méthodes établies, telles que les régressions linéaires et logistiques, ont vu leur part dans la production scientifique totale diminuer. En utilisant des embeddings (mE5) et de la réduction de dimensionnalité (UMAP), nous avons construit l’espace sémantique de l’apprentissage automatique. Celui-ci révèle une structure centrale dominée par les sciences physiques, tandis que l’informatique agit comme le principal pilier méthodologique et l’ingénierie stimule les applications pratiques. Les sciences de la santé, portées par la médecine, constituent la deuxième plus grande extension du domaine des techniques de l’apprentissage automatique.

Présenté par

Malena Méndez Isla est doctorante en sciences sociales à l’Universidad Nacional de La Plata (UNLP), en Argentine, et doctorante invitée à la Chaire UNESCO sur la science ouverte à l’Université de Montréal. Elle est spécialisée en bibliométrie et en sciences sociales computationnelles. Son parcours académique comprend une licence en sociologie à l’UNLP, ainsi qu’une formation en sociologie des sciences et en science de la science. Elle est actuellement professeure dans le diplôme en science des données à l’Universidad Nacional de La Plata. Ses recherches doctorales portent sur l’intelligence artificielle dans la science.