IA scientifique : accélérateur de découvertes ou machine à produire de la certitude fragile ?

L’IA entre dans le laboratoire, mais pas encore au banc des auteurs

L’intelligence artificielle n’est plus seulement un outil de tri bibliographique ou de correction de style. Elle intervient désormais dans la prédiction de structures moléculaires, la découverte de matériaux, l’analyse de données expérimentales, la génération d’hypothèses et la rédaction de manuscrits. C’est cette montée en puissance que ScienceNet met en scène dans son article intitulé 你的AI科研“搭子”靠谱吗？, que l’on peut traduire par : votre compagnon IA de recherche est-il fiable ?

La source est importante : ScienceNet est un média scientifique institutionnel chinois, proche de l’écosystème académique national. Elle donne accès à des voix de chercheurs et d’institutions chinoises, notamment autour de plateformes nationales d’IA scientifique, mais elle porte aussi un biais possible de valorisation des politiques publiques et des infrastructures chinoises. Son intérêt est donc moins de clore le débat que de montrer comment les milieux de recherche organisés s’approprient le thème : l’IA y est présentée comme un levier de productivité, à condition de rester sous contrôle humain.

Le moment est révélateur. Selon 404 Media et TechCrunch, arXiv durcit désormais sa réponse aux soumissions contenant des traces évidentes d’usage non vérifié de grands modèles de langage : références hallucinéés, commentaires résiduels adressés au chatbot, tableaux présentés comme illustratifs ou résultats non remplacés par de vraies données. Thomas Dietterich, président de la section informatique d’arXiv, a indiqué qu’une telle preuve pouvait entraîner une interdiction d’un an, suivie d’une obligation de faire accepter les soumissions ultérieures par une revue ou conférence évaluée par les pairs. Ce n’est pas une interdiction générale de l’IA ; c’est une sanction de la délégation irresponsable.

La promesse : accélérer l’espace des possibles

Il serait trompeur de réduire l’IA scientifique à la fraude ou au bruit. Les avancées les plus solides sont réelles. AlphaFold 3, publié dans Nature par Google DeepMind et Isomorphic Labs, illustre la capacité des modèles à prédire non seulement des structures de protéines, mais aussi des interactions biomoléculaires impliquant ADN, ARN, ligands ou ions. Dans les matériaux, Google DeepMind a présenté GNoME, un système ayant généré des millions de structures cristallines candidates, avec un sous-ensemble prédit comme stable. Le Lawrence Berkeley National Laboratory et ses partenaires ont aussi décrit A-Lab, laboratoire autonome combinant calcul, robotique et apprentissage actif pour accélérer la synthèse de matériaux inorganiques.

Ces exemples expliquent l’enthousiasme : dans des domaines où l’espace de recherche est immense, l’IA peut réduire le coût de l’exploration. Elle ne remplace pas l’expérience, mais elle peut mieux orienter les essais. Elle peut signaler une molécule prometteuse, proposer une structure candidate ou repérer une corrélation faible dans un corpus que l’humain ne pourrait pas parcourir manuellement.

C’est précisément ce que souligne l’article de ScienceNet : l’IA est utile dans les tâches répétitives, calculatoires ou combinatoires, par exemple lorsqu’il faut classer, rapprocher, compléter ou filtrer des masses de données. Dans cette vision, la nouvelle division du travail est claire : l’IA absorbe la largeur, l’humain garde la profondeur.

La limite : prédire n’est pas comprendre

Le danger commence lorsque la prédiction est confondue avec l’explication. Un modèle peut fournir une réponse statistiquement convaincante sans posséder de compréhension causale. En science, cela pose un problème central : une hypothèse n’est pas seulement une phrase plausible, c’est une proposition testable, située dans un cadre théorique, accompagnée d’un protocole et exposée à la réfutation.

Les modèles génératifs, eux, excellent dans la forme de la connaissance : résumés fluides, phrases bien balancées, références qui semblent crédibles. Mais Nature a documenté le problème des hallucinations, notamment à travers des travaux sur l’entropie sémantique : un modèle peut produire des affirmations erronées avec une assurance linguistique qui trompe l’utilisateur. Dans la littérature scientifique, cette faiblesse devient particulièrement toxique quand elle touche les citations. Nature rapportait en 2026 que des analyses avaient identifié plus de 140 000 fausses citations dans des articles et prépublications de 2025 sur plusieurs dépôts.

Cette pollution bibliographique n’est pas un détail administratif. Les citations sont l’ossature de la science cumulative. Une référence inexistante ou déformée peut être reprise, indexée, citée à son tour et finir par donner l’apparence d’un consensus. Le risque n’est donc pas seulement l’erreur ponctuelle ; c’est la contamination lente de l’infrastructure de preuve.

arXiv trace une frontière institutionnelle

La décision d’arXiv s’inscrit dans un mouvement plus large. En octobre 2025, arXiv avait déjà resserré les règles pour les articles de synthèse et de position en informatique : ces textes doivent désormais avoir été acceptés par une revue ou une conférence avec évaluation par les pairs avant d’être considérés. La plateforme expliquait recevoir des centaines de revues chaque mois, souvent réduites à des bibliographies annotées sans réelle discussion des questions ouvertes.

Cette nuance est essentielle : arXiv ne bannit pas la recherche assistée par IA, ni même les prépublications en informatique. Elle tente de protéger une fonction précise : permettre une diffusion rapide de travaux scientifiques originaux, sans devenir un entrepôt de textes produits à bas coût. À l’ère des LLM, le problème n’est plus la rareté de la publication, mais l’abondance non vérifiée.

Le tournant récent va plus loin, car il rattache la qualité du manuscrit à la responsabilité de l’auteur. Si un papier contient une trace manifeste de copier-coller depuis un chatbot, ce n’est pas seulement une erreur de style : c’est un signal que les auteurs n’ont peut-être pas vérifié le reste. Dans un système fondé sur la confiance minimale, cette négligence devient structurante.

Les revues convergent : l’IA n’est pas responsable, l’humain l’est

Les politiques éditoriales vont dans le même sens. L’ICMJE, référence majeure dans l’édition médicale, précise que les auteurs doivent déclarer l’usage d’outils d’IA et que les chatbots ne peuvent pas être listés comme auteurs, car ils ne peuvent pas assumer la responsabilité de l’exactitude, de l’intégrité et de l’originalité du travail. Nature Portfolio suit une logique comparable : un LLM ne satisfait pas aux critères d’auteur, et son usage doit être documenté lorsqu’il dépasse la simple correction linguistique. Wiley insiste aussi sur le fait que l’IA doit rester un outil supplémentaire, non un substitut à l’expertise et au jugement.

Cette convergence établit une règle de fond : la transparence n’est pas cosmétique. Dire qu’un outil a été utilisé, pour quoi faire, avec quelle vérification humaine et sur quelles données devient une composante de la méthode scientifique. Dans certains cas, l’absence de déclaration pourrait être traitée comme un manquement à l’intégrité.

Le risque épistémique : automatiser la confiance

Le plus grand danger n’est pas que l’IA fasse des erreurs. Les humains en font aussi. Le danger est que l’IA produise des erreurs à grande échelle, avec une forme assez crédible pour passer les filtres superficiels, puis que d’autres IA les réutilisent. La Harvard Kennedy School Misinformation Review a déjà analysé des publications probablement fabriquées avec des outils GPT et retrouvées dans Google Scholar. Le problème tient à la visibilité : un faux papier bien indexé peut côtoyer une étude rigoureuse dans le même moteur académique.

C’est ici que la notion de partenaire de recherche doit être maniée avec prudence. Un partenaire peut contester, expliquer ses raisons, reconnaître son ignorance, signer et répondre. Une IA, elle, calcule une sortie. Elle peut assister une équipe, mais elle ne porte ni responsabilité morale, ni responsabilité juridique, ni responsabilité scientifique.

Ce que cela change pour l’avenir

La trajectoire probable n’est ni l’interdiction de l’IA en science, ni son adoption sans garde-fous. Les laboratoires vont plutôt vers une normalisation : cahiers de laboratoire documentant les prompts, traçabilité des versions de modèles, vérification systématique des citations, séparation claire entre aide rédactionnelle et production de résultats, audits de données et exigences de reproductibilité.

Les meilleurs usages seront sans doute hybrides. En biologie structurale, l’IA proposera des modèles, mais l’expérimentation devra valider. En science des matériaux, elle réduira le champ des candidats, mais la synthèse et la caractérisation resteront décisives. Dans la rédaction, elle pourra clarifier, traduire, résumer ; elle ne devra pas inventer la contribution intellectuelle.

Le message à retenir est pédagogique : l’IA peut accélérer la recherche, mais elle n’augmente pas automatiquement la vérité. Elle déplace le travail critique. Moins de temps passé à chercher une aiguille dans une botte de foin ; plus de temps à vérifier que l’aiguille existe vraiment. Pour les chercheurs, la compétence clé ne sera donc pas seulement de savoir utiliser l’IA, mais de savoir où ne pas lui faire confiance.