L'analyse des données par l'IA permet de découvrir des problèmes dans les publications scientifiques
Les rapports de recherche chimique contiennent souvent des données de mesure inexactes
Les outils d'analyse de données alimentés par l'IA ont le potentiel d'améliorer considérablement la qualité des publications scientifiques. Une nouvelle étude réalisée par Mathias Christmann, professeur de chimie à la Freie Universität Berlin, a mis en évidence des lacunes dans les publications chimiques. À l'aide d'un script Python développé avec l'aide de modèles de langage d'IA modernes, Christmann a analysé plus de 3 000 articles scientifiques publiés dans la prestigieuse revue de chimie organique Organic Letters au cours des deux dernières années. L'analyse a révélé que seuls 40 % des articles de recherche chimique contenaient des mesures de masse sans erreur.
L'outil d'analyse de données basé sur l'IA utilisé à cette fin a pu être créé sans aucune connaissance préalable en programmation.
"Les résultats démontrent à quel point les outils basés sur l'IA peuvent être puissants dans la recherche quotidienne. Ils permettent non seulement de rendre accessibles des analyses complexes, mais aussi d'améliorer la fiabilité des données scientifiques", explique M. Christmann. Les modèles avancés de langage étendu tels que ChatGPT (OpenAI), Gemini (Google) et Claude (Anthropic) permettent désormais de traduire le langage naturel directement dans des langages informatiques tels que Python. Cela permet aux chercheurs qui n'ont pas de formation en codage de créer des applications qui, par exemple, recherchent dans de grands ensembles de données des éléments de texte ou des valeurs de mesure spécifiques. Les données ainsi obtenues peuvent ensuite être traitées automatiquement et leur plausibilité vérifiée.
L'étude de Christmann, intitulée "What I Learned from Analyzing Accurate Mass Data of 3000 Supporting Information Files" (Ce que j'ai appris en analysant les données de masse précises de 3 000 fichiers d'information), a utilisé un outil d'analyse de données alimenté par l'IA pour découvrir des erreurs systématiques jusque-là inconnues. Elle a également identifié des cas où des valeurs mal calculées semblaient être validées par des mesures. "Ces observations soulèvent la question de savoir si certaines mesures ont pu être fabriquées", souligne le chercheur.
Cette étude, publiée dans un article en libre accès, montre comment les outils d'IA peuvent renforcer l'intégrité scientifique grâce au contrôle de qualité automatisé et à la détection d'erreurs systématiques.
Dans le cadre d'une initiative "AI in Education", le département de biologie, chimie et pharmacie de l'université libre de Berlin prévoit d'intégrer ces outils et d'autres outils similaires dans son programme d'études. "Ils aideront les étudiants à développer de solides compétences en matière d'analyse de données et de réflexion critique", explique M. Christmann. "Les outils d'IA seront précieux pour préparer les étudiants à leur carrière de chercheur.
Note: Cet article a été traduit à l'aide d'un système informatique sans intervention humaine. LUMITOS propose ces traductions automatiques pour présenter un plus large éventail d'actualités. Comme cet article a été traduit avec traduction automatique, il est possible qu'il contienne des erreurs de vocabulaire, de syntaxe ou de grammaire. L'article original dans Anglais peut être trouvé ici.