Un chatbot met la chimie computationnelle à la portée des non-experts
Un nouvel outil transforme le processus complexe de simulation de molécules en solution en un chat convivial
Les logiciels de calcul avancés rationalisent la recherche en chimie quantique en automatisant de nombreux processus de simulation moléculaire. Toutefois, la complexité de ces logiciels limite souvent leur utilisation aux chimistes théoriciens formés aux techniques informatiques spécialisées. Une nouvelle plateforme web développée à l'université Emory permet de surmonter cette limitation grâce à un chatbot convivial.

Les chercheurs espèrent que leur travail de pionnier pour démocratiser la recherche en chimie computationnelle inspirera des initiatives similaires dans l'ensemble des sciences naturelles.
Liu Group
Le chatbot guide les non-spécialistes à travers un processus en plusieurs étapes permettant de mettre en place des simulations moléculaires et de visualiser des molécules en solution. Il permet à n'importe quel chimiste - y compris les étudiants en chimie de premier cycle - de configurer et d'exécuter des simulations complexes de mécanique quantique par l'intermédiaire d'un chatbot.
La plateforme gratuite et accessible au public - connue sous le nom d'AutoSolvateWeb - fonctionne principalement sur une infrastructure en nuage, ce qui élargit encore l'accès à des outils de recherche informatique sophistiqués.
La revue Chemical Science a publié une preuve de concept pour AutoSolvateWeb, qui marque une étape importante dans l'intégration de l'IA dans l'enseignement et la recherche scientifique.
AutoSolvateWeb permet d'établir des simulations pour un produit chimique particulier à dissoudre (un soluté) et une substance dans laquelle le dissoudre (un solvant), ce qui donne une solution (un solvate).
Les simulations sont présentées sous la forme de films en 3D.
"C'est un peu comme un microscope, qui vous donne une vue au niveau atomique des molécules interagissant dans une solution", explique Fang Liu, professeur adjoint de chimie à l'université Emory, qui a dirigé le développement d'AutoSolvateWeb.
La grande accessibilité d'AutoSolvateWeb en fait un outil précieux pour créer de vastes ensembles de données de haute qualité sur le comportement des molécules en solution. Ces ensembles de données constituent une base pour l'application de techniques d'apprentissage automatique afin de stimuler les innovations dans tous les domaines, des énergies renouvelables à la santé humaine.
"Notre objectif est d'accélérer la découverte scientifique", explique Fangning Ren, coauteur de l'article de Chemical Science et doctorant en chimie à l'université Emory.
Rohit Gadde, ancien spécialiste de la recherche à l'université Emory, est le premier auteur de l'article. Les autres coauteurs sont Lechen Dong, étudiant diplômé en chimie à l'université Emory, Yao Wang, professeur adjoint de chimie à l'université Emory, Sreelaya Devaguptam, ancien chercheur invité à l'université Emory, et Rajat Mittal, ancien assistant de recherche diplômé à l'université de Clemson.
Automatiser des tâches complexes
Chimiste théoricien, Liu dirige une équipe spécialisée dans la chimie computationnelle, notamment la modélisation et le décryptage des propriétés moléculaires et des réactions en phase de solution.
Avant d'exécuter un programme de chimie quantique pour une molécule en solution, il est nécessaire de déterminer la géométrie de la molécule de soluté ainsi que l'emplacement et l'orientation des molécules de solvant environnantes par le biais d'une simulation moléculaire. Le processus de mise en place et d'exécution de ces simulations est compliqué et prend du temps, ce qui limite la fréquence à laquelle les chercheurs peuvent effectuer de tels calculs.
En 2022, le groupe de Liu a mis au point un moyen d'automatiser bon nombre de ces calculs grâce à un système baptisé AutoSolvate. Ce système a permis de réduire les lignes de code qu'un chimiste informaticien doit entrer dans un superordinateur pour exécuter une simulation, de centaines de lignes à quelques lignes seulement.
Outre l'interface en ligne de commande destinée aux chimistes théoriciens plus expérimentés, AutoSolvate comprenait une interface graphique intuitive adaptée aux étudiants de troisième cycle qui apprennent à effectuer des simulations.
AutoSolvateWeb s'appuie sur cette base.
Élargir l'accès
En fonctionnant principalement sur une infrastructure en nuage, AutoSolvateWeb surmonte les difficultés liées à la configuration du matériel, ce qui aplanit encore la courbe d'apprentissage de la recherche informatique sophistiquée. Le chatbot communique en langage naturel plutôt qu'en code informatique en amont, tandis qu'AutoSolvateWeb automatise les processus logiciels en aval.
"Les chimistes peuvent passer moins de temps à apprendre à écrire du code informatique, ce qui leur permet de concentrer davantage leurs efforts sur les problèmes spécifiques qu'ils souhaitent résoudre", explique M. Liu. "Nous voulons également permettre aux étudiants d'effectuer eux-mêmes des simulations afin qu'ils puissent mieux comprendre la dynamique des molécules en solution.
Plutôt qu'un chatbot à grand modèle de langage (LLM), comme ChatGPT, le chatbot AutoSolvateWeb est principalement basé sur des règles. Il ne converse pas comme un véritable humain sur toute une série de sujets, mais il est axé sur des tâches spécifiques, à l'instar des chatbots utilisés pour les services à la clientèle tels que les services bancaires en ligne.
Le chatbot invite l'utilisateur à taper le nom d'une molécule intéressante, comme la caféine, puis à sélectionner un solvant dans lequel dissoudre la caféine, comme l'eau. Le système exploite les données de PubChem, la plus grande collection au monde d'informations chimiques en ligne librement accessibles, rassemblée par les National Institutes of Health (Instituts nationaux de la santé).
Le chatbot guide l'utilisateur pas à pas dans l'environnement en nuage, en intégrant de manière transparente plusieurs logiciels libres nécessaires au flux de travail. Une fois que tous les paramètres appropriés ont été calculés par le processus automatisé, AutoSolvateWeb soumet les résultats à un superordinateur de la National Science Foundation pour créer la simulation.
Le superordinateur renvoie un fichier de trajectoire. L'utilisateur peut télécharger ce fichier et utiliser un logiciel libre pour le transformer en un film 3D de la simulation demandée.
Voir, c'est croire - et comprendre
AutoSolvateWeb est sur le point d'améliorer la façon dont la chimie est enseignée.
"Les ordinateurs devenant de plus en plus puissants, ils prennent de plus en plus d'importance dans la recherche scientifique", explique M. Ren. "Les étudiants en chimie de premier cycle doivent se familiariser avec les simulations informatiques afin de pouvoir suivre les progrès de la recherche.
Il cite le solvatochromisme, une technique permettant d'analyser la composition des produits chimiques dans un liquide, comme exemple de la puissance des simulations informatiques pour l'enseignement.
Les étudiants de premier cycle apprennent généralement le solvatochromisme dans le cadre d'expériences de laboratoire en dissolvant un soluté connu sous le nom de colorant de Riechart dans différents solvants. La solution devient bleue, rouge, verte ou jaune en fonction de la façon dont les molécules du soluté absorbent la lumière.
L'explication la plus simple de ce phénomène est que les variations de couleur sont dues aux variations de polarité d'un solvant. Les changements de polarité stabilisent différemment l'état fondamental d'une molécule, ce qui affecte le pic d'absorption d'une molécule le long de la longueur d'onde de la lumière.
Les exceptions à cette règle sont plus difficiles à expliquer. Parfois, des solvants de polarités similaires produisent des couleurs différentes en raison de la façon dont les liaisons hydrogène se forment entre le soluté et le solvant.
"Pour bien comprendre comment la liaison hydrogène joue un rôle particulier dans cette situation, les étudiants doivent procéder à une simulation informatique", explique M. Liu. "Voir, c'est croire. Il faut regarder directement la structure en mouvement pour comprendre les choses à l'échelle microscopique".
Ces visualisations détaillées aident les élèves à apprendre à penser de manière critique, dit-elle, afin qu'ils puissent aller au-delà de la mémorisation des concepts dans les manuels et faire et analyser leurs propres découvertes.
"En science, nous ne voulons pas seulement comprendre ce qui se passe", ajoute Ren. "Nous voulons savoir pourquoi cela se produit.
Petites molécules, grandes données
Liu et ses collègues s'efforcent à présent d'élargir la gamme des systèmes chimiques qu'AutoSolvateWeb peut simuler, en dépassant des limites telles que l'utilisation d'une seule molécule organique comme soluté. Ils améliorent également la capacité de la plateforme non seulement à générer des données, mais aussi à les stocker et à les échanger librement avec la communauté des chimistes dans un format open-source.
Les chercheurs espèrent que leur travail de pionnier pour démocratiser la recherche en chimie computationnelle inspirera des initiatives similaires dans l'ensemble des sciences naturelles. Leur objectif ultime, explique Ren, est d'aider à connecter l'IA à divers domaines de la science fondamentale, en renforçant le pouvoir de la recherche interdisciplinaire.
Note: Cet article a été traduit à l'aide d'un système informatique sans intervention humaine. LUMITOS propose ces traductions automatiques pour présenter un plus large éventail d'actualités. Comme cet article a été traduit avec traduction automatique, il est possible qu'il contienne des erreurs de vocabulaire, de syntaxe ou de grammaire. L'article original dans Anglais peut être trouvé ici.