Des solutions innovantes pour relever les défis de la chimie : exploiter le potentiel de l'apprentissage automatique
Au cours de la dernière décennie, l'apprentissage automatique et l'intelligence artificielle (IA) ont fait des progrès remarquables, nous rapprochant de la réalisation de machines intelligentes. L'avènement des méthodes d'apprentissage en profondeur et l'amélioration des capacités de stockage des données ont joué un rôle essentiel dans ces progrès. L'apprentissage profond a déjà fait ses preuves dans des domaines tels que la reconnaissance d'images et de la parole, et il suscite aujourd'hui une grande attention dans le domaine de la chimie, qui se caractérise par des données complexes et diverses molécules organiques.
Cependant, les chimistes sont souvent confrontés à des difficultés dans l'adoption des applications de ML en raison d'un manque de familiarité avec les algorithmes modernes de ML. Les ensembles de données chimiques présentent généralement un biais en faveur des expériences réussies, alors qu'une perspective équilibrée nécessite l'inclusion d'expériences réussies et d'expériences ratées. En outre, la documentation incomplète des conditions de synthèse dans la littérature pose des problèmes supplémentaires. La chimie computationnelle, où les ensembles de données peuvent être construits de manière fiable à partir de calculs de mécanique quantique, a adopté plus facilement les applications de ML. Néanmoins, les chimistes ont besoin d'une compréhension de base de la ML pour exploiter le potentiel de l'enregistrement des données et des expériences guidées par la ML.
Cette revue sert de guide d'introduction aux bases de données chimiques les plus courantes, aux caractéristiques bidimensionnelles (2D) et tridimensionnelles (3D) utilisées dans les modèles de ML et aux algorithmes de ML les plus courants. Elle se penche sur trois domaines spécifiques de la chimie où la ML a fait des progrès significatifs : la rétrosynthèse en chimie organique, la simulation atomique basée sur le potentiel ML et la ML pour la catalyse hétérogène. Ces applications ont soit accéléré la recherche, soit apporté des solutions innovantes à des problèmes complexes. L'étude se termine par une discussion sur les défis futurs dans ce domaine.
Les progrès rapides des installations informatiques et le développement de nouveaux algorithmes de ML indiquent que des applications de ML encore plus passionnantes se profilent à l'horizon, promettant de remodeler le paysage de la recherche chimique à l'ère de la ML. Bien qu'il soit difficile de prédire l'avenir dans un domaine qui évolue aussi rapidement, il est indéniable que le développement de modèles de ML permettra d'améliorer l'accessibilité, la généralité, la précision, l'intelligence et, en fin de compte, la productivité. L'intégration des modèles de ML à l'internet offre une voie prometteuse pour le partage des prédictions de ML dans le monde entier.
Cependant, la transférabilité des modèles de ML en chimie pose un défi commun en raison de la diversité des types d'éléments et de la complexité des matériaux concernés. Les prédictions restent souvent limitées à des ensembles de données locaux, ce qui entraîne une diminution de la précision au-delà de l'ensemble de données. Pour résoudre ce problème, de nouvelles techniques telles que le potentiel du réseau neuronal global (G-NN) et des modèles ML améliorés avec des paramètres plus adaptés sont explorés. Alors que les concours de ML en science des données ont produit des algorithmes exceptionnels, il est nécessaire d'organiser davantage de concours ouverts de ML en chimie afin de favoriser l'éclosion de jeunes talents.
L'apprentissage de bout en bout, qui génère des résultats finaux à partir d'entrées brutes plutôt que de descripteurs conçus, est prometteur pour des applications de ML plus intelligentes. AlphaFold2, par exemple, utilise la structure unidimensionnelle (1D) d'une protéine pour prédire sa structure 3D. De même, dans le domaine de la catalyse hétérogène, un modèle d'IA de bout en bout a permis de résoudre avec succès des voies de réaction. Ces modèles avancés de ML peuvent également contribuer au développement de robots expérimentaux intelligents pour les expériences à haut débit.
Le domaine de l'intelligence artificielle continuant d'évoluer rapidement, il est crucial pour les chimistes et les chercheurs de rester informés de ses applications en chimie. Cette revue constitue une ressource précieuse, car elle fournit une vue d'ensemble complète des bases de la ML et de son potentiel dans divers domaines de la chimie. Grâce à l'intégration des modèles de ML et aux efforts collectifs de la communauté scientifique, l'avenir de la recherche en chimie est extrêmement prometteur.
Note: Cet article a été traduit à l'aide d'un système informatique sans intervention humaine. LUMITOS propose ces traductions automatiques pour présenter un plus large éventail d'actualités. Comme cet article a été traduit avec traduction automatique, il est possible qu'il contienne des erreurs de vocabulaire, de syntaxe ou de grammaire. L'article original dans Anglais peut être trouvé ici.