Un algorithme évolutionnaire génère des "empreintes moléculaires" sur mesure
Une équipe de chercheurs met au point une méthode améliorée pour expliquer les prédictions des machines concernant les réactions chimiques
Pour utiliser l'apprentissage automatique, les chercheurs doivent d'abord convertir les molécules en une forme lisible par l'ordinateur. De nombreux groupes de recherche se sont déjà attaqués à ce problème, et il existe donc différentes manières d'effectuer cette tâche. Cependant, il est difficile de prédire laquelle des méthodes disponibles est la mieux adaptée pour répondre à une question spécifique - par exemple, pour déterminer si un composé chimique est nocif pour l'homme. Le nouvel algorithme est conçu pour aider à trouver l'empreinte moléculaire optimale dans chaque cas. Pour ce faire, l'algorithme sélectionne progressivement les empreintes moléculaires qui obtiennent les meilleurs résultats dans la prédiction à partir de nombreuses empreintes moléculaires générées de manière aléatoire. "En suivant l'exemple de la nature, nous utilisons des mutations, c'est-à-dire des changements aléatoires des composants individuels des empreintes, ou nous recombinons les composants de deux empreintes", explique Felix Katzenburg, doctorant.
"Dans d'autres études, les molécules sont souvent décrites par des propriétés quantifiables qui ont été sélectionnées et calculées par des humains", ajoute Frank Glorius. "Comme l'algorithme que nous avons développé identifie automatiquement les structures moléculaires pertinentes, il n'y a pas de biais systématiques causés par les experts humains. Autre avantage, la méthode d'encodage permet de comprendre pourquoi un modèle fait une certaine prédiction. Par exemple, il est possible de tirer des conclusions sur les parties d'une molécule qui ont un impact positif ou négatif sur la prédiction du déroulement d'une réaction, ce qui permet aux chercheurs de modifier les structures pertinentes de manière ciblée.
L'équipe de Münster a constaté que sa nouvelle méthode ne permettait pas toujours d'obtenir les résultats les plus optimaux. "Lorsqu'une expertise humaine considérable a été utilisée pour sélectionner des propriétés moléculaires particulièrement pertinentes ou que de très grandes quantités de données sont disponibles, d'autres méthodes telles que les réseaux neuronaux ont parfois l'avantage", reconnaît Felix Katzenburg. Toutefois, l'un des principaux objectifs de l'étude était de mettre au point une méthode d'encodage des molécules qui puisse être appliquée à n'importe quel ensemble de données moléculaires et qui ne nécessite pas de connaissances spécialisées sur les relations sous-jacentes.
Note: Cet article a été traduit à l'aide d'un système informatique sans intervention humaine. LUMITOS propose ces traductions automatiques pour présenter un plus large éventail d'actualités. Comme cet article a été traduit avec traduction automatique, il est possible qu'il contienne des erreurs de vocabulaire, de syntaxe ou de grammaire. L'article original dans Anglais peut être trouvé ici.