Utilisation de l'apprentissage automatique pour améliorer l'évaluation de la toxicité des produits chimiques

Les chimistes adoptent une nouvelle approche pour tester les produits chimiques

30.12.2022 - Pays-Bas

Des chercheurs de l'Université d'Amsterdam, avec des collègues de l'Université du Queensland et de l'Institut norvégien de recherche sur l'eau, ont développé une stratégie pour évaluer la toxicité des produits chimiques à l'aide de l'apprentissage automatique. Ils présentent leur approche dans un article paru dans Environmental Science & Technology pour le numéro spécial "Data Science for Advancing Environmental Science, Engineering, and Technology". Les modèles développés dans cette étude peuvent apporter des améliorations substantielles par rapport aux évaluations "in silico" classiques basées sur la modélisation des relations quantitatives structure-activité (QSAR).

Computer-generated image

Image symbolique

Selon les chercheurs, l'utilisation de l'apprentissage automatique peut améliorer considérablement l'évaluation du danger des molécules, tant pour le développement de nouveaux produits chimiques en toute sécurité que pour l'évaluation des produits chimiques existants. L'importance de ce dernier point est illustrée par le fait que les agences européennes et américaines de l'industrie chimique ont répertorié environ 800 000 substances chimiques qui ont été développées au fil des ans mais pour lesquelles il n'existe que peu ou pas de connaissances sur le devenir ou la toxicité dans l'environnement.

Étant donné qu'une évaluation expérimentale du devenir et de la toxicité des produits chimiques exige beaucoup de temps, d'efforts et de ressources, des approches de modélisation sont déjà utilisées pour prédire les indicateurs de danger. En particulier, la modélisation de la relation quantitative structure-activité (QSAR) est souvent appliquée, reliant les caractéristiques moléculaires telles que l'arrangement atomique et la structure 3D aux propriétés physicochimiques et à l'activité biologique. Sur la base des résultats de la modélisation (ou des données mesurées lorsqu'elles sont disponibles), les experts classent une molécule dans des catégories telles que définies par exemple dans le système général harmonisé de classification et d'étiquetage des produits chimiques (SGH). Pour des catégories spécifiques, les molécules font ensuite l'objet de recherches plus approfondies, d'une surveillance plus active et finalement d'une législation.

Toutefois, ce processus présente des inconvénients inhérents, dont la plupart sont liés aux limites des modèles QSAR. Ils sont souvent basés sur des ensembles d'apprentissage très homogènes et supposent une relation structure-activité linéaire pour effectuer des extrapolations. Par conséquent, de nombreuses substances chimiques ne sont pas bien représentées par les modèles QSAR existants et leur utilisation peut potentiellement conduire à des erreurs de prédiction substantielles et à une mauvaise classification des substances chimiques.

Sauter la prédiction QSAR

Dans l'article publié dans la revue Environmental Science & Technology, le Dr Saer Samanipour et ses coauteurs proposent une autre stratégie d'évaluation qui permet de sauter l'étape de la prédiction QSAR. M. Samanipour, spécialiste de l'analyse environnementale à l'Institut Van 't Hoff des sciences moléculaires de l'université d'Amsterdam, a fait équipe avec Mme Antonia Praetorius, chimiste environnementale à l'Institut de la biodiversité et de la dynamique des écosystèmes de la même université. Avec des collègues de l'université du Queensland et de l'Institut norvégien de recherche sur l'eau, ils ont mis au point une stratégie fondée sur l'apprentissage automatique pour la classification directe de la toxicité aquatique aiguë des produits chimiques sur la base de descripteurs moléculaires.

Le modèle a été mis au point et testé à l'aide de 907 données obtenues expérimentalement pour la toxicité aiguë pour les poissons (valeurs LC50 après 96 heures). Le nouveau modèle évite la prédiction explicite d'une valeur de toxicité (96h LC50) pour chaque produit chimique, mais classe directement chaque produit chimique dans un certain nombre de catégories de toxicité prédéfinies. Ces catégories peuvent par exemple être définies par des réglementations spécifiques ou des systèmes de normalisation, comme le montre l'article avec les catégories du SGH pour le danger aquatique aigu. Le modèle a expliqué environ 90 % de la variance des données utilisées dans l'ensemble d'apprentissage et environ 80 % pour les données de l'ensemble de test.

Des prédictions plus précises

Cette stratégie de classification directe a permis de diviser par cinq le nombre de catégorisations incorrectes par rapport à une stratégie basée sur un modèle de régression QSAR. Par la suite, les chercheurs ont étendu leur stratégie pour prédire les catégories de toxicité d'un grand ensemble de 32 000 produits chimiques.

Ils démontrent que leur approche de classification directe donne lieu à des prédictions plus précises parce que les ensembles de données expérimentales provenant de différentes sources et pour différentes familles chimiques peuvent être regroupés pour générer des ensembles d'entraînement plus importants. Elle peut être adaptée à différentes catégories prédéfinies telles que prescrites par diverses réglementations internationales et systèmes de classification ou d'étiquetage. À l'avenir, l'approche de classification directe pourra également être étendue à d'autres catégories de danger (par exemple, la toxicité chronique) ainsi qu'au devenir dans l'environnement (par exemple, la mobilité ou la persistance) et présente un grand potentiel pour améliorer les outils in silico d'évaluation des dangers et des risques chimiques.

Note: Cet article a été traduit à l'aide d'un système informatique sans intervention humaine. LUMITOS propose ces traductions automatiques pour présenter un plus large éventail d'actualités. Comme cet article a été traduit avec traduction automatique, il est possible qu'il contienne des erreurs de vocabulaire, de syntaxe ou de grammaire. L'article original dans Anglais peut être trouvé ici.

Publication originale

Autres actualités du département science

Actualités les plus lues

Plus actualités de nos autres portails

Tous les fabricants de spectromètres FT-IR en un coup d'œil