L'apprentissage en profondeur malgré le peu de données disponibles
Un groupe de recherche du LFA se penche sur l'évaluation des données de processus chimiques
TUK/Koziel
Rechercher des millions d'images en une fraction de seconde à l'aide d'un mot-clé comme "plage" par exemple ou utiliser la reconnaissance vocale pour faire écouter une chanson sur son service de streaming. C'est ce que permet le deep learning, une branche de l'intelligence artificielle. Les algorithmes apprennent à l'aide d'énormes quantités de données ; ils classifient, trient et filtrent les données. Cette technologie est utilisée dans de nombreux domaines, comme la médecine, l'agriculture ou la robotique.
Mais ce n'est pas encore le cas pour les processus de l'industrie chimique. "Il y a ici beaucoup moins de données que lors d'une recherche d'images sur le web, parfois il n'y a pas de données du tout ou les entreprises ne les mettent pas à disposition", explique le professeur Marius Kloft, qui dirige à l'université technique de Kaiserslautern le domaine d'enseignement des systèmes intelligents et le groupe de travail Machine Learning et qui est porte-parole du nouveau groupe de recherche de la DFG. "De plus, toutes les données se ressemblent souvent, ce qui rend l'apprentissage ici nettement plus difficile". Par exemple, dans une usine chimique, le même processus est toujours exécuté dans les mêmes conditions sur une longue période, comme la transformation des matières premières en produits. Les capteurs mesurent alors toujours la même température, la même pression et ainsi de suite.
C'est précisément dans de tels domaines que le nouveau groupe de recherche souhaite utiliser des méthodes d'apprentissage en profondeur. Le groupe a l'avantage d'être interdisciplinaire. Le développement de ces nouveaux procédés ne pourrait pas être réalisé autrement. Outre l'informaticien Kloft et la professeure d'informatique Dr Heike Leitte, le professeur de génie des procédés Dr Hans Hasse, le professeur junior Dr Fabian Jirasek, qui effectue des recherches sur l'apprentissage automatique dans le génie des procédés, et la professeure junior Dr Sophie Fellenz, qui s'occupe également de l'apprentissage automatique, font partie du groupe. La particularité de Fellenz et Jirasek est que la fondation Carl Zeiss finance leurs chaires juniors en tandem à hauteur de 1,5 million d'euros ; leur objectif commun est de réunir l'apprentissage automatique et la modélisation physique. Le nouveau groupe de recherche de la DFG en profite également. Dans le cadre d'une bourse Mercator, le professeur d'informatique Dr Stephan Mandt de l'Université de Californie à Irvine, qui effectue entre autres des recherches sur les applications de l'apprentissage automatique dans les sciences naturelles, est également intégré au projet.
"Pour nous, c'est moins le nombre que la qualité des données qui est au premier plan", poursuit Kloft. L'équipe procède de deux manières. D'une part, elle réalise elle-même des processus chimiques en laboratoire afin de collecter des données expérimentales, d'autre part, elle génère également des données synthétiques. "Chaque expérience est complexe et coûteuse. Il s'agit donc pour nous avant tout de collecter les bonnes données, c'est-à-dire celles dont les méthodes d'apprentissage profond peuvent apprendre le plus", ajoute Jirasek. Pour ce faire, le campus de Kaiserslautern utilise d'une part une installation de distillation dite "batch", qui permet de collecter des données de processus dynamiques. D'autre part, le partenaire du projet, l'université technique de Munich, exploite sur le site de Straubing une installation de production continue de carburants synthétiques à l'échelle pilote.
"Ces installations sont équipées d'une multitude de capteurs pour enregistrer les données les plus diverses, comme la pression et la température, mais aussi des vidéos de la vie intérieure ou la composition des mélanges utilisés", poursuit le professeur junior.
Outre les données issues du laboratoire, d'autres données sont générées à l'aide de simulations physiques et de procédés d'intelligence artificielle. Un défi particulier consiste à les rendre aussi réalistes que possible. "Nous suivons deux approches pour cela", explique la professeure junior Fellenz. "D'une part, nous développons des méthodes pour apprendre le style des données expérimentales et le transférer ensuite aux données de simulation". De telles méthodes existent déjà pour modifier la tonalité des textes. Dans le groupe de recherche, elles sont maintenant appliquées aux données de séries temporelles de processus chimiques, qui peuvent être considérées comme des données séquentielles, tout comme les mots dans un texte. "D'autre part, nous intégrons directement dans nos modèles les lois physiques, par exemple celles de la thermodynamique, de sorte que nous pouvons également générer des données réalistes dans des domaines où nous ne disposons pas de mesures", poursuit l'informaticienne.
L'objectif des quatre prochaines années est de détecter à temps les anomalies ou les erreurs dans les installations chimiques grâce aux nouvelles méthodes d'apprentissage en profondeur, mais aussi d'identifier les contre-mesures appropriées. Ceci est d'une grande pertinence pratique, car toute défaillance d'une installation est pour le moins coûteuse et, dans le pire des cas, représente un danger pour l'homme et l'environnement.
Les exemples sont nombreux, comme en 2013, lorsqu'une explosion s'est produite dans une usine chimique à Geismar (Louisiane), aux États-Unis, faisant un mort et de nombreux blessés. La cause en était un défaut dans un échangeur de chaleur. "C'est justement dans de telles installations que des anomalies dans le processus peuvent avoir des conséquences terribles", poursuit Kloft. Les méthodes d'apprentissage profond pourraient ici aider à détecter automatiquement de telles erreurs afin d'émettre un message d'alerte à temps. "Grâce au deep learning, nos détecteurs d'anomalies devraient être beaucoup plus sensibles que les techniques traditionnelles".
L'objet des travaux est également d'expliquer les informations, de les visualiser et de les présenter de manière claire. Elles doivent être rapides et faciles à comprendre pour que les professionnels de l'industrie chimique puissent utiliser ces procédés et réagir aux recommandations correspondantes de la technique. L'équipe s'attachera également à vérifier ses méthodes. Des méthodes mathématiques seront utilisées pour vérifier que les algorithmes fonctionnent correctement. Kloft poursuit : "Avec notre travail, nous générons un ensemble de données entièrement nouveau que nous mettrons également à la disposition d'autres".
Le professeur Dr Werner R. Thiel, vice-président de la recherche et de la technologie de la TUK, souligne l'importance du nouveau groupe de recherche de la DFG : "Nous avons pu poser la première pierre de ce succès grâce à nos deux chaires junior en tandem financées par la fondation Carl Zeiss. Nous apportons ainsi au projet notre expertise en informatique et en génie des procédés. Sans cette combinaison, un tel projet ne serait pas possible. C'est un avantage de notre site de recherche, qui est interdisciplinaire dans de nombreux domaines. Cela porte à nouveau ses fruits. Je félicite chaleureusement tous les participants".
Le ministre des Sciences de Rhénanie-Palatinat, Clemens Hoch, félicite également : "Je suis très heureux du succès des chercheurs de Kaiserslautern et de leurs partenaires de coopération d'Oldenbourg et de Straubing. Le groupe de recherche financé par la DFG est la preuve de la force de recherche de l'université technique dans ce domaine de recherche très actuel et s'intègre parfaitement dans la stratégie de l'IA du Land. Ce projet montre clairement que la technologie clé qu'est l'intelligence artificielle peut apporter sa contribution positive et renforcer les performances dans les disciplines scientifiques et les applications les plus diverses. Je suis donc très heureux qu'en Rhénanie-Palatinat, nous puissions nous estimer heureux d'avoir dans nos institutions des chercheurs de premier plan en matière d'IA, comme le professeur Kloft et ses collègues, qui développent avec leurs projets innovants de nouvelles possibilités d'utilisation de l'intelligence artificielle en Rhénanie-Palatinat et au-delà".
L'objectif à long terme du groupe de recherche est de développer des méthodes pour le fonctionnement autonome d'installations dans l'industrie chimique. Par ses travaux, le groupe veut également faire avancer la simulation de processus dans la technique des procédés en développant de nouveaux outils et en y intégrant également des types de données qui ne sont pas encore considérés actuellement.
Outre les groupes de travail de l'université technique de Kaiserslautern, les équipes du Dr Michael Bortz du Fraunhofer-Institut für Techno- und Wirtschaftsmathematik ITWM de Kaiserslautern, du professeur Dr Jakob Burger de l'université technique de Munich et du professeur Dr Daniel Neider de l'université d'Oldenburg participent au projet. Le professeur Stephan Mandt de l'Université de Californie à Irvine est également impliqué en tant que Mercator Fellow.
Note: Cet article a été traduit à l'aide d'un système informatique sans intervention humaine. LUMITOS propose ces traductions automatiques pour présenter un plus large éventail d'actualités. Comme cet article a été traduit avec traduction automatique, il est possible qu'il contienne des erreurs de vocabulaire, de syntaxe ou de grammaire. L'article original dans Allemand peut être trouvé ici.