Il chatbot apre la chimica computazionale ai non addetti ai lavori
Un nuovo strumento trasforma il complesso processo di simulazione delle molecole in soluzione in una chat di facile utilizzo
I software computazionali avanzati stanno semplificando la ricerca in chimica quantistica automatizzando molti dei processi di esecuzione delle simulazioni molecolari. Il design complicato di questi pacchetti software, tuttavia, spesso ne limita l'uso a chimici teorici esperti in tecniche di calcolo specializzate. Una nuova piattaforma web sviluppata alla Emory University supera questa limitazione con un chatbot di facile utilizzo.

I ricercatori sperano che il loro lavoro pionieristico di democratizzazione della ricerca chimica computazionale possa ispirare iniziative simili in tutte le scienze naturali.
Liu Group
Il chatbot guida i non esperti attraverso un processo a più fasi per l'impostazione di simulazioni molecolari e la visualizzazione di molecole in soluzione. Consente a qualsiasi chimico - compresi i laureandi in chimica - di configurare ed eseguire complesse simulazioni quantomeccaniche attraverso la chat.
La piattaforma gratuita e disponibile al pubblico - nota come AutoSolvateWeb - opera principalmente su un'infrastruttura cloud, ampliando ulteriormente l'accesso a sofisticati strumenti di ricerca computazionale.
La rivista Chemical Science ha pubblicato un proof-of-concept di AutoSolvateWeb, che segna un significativo passo avanti nell'integrazione dell'IA nell'istruzione e nella ricerca scientifica.
AutoSolvateWeb è orientato alla creazione di simulazioni per una particolare sostanza chimica da sciogliere (un soluto) e una sostanza in cui scioglierla (un solvente), ottenendo una soluzione (un solvato).
Le simulazioni vengono fornite sotto forma di filmati 3D.
"È un po' come un microscopio, che offre una visione a livello atomico delle molecole che interagiscono in una soluzione", spiega Fang Liu, assistente di chimica della Emory, che ha guidato lo sviluppo di AutoSolvateWeb.
L'ampia accessibilità di AutoSolvateWeb lo rende uno strumento prezioso per creare grandi serie di dati di alta qualità sul comportamento delle molecole in soluzione. Tali insiemi di dati costituiscono una base per l'applicazione di tecniche di apprendimento automatico per promuovere innovazioni in tutti i settori, dall'energia rinnovabile alla salute umana.
"Il nostro obiettivo è contribuire ad accelerare la scoperta scientifica", afferma Fangning Ren, coautore dell'articolo di Chemical Science e dottorando in chimica alla Emory.
Rohit Gadde, ex specialista di ricerca dell'Emory, è il primo autore dell'articolo. Altri coautori sono Lechen Dong, studente di chimica dell'Emory, Yao Wang, assistente di chimica dell'Emory, Sreelaya Devaguptam, ex borsista in visita all'Emory, e Rajat Mittal, ex assistente di ricerca presso la Clemson University.
Automatizzare compiti complessi
Chimico teorico, Liu dirige un team specializzato in chimica computazionale, tra cui la modellazione e la decifrazione delle proprietà molecolari e delle reazioni in fase di soluzione.
Prima di eseguire un programma di chimica quantistica per una molecola in soluzione, è necessario determinare la geometria della molecola di soluto e la posizione e l'orientamento delle molecole di solvente circostanti attraverso la simulazione molecolare. Il processo di impostazione ed esecuzione di queste simulazioni è complicato e richiede tempo, limitando la frequenza con cui i ricercatori possono eseguire tali calcoli.
Nel 2022, il gruppo Liu ha sviluppato un modo per automatizzare molti di questi calcoli con un sistema chiamato AutoSolvate. Questo sistema ha ridotto da centinaia a poche righe le righe di codice che un chimico computazionale deve inserire in un supercomputer per eseguire una simulazione.
Oltre all'interfaccia a riga di comando orientata ai chimici teorici più esperti, AutoSolvate includeva un'interfaccia grafica intuitiva adatta agli studenti laureati che imparano a eseguire le simulazioni.
AutoSolvateWeb si basa su queste fondamenta.
Ampliare l'accesso
Operando principalmente su un'infrastruttura cloud, AutoSolvateWeb supera le difficoltà di configurazione dell'hardware, appiattendo ulteriormente la curva di apprendimento per la ricerca computazionale sofisticata. Il chatbot comunica con il linguaggio naturale piuttosto che con il codice del computer sul lato anteriore, mentre AutoSolvateWeb automatizza i processi software sul lato posteriore.
"I chimici possono dedicare meno tempo a imparare a scrivere codice informatico, in modo da concentrarsi maggiormente sui problemi specifici che vogliono risolvere", spiega Liu. "Vogliamo anche consentire agli studenti di eseguire simulazioni da soli, in modo che possano comprendere meglio la dinamica delle molecole in soluzione".
Piuttosto che un chatbot con un grande modello linguistico (LLM), come ChatGPT, il chatbot AutoSolvateWeb è principalmente basato su regole. Non conversa come un vero essere umano su una serie di argomenti, ma è orientato a compiti specifici, simili ai chatbot utilizzati per i servizi ai clienti come le banche online.
Il chatbot chiede all'utente di digitare il nome di una molecola di interesse, come la caffeina, e di selezionare un solvente in cui sciogliere la caffeina, come l'acqua. Il sistema attinge ai dati di PubChem, la più grande raccolta al mondo di informazioni chimiche online liberamente accessibili, assemblata dal National Institutes of Health.
Il chatbot guida l'utente passo dopo passo attraverso l'ambiente cloud, integrando perfettamente diversi programmi software open-source necessari per il flusso di lavoro. Una volta calcolati tutti i parametri corretti attraverso il processo automatizzato, AutoSolvateWeb invia i risultati a un supercommuter della National Science Foundation per creare la simulazione.
Il supercommuter restituisce un file di traiettoria. L'utente può scaricare questo file e utilizzare un software open-source per trasformarlo in un filmato 3D della simulazione richiesta.
Vedere per credere e capire
AutoSolvateWeb è destinato a migliorare l'insegnamento della chimica.
"Man mano che i computer diventano sempre più potenti, diventano sempre più importanti per la ricerca scientifica", afferma Ren. "Gli studenti di chimica devono familiarizzare con le simulazioni al computer per poter stare al passo con i progressi della ricerca".
Ren cita il solvatocromismo, una tecnica per analizzare la composizione delle sostanze chimiche in un liquido, come esempio del potere delle simulazioni al computer per la didattica.
Gli studenti universitari di solito imparano a conoscere il solvatocromismo in esperimenti di laboratorio, sciogliendo un soluto noto come colorante di Riechart in diversi solventi. La soluzione diventa blu, rossa, verde o gialla a seconda di come le molecole del soluto assorbono la luce.
La spiegazione più semplice di questo fenomeno è che le variazioni di colore sono dovute alla variazione della polarità di un solvente. Le variazioni di polarità stabilizzano in modo diverso lo stato fondamentale di una molecola, che a sua volta influisce sul picco di assorbimento della molecola lungo la lunghezza d'onda della luce.
Ciò che è più difficile da spiegare sono le eccezioni a questa regola. A volte solventi di polarità simile producono colori diversi a causa del modo in cui si formano i legami idrogeno tra il soluto e il solvente.
"Per comprendere appieno come il legame a idrogeno giochi un ruolo speciale in questa situazione, gli studenti devono eseguire una simulazione al computer", spiega Liu. "Vedere per credere. È necessario guardare direttamente la struttura in movimento per poter capire le cose su scala microscopica".
Queste visualizzazioni dettagliate aiutano gli studenti a pensare in modo critico, in modo che possano andare oltre la memorizzazione dei concetti nei libri di testo e fare e analizzare le proprie scoperte.
"Nella scienza non vogliamo solo capire cosa sta succedendo", aggiunge Ren. "Vogliamo sapere perché sta accadendo".
Piccole molecole, grandi dati
Liu e i suoi colleghi stanno ora lavorando per ampliare la gamma di sistemi chimici che AutoSolvateWeb è in grado di simulare, superando limitazioni quali la presenza di singole molecole organiche come soluto. Stanno inoltre migliorando la capacità della piattaforma non solo di generare dati, ma anche di memorizzarli e scambiarli liberamente con la comunità chimica in un formato open-source.
I ricercatori sperano che il loro lavoro pionieristico di democratizzazione della ricerca chimica computazionale possa ispirare iniziative simili in tutte le scienze naturali. Il loro obiettivo finale, spiega Ren, è quello di aiutare a collegare l'intelligenza artificiale tra i vari domini della scienza di base, potenziando la potenza della ricerca interdisciplinare.
Nota: questo articolo è stato tradotto utilizzando un sistema informatico senza intervento umano. LUMITOS offre queste traduzioni automatiche per presentare una gamma più ampia di notizie attuali. Poiché questo articolo è stato tradotto con traduzione automatica, è possibile che contenga errori di vocabolario, sintassi o grammatica. L'articolo originale in Inglese può essere trovato qui.