Chatbot abre a química computacional a não especialistas

Nova ferramenta transforma o complexo processo de simulação de moléculas em solução num chat de fácil utilização

11.04.2025

O software computacional avançado está a simplificar a investigação em química quântica, automatizando muitos dos processos de execução de simulações moleculares. No entanto, a conceção complicada destes pacotes de software limita frequentemente a sua utilização a químicos teóricos com formação em técnicas de computação especializadas. Uma nova plataforma Web desenvolvida na Universidade Emory supera esta limitação com um chatbot de fácil utilização.

Liu Group

Os investigadores esperam que o seu trabalho pioneiro para democratizar a investigação em química computacional inspire iniciativas semelhantes em todas as ciências naturais.

O chatbot guia os não especialistas através de um processo de várias etapas para configurar simulações moleculares e visualizar moléculas em solução. Permite a qualquer químico - incluindo alunos de licenciatura em química - configurar e executar simulações complexas de mecânica quântica através de conversação.

A plataforma gratuita e publicamente disponível - conhecida como AutoSolvateWeb - funciona principalmente em infra-estruturas de nuvem, expandindo ainda mais o acesso a ferramentas sofisticadas de investigação computacional.

A revista Chemical Science publicou uma prova de conceito para o AutoSolvateWeb, que marca um passo significativo na integração da IA no ensino e na investigação científica.

O AutoSolvateWeb destina-se a criar simulações para um determinado produto químico a dissolver (um soluto) e uma substância para o dissolver (um solvente), resultando numa solução (um solvente).

As simulações são apresentadas sob a forma de filmes 3D.

"É um pouco como um microscópio, dando-lhe uma visão a nível atómico das moléculas que interagem numa solução", diz Fang Liu, professor assistente de química da Emory, que liderou o desenvolvimento do AutoSolvateWeb.

A ampla acessibilidade do AutoSolvateWeb torna-o uma ferramenta valiosa para criar conjuntos de dados de grande dimensão e qualidade que abordam o comportamento das moléculas em solução. Esses conjuntos de dados constituem uma base para a aplicação de técnicas de aprendizagem automática para impulsionar inovações em tudo, desde as energias renováveis à saúde humana.

"O nosso objetivo é ajudar a acelerar a descoberta científica", afirma Fangning Ren, coautor do artigo da Chemical Science e estudante de doutoramento em química da Emory.

Rohit Gadde, um antigo especialista em investigação da Emory, é o primeiro autor do artigo. Os co-autores adicionais incluem Lechen Dong, estudante de pós-graduação em química da Emory; Yao Wang, professor assistente de química da Emory; Sreelaya Devaguptam, antigo académico visitante da Emory; e Rajat Mittal, antigo assistente de investigação de pós-graduação da Universidade de Clemson.

Automatização de tarefas complexas

Químico teórico, Liu lidera uma equipa especializada em química computacional, incluindo modelação e decifração de propriedades moleculares e reacções na fase de solução.

Antes de executar um programa de química quântica para uma molécula em solução, é necessário determinar a geometria da molécula de soluto e a localização e orientação das moléculas de solvente circundantes através de simulação molecular. O processo de configuração e execução destas simulações é complicado e demorado, o que limita a frequência com que os investigadores podem efetuar tais cálculos.

Em 2022, o grupo de Liu desenvolveu uma forma de automatizar muitos destes cálculos com um sistema a que chamou AutoSolvate. Esse sistema reduziu as linhas de código que um químico computacional precisa de introduzir num supercomputador para executar uma simulação de centenas de linhas para apenas algumas linhas.

Para além da interface de linha de comandos orientada para químicos teóricos mais experientes, o AutoSolvate incluía uma interface gráfica intuitiva adequada a estudantes de pós-graduação que estão a aprender a executar simulações.

O AutoSolvateWeb baseia-se nesta fundação.

Expansão do acesso

Ao operar principalmente na infraestrutura da nuvem, o AutoSolvateWeb supera os desafios de configuração de hardware, achatando ainda mais a curva de aprendizado para pesquisas computacionais sofisticadas. O chatbot comunica através de linguagem natural em vez de código informático no front end, enquanto o AutoSolvateWeb automatiza os processos de software no back end.

"Os químicos podem passar menos tempo a aprender a escrever código informático para poderem concentrar mais os seus esforços em problemas específicos que queiram resolver", explica Liu. "Também queremos que os estudantes possam efetuar simulações sozinhos, para que possam compreender melhor a dinâmica das moléculas em solução."

Em vez de um chatbot de modelo de linguagem grande (LLM), como o ChatGPT, o chatbot do AutoSolvateWeb baseia-se principalmente em regras. Não conversa como um ser humano real sobre uma série de assuntos, mas está orientado para tarefas específicas, à semelhança dos chatbots utilizados para serviços ao cliente, como os serviços bancários em linha.

O chatbot pede ao utilizador que escreva o nome de uma molécula de interesse, como a cafeína, e depois selecione um solvente para dissolver a cafeína, como a água. O sistema utiliza dados do PubChem - a maior coleção mundial de informação química em linha de acesso livre, reunida pelos Institutos Nacionais de Saúde.

O chatbot guia o utilizador passo a passo através do ambiente de nuvem, integrando perfeitamente vários programas de software de código aberto necessários para o fluxo de trabalho. Uma vez calculados todos os parâmetros adequados através do processo automatizado, o AutoSolvateWeb submete os resultados a um supercomputador da National Science Foundation para criar a simulação.

O supercomputador devolve um ficheiro de trajetória. O utilizador pode descarregar este ficheiro e utilizar software de código aberto para transformar o ficheiro num filme 3D da simulação solicitada.

Ver para crer - e compreender

O AutoSolvateWeb está preparado para melhorar a forma como a química é ensinada.

"À medida que os computadores se tornam cada vez mais potentes, tornam-se mais importantes para a investigação científica", afirma Ren. "Os estudantes de química precisam de se familiarizar com as simulações em computador para poderem acompanhar os avanços na forma como a investigação é feita."

Ren cita o solvatocromismo, uma técnica para analisar a composição de substâncias químicas num líquido, como um exemplo do poder das simulações em computador para o ensino.

Os estudantes de licenciatura aprendem normalmente sobre solvatocromismo em experiências de laboratório, dissolvendo um soluto conhecido como corante de Riechart em diferentes solventes. A solução torna-se azul, vermelha, verde ou amarela, dependendo da forma como as moléculas do soluto absorvem a luz.

A explicação mais simples para este fenómeno é que as variações de cor se devem a variações na polaridade de um solvente. As alterações na polaridade estabilizam o estado fundamental de uma molécula de forma diferente, o que, por sua vez, afecta o pico de absorção de uma molécula ao longo do comprimento de onda da luz.

O que é mais complicado de explicar são as excepções a esta regra. Por vezes, solventes de polaridades semelhantes produzem cores diferentes devido à forma como as ligações de hidrogénio se formam entre o soluto e o solvente.

"Para compreenderem plenamente como as ligações de hidrogénio desempenham um papel especial nesta situação, os alunos precisam de fazer uma simulação em computador", diz Liu. "Ver para crer. É preciso olhar diretamente para a estrutura em movimento para se poder compreender as coisas à escala microscópica".

Estas visualizações detalhadas ajudam os alunos a aprender a pensar criticamente, diz ela, para que possam ir além da memorização de conceitos nos livros didácticos e fazer e analisar as suas próprias descobertas.

"Na ciência, não queremos apenas compreender o que está a acontecer", acrescenta Ren. "Queremos saber porque é que isso está a acontecer."

Pequenas moléculas, grandes dados

Liu e os seus colegas estão agora a trabalhar para expandir a gama de sistemas químicos que o AutoSolvateWeb pode simular, indo além de limitações como moléculas orgânicas simples como soluto. Estão também a melhorar a capacidade da plataforma não só para gerar dados, mas também para armazenar e trocar livremente esses dados com a comunidade química num formato de código aberto.

Os investigadores esperam que o seu trabalho pioneiro para democratizar a investigação em química computacional inspire iniciativas semelhantes em todas as ciências naturais. O seu objetivo final, explica Ren, é ajudar a ligar a IA a vários domínios da ciência básica, aumentando o poder da investigação interdisciplinar.

Observação: Este artigo foi traduzido usando um sistema de computador sem intervenção humana. A LUMITOS oferece essas traduções automáticas para apresentar uma gama mais ampla de notícias atuais. Como este artigo foi traduzido com tradução automática, é possível que contenha erros de vocabulário, sintaxe ou gramática. O artigo original em Inglês pode ser encontrado aqui.

Publicação original

Outras notícias do departamento ciência

Notícias mais lidas

Mais notícias de nossos outros portais