Análise de dados apoiada por IA revela problemas em publicações científicas
Os relatórios de investigação química contêm por vezes dados de medição imprecisos
As ferramentas de análise de dados apoiadas em IA podem melhorar significativamente a qualidade das publicações científicas no futuro. Um novo estudo realizado pelo Prof. Dr. Mathias Christmann, professor de química na Freie Universität Berlin, utiliza este método para descobrir pontos fracos em numerosas publicações químicas. O cientista utilizou um script Python para analisar mais de 3000 artigos científicos publicados na revista de química orgânica, Organic Letters, nos últimos dois anos.
Isto mostrou que apenas 40 por cento das publicações de investigação química tinham medições de massa sem erros. A ferramenta de análise de dados baseada em IA utilizada para o efeito pôde ser criada sem conhecimentos prévios de programação.
"Os resultados mostram claramente como as ferramentas apoiadas por IA podem ser poderosas na investigação quotidiana. Não só tornam acessíveis análises complexas, como também melhoram a fiabilidade dos dados científicos", explica Mathias Christmann. Graças aos avançados "modelos de grande linguagem", como o ChatGPT (OpenAI), o Gemini (Google) e o Claude (Anthropic), é agora possível traduzir a linguagem natural diretamente para uma linguagem informática como o Python. Isto significa que mesmo pessoas sem conhecimentos de programação podem criar aplicações que procuram módulos de texto específicos ou valores medidos em grandes quantidades de dados, por exemplo. Os dados assim obtidos podem depois ser processados automaticamente e verificados quanto à sua plausibilidade.
No estudo de Christmann "What I learned from Analysing Accurate Mass Data of 3000 Supporting Information Files" (O que aprendi com a análise de dados de massa exactos de 3000 ficheiros de informação de apoio), foram descobertos erros sistemáticos anteriormente desconhecidos através da análise de dados apoiada por IA. Além disso, foram identificados casos em que valores incorretamente calculados pareciam ser confirmados por supostas medições. "Estas observações levantam a questão de saber se alguns valores medidos podem ter sido inventados", sublinha o cientista.
Este estudo, publicado em acesso aberto, ilustra o potencial das ferramentas de análise apoiadas por IA não só para automatizar o controlo de qualidade dos dados científicos, mas também para descobrir fraquezas sistemáticas e, assim, dar um contributo importante para melhorar os padrões científicos.
No âmbito da iniciativa "AI in Teaching" do Departamento de Biologia, Química e Farmácia da Freie Universität Berlin, os estudantes trabalharão cada vez mais com estas e outras ferramentas semelhantes no futuro, anunciou Mathias Christmann. O objetivo é ensinar competências de análise de dados e incentivar os alunos a pensar de forma crítica.
Observação: Este artigo foi traduzido usando um sistema de computador sem intervenção humana. A LUMITOS oferece essas traduções automáticas para apresentar uma gama mais ampla de notícias atuais. Como este artigo foi traduzido com tradução automática, é possível que contenha erros de vocabulário, sintaxe ou gramática. O artigo original em Alemão pode ser encontrado aqui.