Uma nova ferramenta computacional baseada em aprendizado permite identificar mais rapidamente moléculas ainda desconhecidas em extratos naturais. Baseado na teoria da decisão, ela aprende a "pensar" como um especialista cruzando os resultados de vários softwares de análise química para classificar os compostos presentes e destacar aqueles nunca identificados anteriormente. Uma abordagem poderosa para explorar os segredos ainda desconhecidos da biodiversidade.
A natureza esconde uma infinidade de moléculas potencialmente úteis (medicamentos, aromas, materiais...) e muitas delas ainda não foram identificadas. Mas descobri-las é como procurar uma agulha... num palheiro de dados! Os químicos em busca de novas moléculas naturais baseiam-se na espectrometria de massa, uma técnica que mede a massa dos fragmentos de uma molécula quando ela se decompõe após ionização. A maneira como uma molécula se quebra e a massa de seus fragmentos, medida com precisão pelo aparelho, dependem diretamente de sua estrutura química.
Ao comparar essas "assinaturas espectrais" com as de moléculas conhecidas, pode-se deduzir a composição da amostra e às vezes até identificar novos compostos. Essas análises geram montanhas de dados que precisam ser interpretados. Até agora, os cientistas tinham que comparar manualmente os resultados de vários softwares que atribuem um sinal a uma estrutura, cada um baseado em bancos de dados e modelos diferentes, que nem sempre concordam, com o risco de perder uma descoberta.
Para sair desse impasse, uma equipe interdisciplinar de químicos e informáticos do CNRS, da Universidade Paris-Saclay e da Universidade Paris Sciences & Lettres criou o MS2DECIDE, um programa que atua como árbitro inteligente entre essas ferramentas. Inspirado na teoria da decisão, ele aprende a combinar os resultados dos diferentes softwares levando em conta sua confiabilidade e grau de concordância, como faria um especialista humano.
O programa calcula assim uma pontuação de "
knownness", que permite classificar todas as moléculas presentes em uma amostra natural de acordo com sua probabilidade de já serem conhecidas e registradas nos bancos de dados. Quanto menor essa pontuação, maior a chance da molécula ser nova.
Testado em cerca de cem compostos misturados em uma amostra "artificial", incluindo seis nunca identificados, o MS2DECIDE classificou todas as novas moléculas nas dez primeiras posições. Em um segundo teste, desta vez real, ele foi aplicado a uma amostra de uma planta africana,
Pleiocarpa mutica, conhecida por conter alcaloides indolomonoterpênicos, moléculas naturais complexas com propriedades biológicas frequentemente notáveis (antitumorais, antimalariais, analgésicas...). O programa destacou um alcaloide inédito cujas propriedades poderão agora ser avaliadas.
A ferramenta, apresentada na revista
Chemistry-Methods, poderia transformar a prospecção química. A longo prazo, cada laboratório poderia até ajustar o MS2DECIDE, em acesso livre, ao seu próprio know-how, para que a máquina adote o "olhar" do químico. Uma aliança promissora entre raciocínio humano e inteligência algorítmica.
Editor: AVR