Uma nova ferramenta computacional baseada em aprendizado permite identificar mais rapidamente molĂ©culas ainda desconhecidas em extratos naturais. Baseado na teoria da decisĂŁo, ela aprende a "pensar" como um especialista cruzando os resultados de vĂĄrios softwares de anĂĄlise quĂmica para classificar os compostos presentes e destacar aqueles nunca identificados anteriormente. Uma abordagem poderosa para explorar os segredos ainda desconhecidos da biodiversidade.
A natureza esconde uma infinidade de molĂ©culas potencialmente Ășteis (medicamentos, aromas, materiais...) e muitas delas ainda nĂŁo foram identificadas. Mas descobri-las Ă© como procurar uma agulha... num palheiro de dados! Os quĂmicos em busca de novas molĂ©culas naturais baseiam-se na espectrometria de massa, uma tĂ©cnica que mede a massa dos fragmentos de uma molĂ©cula quando ela se decompĂ”e apĂłs ionização. A maneira como uma molĂ©cula se quebra e a massa de seus fragmentos, medida com precisĂŁo pelo aparelho, dependem diretamente de sua estrutura quĂmica.
Ao comparar essas "assinaturas espectrais" com as de moléculas conhecidas, pode-se deduzir a composição da amostra e às vezes até identificar novos compostos. Essas anålises geram montanhas de dados que precisam ser interpretados. Até agora, os cientistas tinham que comparar manualmente os resultados de vårios softwares que atribuem um sinal a uma estrutura, cada um baseado em bancos de dados e modelos diferentes, que nem sempre concordam, com o risco de perder uma descoberta.
Para sair desse impasse, uma equipe interdisciplinar de quĂmicos e informĂĄticos do CNRS, da Universidade Paris-Saclay e da Universidade Paris Sciences & Lettres criou o MS2DECIDE, um programa que atua como ĂĄrbitro inteligente entre essas ferramentas. Inspirado na teoria da decisĂŁo, ele aprende a combinar os resultados dos diferentes softwares levando em conta sua confiabilidade e grau de concordĂąncia, como faria um especialista humano.
O programa calcula assim uma pontuação de "
knownness", que permite classificar todas as moléculas presentes em uma amostra natural de acordo com sua probabilidade de jå serem conhecidas e registradas nos bancos de dados. Quanto menor essa pontuação, maior a chance da molécula ser nova.
Testado em cerca de cem compostos misturados em uma amostra "artificial", incluindo seis nunca identificados, o MS2DECIDE classificou todas as novas moléculas nas dez primeiras posiçÔes. Em um segundo teste, desta vez real, ele foi aplicado a uma amostra de uma planta africana,
Pleiocarpa mutica, conhecida por conter alcaloides indolomonoterpĂȘnicos, molĂ©culas naturais complexas com propriedades biolĂłgicas frequentemente notĂĄveis (antitumorais, antimalariais, analgĂ©sicas...). O programa destacou um alcaloide inĂ©dito cujas propriedades poderĂŁo agora ser avaliadas.
A ferramenta, apresentada na revista
Chemistry-Methods, poderia transformar a prospecção quĂmica. A longo prazo, cada laboratĂłrio poderia atĂ© ajustar o MS2DECIDE, em acesso livre, ao seu prĂłprio know-how, para que a mĂĄquina adote o "olhar" do quĂmico. Uma aliança promissora entre raciocĂnio humano e inteligĂȘncia algorĂtmica.
Editor: AVR