Una nueva herramienta informática basada en el aprendizaje permite identificar más rápidamente moléculas aún desconocidas en extractos naturales. Basado en la teoría de la decisión, aprende a "pensar" como un experto cruzando los resultados de varios softwares de análisis químico para clasificar los compuestos presentes y resaltar aquellos nunca antes identificados. Un enfoque poderoso para explorar los secretos aún desconocidos de la biodiversidad.
La naturaleza alberga una infinidad de moléculas potencialmente útiles (medicamentos, aromas, materiales...) y muchas de ellas aún no han sido identificadas. Pero descubrirlas es como buscar una aguja... ¡en un pajar de datos! Los químicos en busca de nuevas moléculas naturales se apoyan en la espectrometría de masas, una técnica que mide la masa de los fragmentos de una molécula cuando se descompone tras la ionización. La forma en que una molécula se rompe y la masa de sus fragmentos, medida con gran precisión por el aparato, dependen directamente de su estructura química.
Al comparar estas "firmas espectrales" con las de moléculas conocidas, se puede deducir la composición de la muestra e incluso a veces identificar nuevos compuestos. Estos análisis generan montañas de datos que deben interpretarse. Hasta ahora, los científicos tenían que comparar manualmente los resultados de varios softwares que asignan una señal a una estructura, cada uno basado en bases de datos y modelos diferentes, que no siempre coinciden, con el riesgo de pasar por alto un descubrimiento.
Para salir de este callejón sin salida, un equipo interdisciplinario de químicos e informáticos del CNRS, de la Universidad Paris-Saclay y de la Universidad Paris Sciences & Lettres ha diseñado MS2DECIDE, un programa que actúa como árbitro inteligente entre estas herramientas. Inspirado en la teoría de la decisión, aprende a combinar los resultados de los diferentes softwares teniendo en cuenta su fiabilidad y su grado de concordancia, como lo haría un experto humano.
El programa calcula así una puntuación de "
conocimiento", que permite clasificar todas las moléculas presentes en una muestra natural según su probabilidad de ser ya conocidas y registradas en las bases de datos. Cuanto más baja es esta puntuación, más posibilidades tiene la molécula de ser nueva.
Probado en un centenar de compuestos mezclados en una muestra "artificial", de los cuales seis nunca habían sido identificados, MS2DECIDE clasificó todas las nuevas moléculas en las diez primeras posiciones. En una segunda prueba, esta vez real, se aplicó a una muestra de una planta africana,
Pleiocarpa mutica, conocida por contener alcaloides indolomonoterpénicos, moléculas naturales complejas con propiedades biológicas a menudo notables (antitumorales, antipalúdicas, analgésicas...). El programa destacó un alcaloide inédito cuyas propiedades podrán ahora ser evaluadas.
La herramienta, presentada en la revista
Chemistry-Methods, podría transformar la prospección química. A largo plazo, cada laboratorio incluso podría ajustar MS2DECIDE, de acceso libre, a su propio know-how, para que la máquina adopte la "mirada" del químico. Una alianza prometedora entre razonamiento humano e inteligencia algorítmica.
Redactor: AVR