Los programas de inteligencia artificial más avanzados son actualmente capaces de acelerar considerablemente la investigación farmacéutica mediante el modelado de interacciones moleculares. Sin embargo, un equipo de la Universidad de Basilea ha descubierto que estas herramientas se basan más en la memorización que en una verdadera comprensión de los mecanismos físicos subyacentes.
En el ámbito médico, las proteínas representan objetivos privilegiados para los medicamentos. Estas macromoléculas biológicas, constituidas por cadenas de aminoácidos, adoptan estructuras tridimensionales que determinan su función. El desciframiento de estas arquitecturas moleculares constituye una etapa fundamental para diseñar tratamientos innovadores. Desde hace algunos años, la aparición de algoritmos como AlphaFold ha revolucionado este enfoque al permitir predecir la forma de las proteínas a partir de su secuencia genética.
Las versiones más recientes de estos modelos van aún más lejos al simular cómo las proteínas interactúan con diferentes moléculas, en particular los principios activos farmacéuticos. El profesor Markus Lill y su equipo han notado, sin embargo, que las tasas de éxito anunciadas parecían anormalmente elevadas. Esta observación los llevó a sospechar que las inteligencias artificiales podrían funcionar por reconocimiento de patrones más que por análisis físico profundo de las interacciones moleculares.
Para verificar esta hipótesis, los científicos modificaron artificialmente cientos de proteínas alterando específicamente sus sitios de unión. Crearon secuencias de aminoácidos que presentaban distribuciones de carga eléctrica radicalmente diferentes, e incluso bloquearon completamente las zonas de interacción. A pesar de estas transformaciones significativas, los modelos de IA continuaban prediciendo las mismas estructuras, como si las modificaciones no existieran. Pruebas similares sobre los ligandos confirmaron esta tendencia.
Los investigadores constataron que en más de la mitad de los casos, las predicciones permanecían inalteradas a pesar de las alteraciones introducidas. Esta rigidez cognitiva se vuelve particularmente problemática cuando las proteínas estudiadas presentan poca similitud con las utilizadas para el entrenamiento de los algoritmos. Ahora bien, son precisamente estas estructuras originales las que podrían abrir el camino a medicamentos verdaderamente innovadores, según el equipo de investigación.
Frente a estas limitaciones, los científicos recomiendan un enfoque prudente que integre sistemáticamente validaciones experimentales. También preconizan el desarrollo de nuevas generaciones de algoritmos que incorporen explícitamente las leyes de la química y la física. Tales modelos híbridos podrían ofrecer predicciones más fiables para las estructuras proteicas aún poco comprendidas, potencialmente portadoras de nuevos enfoques terapéuticos.