ProteinPredictor@home est une expérience de calcul partagé dont le but est de prévoir la structure d'une protéine. L'objectif de ce travail est de tester et évaluer les nouveaux algorithmes et méthodes d'évaluation des structures de protéines.
Des tests ont été effectués dans le cadre de la sixième expérience bisannuelle de CASP (Critical Assessment of Techniques for Protein Structure Prediction), les scientifiques ont besoin à présent de poursuivre le développement et ces tests avec pour application des buts biologiques réels.
L’objectif est d'utiliser cette approche et l'énorme puissance de calcul de BOINC pour résoudre des problèmes associés aux maladies liées aux protéines.
Pourquoi la prédiction de structures de protéines ?
La mise en relation de la structure de la protéine (la disposition tridimensionnelle des fonctions chimiques faisant partie des 20 acides aminés naturels qui forment la base de tout processus chimique dans un organisme vivant) et de la séquence de la protéine (l'expression de la diversité chimique dans l'organisation moléculaire que la nature exprime dans les gènes composant le génome) est un des plus grands défis actuels pour les physiciens, les chimistes, les biologistes et les informaticiens.
Ce défi est particulièrement crucial suite aux avancées récentes dans l'analyse des gènes d’organismes complets, y compris le génome humain, pour identifier les relations de ces gènes qui commandent des processus et les réseaux cellulaires, ainsi que le lien entre la structure tridimensionnelle d'une protéine et sa fonction biochimique.
Les chercheurs ont accompli des progrès significatifs en répondant à ce défi par le développement des théories fondamentales qui décrivent le rapport entre la diversité chimique des séquences de protéine et la fonction d'énergie dictée par cette diversité.
La théorie de la fonction d’énergie fournit un cadre non seulement pour la rationalisation et la prédiction/suggestion d’expériences nouvelles et existantes mais aussi pour le développement d’algorithmes informatiques destinés à prévoir la structure de protéines inconnues en se basant uniquement sur leur séquence.
Cette action, appelée prédiction de structures de protéines, est à présent un domaine de recherche très actif réunissant des chercheurs de plusieurs horizons allant de la physique à l’informatique en passant par la biologie. L’objectif de cette activité est de développer, tester et appliquer des méthodes pour relier directement les séquences de protéines à leurs représentations tridimensionnelles.
Comment se déroule la prédiction ?
La prévision de structures de protéines s’est répandue dans toute la communauté des chercheurs en biophysique. Cependant, le travail dans ce secteur est très complexe et gourmand en ressources informatiques.
Dans un effort pour aider le développement, l'évaluation du progrès et l'examen critique de ce domaine, une action connue sous le nom d' « évaluation critique des techniques pour la prévision de structures de protéines » (CASP) a été lancée il y a environ douze ans.
Le but de cette action était de fournir des objectifs pour la prévision en aveugle de structures de protéines à la communauté des « prédicteurs » sur une base bisannuelle, et de servir de plateforme tant pour la revue de la communauté que pour la discussion sur les avancées dans les méthodes de prédiction de structures.
Le sixième exercice bisannuel CASP est à présent entamé, et beaucoup de chercheurs dans le domaine considèrent cela comme une compétition pour promouvoir les meilleures méthodes de prédiction et leurs travaux. Cette compétition implique généralement 3 à 4 mois d’effort mental (et électronique) intensif pendant l'été (mai à septembre) pour peaufiner des prévisions pour 50-70 structures inconnues de protéines.
Les résultats des prédicteurs sont analysés en automne, les structures sont publiées et les prédictions sont évaluées lors de la réunion de CASP qui suit la "saison de prédiction".
En quoi consiste le travail de prédiction ?
Une équipe de scientifiques a été réunie pour explorer les différents aspects de la prédiction de structures de protéines pour les deux CASP précédents et à nouveau pour les expérimentations en cours. Dans le passé, les efforts ont été axés sur l’algorithmique et/ou les questions scientifiques soulevées par la prédiction de structures de protéines, et les efforts ont été orientés vers des tests d’hypothèses concernant la nature du problème qu’est la prédiction. L’un des thèmes récurrents lors des essais a été l’importance de la modélisation informatique de configurations de protéines.
Pendant cette “saison CASP”, l’objectif est de s’occuper de simulations de conformation. Avec l’amélioration des méthodes, des algorithmes précédents et de l’ordre de grandeur de la puissance de calcul disponible, il est possible d’améliorer de manière significative la capacité à prédire des structures de protéines.
Pour atteindre cet objectif il a été mis en place un « supercalculateur de prédiction de structure » basé sur la plateforme BOINC : ProteinPredictor@Home.
Pourquoi et en quoi ProteinPredictor@Home est différent d'un autre projet Boinc, Folding@Home, sachant que les deux semblent avoir les mêmes objectifs ?
La prédiction de structures de protéines (Predictor) part d’une séquence d’acides aminés et tente de prédire la forme repliée et fonctionnelle de la protéine, soit sans en connaître la structure détaillée, soit par analogie avec des protéines déjà connues.
Dans le cas du pliage (Folding), les scientifiques effectuent une recherche en aveugle basée uniquement sur la séquence. La modélisation par analogie identifie tout d’abord des protéines dont la structure et certains niveaux de séquence sont identiques à la nouvelle protéine recherchée, puis construit une prédiction de celle-ci par analogie.
Les deux approches utilisent des techniques d’optimisation à plusieurs niveaux pour identifier le modèle structurel le plus approprié et se prêtent bien au calcul distribué.
Predictor@Home est le premier projet de ce type à utiliser le calcul distribué pour ce genre de prédiction de structure. La prédiction de la structure d’une protéine inconnue est un problème crucial dans la validation de médicaments basés sur ces structures, conçus pour le traitement de maladies nouvelles et existantes.
Les études de repliement de protéines et la caractérisation du processus de repliement sont basées sur les connaissances de la structure finale de la protéine repliée (dans la nature) et permettent de comprendre le processus de repliement à partir d’une chaîne de protéine non pliée. Ces études sont terminées par des comparaisons avec des protéines natives (dans la nature).
L'analyse du processus de repliement permet à des théories sur le pliage de protéines d’établir des rapports directs avec les mesures expérimentales de ce processus. Le projet Folding@Home a été un pionnier dans l’utilisation du calcul distribué pour l’étude du repliement. La compréhension du processus de repliement permet de découvrir l’origine de maladies qui découlent de problèmes lors du repliement de protéines, comme la maladie d’Alzheimer ou celle de la vache folle.
Les deux approches explorent les structures et le repliement et leurs buts sont complémentaires.


Exemples de protéines découvertes grâce à ProteinPredictor@Home
Infos complémentaires
- une unité dure environ 50 minutes sur un P4 @ 3GHz