Basic Local Alignment Search Tool - Définition

Source: Wikipédia sous licence CC-BY-SA 3.0.
La liste des auteurs de cet article est disponible ici.

Introduction

BLAST
Importez le logo de ce logiciel
Développeur Altschul S.F., Gish W., Miller E.W., Lipman D.J., NCBI
Dernière version 2.2.23 (22 mars 2010) [+/−]
Environnement Multiplate-forme
Type Outil bio-informatique
Licence Domaine public
Site Web Serveur FTP de NCBI

BLAST (acronyme de basic local alignment search tool) est une méthode de recherche heuristique utilisée en bio-informatique permettant de trouver les régions similaires entre deux ou plusieurs séquences de nucléotides ou d'acides aminés. Ce programme permet de retrouver rapidement dans des bases de données, les séquences ayant des zones de similitude avec une séquence donnée (introduite par l'utilisateur).

BLAST est utilisé pour trouver des relations fonctionnelles ou évolutives entre les séquences et peut aider à identifier les membres d'une même famille de gènes.

Historique

Ce programme a été développé par Stephen Altschul, Warren Gish et David Lipman au National Center for Biotechnology Information (NCBI). La publication originale parue en octobre 1990, Basic local alignment search tool, a été citée plus de 20 000 fois, ce qui en fait l'une des plus citées dans le monde scientifique.

Variations

Des données utilisées

Le terme blast peut être modifié en fonction de la nature de la séquence d'entrée, et de la base de donnée utilisée :

  • blast de nucléotides, séquence nucléique contre une base de données de séquences nucléiques ;
  • blast de protéines, séquence de protéine contre une base de données de séquences de protéines ;
  • blastx, séquence nucléique traduite en séquence de protéine contre une base de données de séquences de protéines ;
  • tblastn, séquence de protéine contre une base de données de séquences nucléiques traduites en séquences de protéines ;
  • tblastx, séquence nucléique traduite en séquence de protéine contre une base de données de séquences nucléiques traduites en séquences de protéines.

De l'algorithme

Depuis sa création, différentes versions de l'algorithme ont été développées :

  • BlastN, blast de séquences nucléiques, lent mais permet de retrouver des similarité localisées uniquement sur une partie des séquences ;
  • BlastP, blast de séquences de protéines ;
  • Megablast, rapide, permet de retrouver des séquences hautement similaires ;
  • PSI-Blast (position-specific iterated BLAST), Blast relancé plusieurs fois par itération. À chaque itération une séquence consensus est déterminée à partir des résultats, et utilisée comme séquence source pour l'itération suivante ;
  • PHI-BLAST (pattern hit initiated Blast), programme utilisant comme source une séquence protéique et un motif, celui-ci étant utilisé comme point de départ des recherches de similarité avec les séquences présentes dans les bases de données.
Page générée en 0.085 seconde(s) - site hébergé chez Contabo
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
A propos - Informations légales
Version anglaise | Version allemande | Version espagnole | Version portugaise