La reconnaissance vocale ou reconnaissance automatique de la parole (Automatic Speech Recognition ASR) est une technique informatique qui permet d'analyser un mot ou une phrase captée au moyen d'un microphone pour la transcrire sous la forme d'un texte exploitable par une machine. La reconnaissance vocale (La reconnaissance vocale ou reconnaissance automatique de la parole (Automatic Speech Recognition...), ainsi que la synthèse vocale, l'identification du locuteur ou la vérification du locuteur, font partie des techniques de traitement de la parole (La parole, c'est du langage incarné. Autrement dit c'est l'acte d'un sujet. Si le langage renvoie...). Ces techniques permettent notamment de réaliser des interfaces vocales c'est-à-dire des interfaces homme-machine (IHM) où une partie de l'interaction (Une interaction est un échange d'information, d'affects ou d'énergie entre deux agents au sein...) se fait à la voix. Parmi les nombreuses applications, on peut citer les applications de dictée (La dictée est l'opération par laquelle une personne lit ou au moins énonce à...) vocale sur PC où la difficulté tient à la taille du vocabulaire et à la longueur (La longueur d’un objet est la distance entre ses deux extrémités les plus...) des phrases, mais aussi les applications téléphoniques de type serveur vocal, où la difficulté tient plutôt à la nécessité de reconnaître n'importe quelle voix dans des conditions acoustiques variables et souvent bruyantes (téléphones mobiles dans des lieux publics).
La reconnaissance vocale peut se rattacher à de nombreux plans de la science : traitement automatique (L'automatique fait partie des sciences de l'ingénieur. Cette discipline traite de la...) des langues, linguistique, théorie (Le mot théorie vient du mot grec theorein, qui signifie « contempler, observer,...) des langages formels, théorie de l'information, traitement du signal ( Termes généraux Un signal est un message simplifié et généralement codé. Il existe...), réseaux neuronaux, intelligence artificielle (L'intelligence artificielle ou informatique cognitive est la « recherche de moyens...), etc.
Une phrase enregistrée et numérisée est donnée (Dans les technologies de l'information (TI), une donnée est une description élémentaire, souvent...) au programme de reconnaissance vocale. Dans le formalisme ASR, le découpage fonctionnel est le suivant :
Les travaux sur la reconnaissance vocale datent du début du XXe siècle. Le premier système pouvant être considéré comme faisant de la reconnaissance vocale date de 1952. Elle est évoquée dans Le Premier cercle (Un cercle est une courbe plane fermée constituée des points situés à égale...) de l'écrivain dissident soviétique Alexandre Soljenitsyne, comme un outil (Un outil est un objet finalisé utilisé par un être vivant dans le but d'augmenter son...) de répression au service de Staline.
Ce système électronique développé par Davis, Biddulph, and Balashek aux laboratoires Bell (Bell Aircraft Corporation est un constructeur aéronautique américain fondé le 10 juillet 1935....) Labs était essentiellement composé de relais et ses performances se limitaient à reconnaître des chiffres isolés (voir référence). La recherche s'est ensuite considérablement accrue durant les années 1970 avec les travaux de Jelinek chez IBM (International Business Machines Corporation (IBM) est une société multinationale américaine...) (1972-1993). La société Threshold Technologies fut la première à commercialiser en 1972 un système de reconnaissance d'une capacité de 32 mots, le VIP100. Aujourd'hui, la reconnaissance vocale est un domaine à forte croissance grâce à la déferlante des systèmes embarqués.