Dans de nombreux contextes (scientifique, légal, etc.) l'on désigne par langage formel un mode d'expression plus formalisé et plus précis (les deux n'allant pas nécessairement de pair) que le langage de tous les jours (voir langage naturel).
En mathématiques, logique (La logique (du grec logikê, dérivé de logos (λόγος),...) et informatique (L´informatique - contraction d´information et automatique - est le domaine...), un langage formel (Dans de nombreux contextes (scientifique, légal, etc.), on désigne par langage formel un...) est formé :
La force (Le mot force peut désigner un pouvoir mécanique sur les choses, et aussi, métaphoriquement, un...) des langages formels est de pouvoir faire abstraction ( En philosophie, l'abstraction désigne à la fois une opération qui consiste a isoler par la...) de la sémantique, ce qui rend les théories réutilisables dans plusieurs modèles. Ainsi, alors qu'un calcul particulier de paye ou de matrice inverse (En mathématiques, l'inverse d'un élément x d'un ensemble muni d'une loi de...) restera toujours un calcul de paye ou de matrice inverse, un théorème (Un théorème est une proposition qui peut être mathématiquement démontrée, c'est-à-dire une...) sur les groupes s'appliquera aussi bien sur l'ensemble des entiers que sur les transformations du cube (En géométrie euclidienne, un cube est un prisme dont toutes les faces sont carrées....) de Rubik.
Le langage formel d'une discipline scientifique (Un scientifique est une personne qui se consacre à l'étude d'une science ou des sciences et qui...) est un langage obéissant à une syntaxe formelle stricte, servant à exposer des énoncés de manière précise, si possible concise et sans ambiguïté ; ce qui l'oppose au langage naturel (Un langage naturel est une langue « normale » parlée par un être humain.).
Le langage formel a pour avantage de rendre aisées la manipulation et la transformation d'énoncés. Des règles de transformation précises (développement de formules logiques, formes normales, contrapositions, commutativité, associativité, etc.) peuvent être appliquées sans même connaître la signification de l'énoncé transformé ou la signification de la transformation. C'est un outil d'exploration (L'exploration est le fait de chercher avec l'intention de découvrir quelque chose d'inconnu.) puissant, et c'est le seul langage qui permette aux machines de " faire des mathématiques ".
L'inconvénient est évident : ne pas connaître le sens (SENS (Strategies for Engineered Negligible Senescence) est un projet scientifique qui a pour but...) de l'énoncé empêche de savoir quelles sont les transformations pertinentes et nuit à l'intuition du raisonnement. Ainsi, il est bon de savoir lire rapidement un énoncé en langage formel et de le traduire tout (Le tout compris comme ensemble de ce qui existe est souvent interprété comme le monde ou...) aussi rapidement en un ou plusieurs énoncés du langage naturel, plus significatif.
Dès le début de l'informatique les chercheurs ont développé des outils d'aide à la traduction des langages, afin de passer (Le genre Passer a été créé par le zoologiste français Mathurin Jacques...) du format externe au format interne (En France, ce nom désigne un médecin, un pharmacien ou un chirurgien-dentiste, à la...) de l'ordinateur (Un ordinateur est une machine dotée d'une unité de traitement lui permettant...). Les outils les plus connus sont Lex et Yacc (Lex et yacc sont des outils très populaires de génération d'analyseurs lexicaux (Lex) et...). D'autres chercheurs ont défini la sémantique des langages de programmation (La programmation dans le domaine informatique est l'ensemble des activités qui permettent...).
Les mathématiques existent depuis l'antiquité mais la manière de les exprimer a énormément évolué.
Comme pour toute discipline, le langage de la discipline ne préexiste évidemment pas à la discipline elle-même. Il a donc fallu utiliser des langues qui n'ont pas été construites pour les mathématiques, qui peu à peu se sont enrichies d'un jargon spécifique.
Ainsi, bien des énoncés mathématiques anciens nous paraissent aujourd'hui avoir une formulation (La formulation est une activité industrielle consistant à fabriquer des produits...) plutôt alambiquée, surchargée de périphrases quand il n'existe pas de mots pour désigner certains concepts.
Le jargon s'est donc enrichi au cours des siècles et continue encore d'évoluer.
Parallèlement à ce phénomène, s'est progressivement formé le langage formel qui est devenu celui que nous connaissons, le jargon naturel ne s'étant montré ni assez précis ni assez concis.
Au début du XXe siècle, le mathématicien (Un mathématicien est au sens restreint un chercheur en mathématiques, par extension toute...) David Hilbert (David Hilbert (23 janvier 1862 à Königsberg en Prusse-Orientale –...), et avec lui, les formalistes pensaient pouvoir unifier les mathématiques grâce à une axiomatisation générale et à l'usage (L’usage est l'action de se servir de quelque chose.) d'un langage formel commun.
Cette vision des mathématiques fut mise à mal en 1931 lorsque le logicien Kurt Gödel (Kurt Gödel (28 avril 1906 - 14 janvier 1978) est un mathématicien et...) annonça son célèbre théorème d'incomplétude (On parle de complétude en mathématiques dans des sens très différents. On dit d'un objet...) qui stipule (En botanique, les stipules sont des pièces foliaires, au nombre de deux, en forme de feuilles...) que dans tout système formel (Un système formel est un ensemble de formules, ou expressions formelles, que l’on peut...) contenant l'arithmétique (L'arithmétique est une branche des mathématiques qui comprend la partie de la...), il existe au moins une proposition indécidable.
Pour revenir aux langages formels, la conséquence de ce théorème est la suivante : étant donné un langage formel, ses axiomes, et son système de déduction formel capables d'exprimer l'arithmétique, on peut énoncer une proposition de ce langage qui ne peut pas être prouvée dans ce système, ainsi que sa négation. On aura beau formaliser les mathématiques, on trouvera toujours un énoncé formel dont la démonstration (En mathématiques, une démonstration permet d'établir une proposition à partir...) oblige à quitter ou élargir ce formalisme en ajoutant de nouveaux axiomes, ce qui introduira immanquablement de nouveaux énoncés indécidables. Ainsi l'approche formaliste, qui reste pourtant valable, a désormais des limites connues.
Dans la seconde ( Seconde est le féminin de l'adjectif second, qui vient immédiatement après le premier ou qui...) moitié du XXe siècle, l'avènement des ordinateurs et de l'informatique a donné une place particulière aux langages formels en tant qu'outils et en tant qu'objets d'étude, ce qui était relativement nouveau.
Les traités de mathématiques utilisent à la fois langage formel et langage naturel. Le langage formel est réservé aux passages techniques et aux énoncés suffisamment simples pour ne pas nécessiter d'amples explications, et les résultats importants sont souvent explicités à la fois en langage formel et naturel.
Le langage formel mathématique (Les mathématiques constituent un domaine de connaissances abstraites construites à l'aide...) contemporain est décrit dans cet article.
Les langages formels sont aussi l'objet d'étude d'une branche à part entière de la logique et de l'informatique théorique (L'informatique théorique est l'étude des fondements logiques et mathématiques de...). Cette étude est fortement liée à la théorie (Le mot théorie vient du mot grec theorein, qui signifie « contempler, observer,...) de la calculabilité (La théorie de la calculabilité (appelée aussi parfois théorie de la...). En effet le propre d'un langage formel, en tant que langage, c'est de pouvoir être traité par un ordinateur, ou par son modèle formel : la machine de Turing (Une machine de Turing est un modèle abstrait du fonctionnement des appareils mécaniques...).
En tant qu'objet d'étude, un langage formel est défini comme un ensemble de mots de longueur (La longueur d’un objet est la distance entre ses deux extrémités les plus...) finie (c'est-à-dire chaînes de caractères) déduit d'un certain alphabet fini, c'est-à-dire une partie du monoïde (En mathématiques, un monoïde est une structure algébrique consistant en un ensemble...) libre sur cet alphabet.
Typiquement, un alphabet serait : {a, b}, et un mot sur cet alphabet serait : ababba.
Un langage typique sur cet alphabet, et qui contiendrait ce mot, serait l'ensemble de tous les mots qui contiennent le même nombre (La notion de nombre en linguistique est traitée à l’article « Nombre...) de symboles a et b.
Le mot vide (Le vide est ordinairement défini comme l'absence de matière dans une zone spatiale.) (le mot de longueur nulle) est autorisé et est noté ε. Bien que l'alphabet soit un ensemble fini (En mathématiques, un ensemble E est dit fini si et seulement s'il existe un entier n et une...) et que chaque mot ait une longueur finie, un langage peut très bien contenir une infinité de mots (parce que la longueur de ses mots peut ne pas être bornée).
Quelques exemples de langages formels :
Un langage formel peut être spécifié par différents moyens, comme :
Plusieurs opérations peuvent être utilisées pour fabriquer de nouveaux langages à partir de ceux qu'on connaît. Supposons que L1 et L2 soient des langages sur un certain alphabet commun.
Des questions typiques que l'on se pose à propos d'un langage formel sont les suivantes:
Ces questions relèvent des domaines de la théorie de la calculabilité et de la théorie de la complexité (La théorie de la complexité s'intéresse à l'étude formelle de la difficulté des problèmes en...).