World Wide Web - Définition et Explications

Source: Wikipédia sous licence CC-BY-SA 3.0.
La liste des auteurs est disponible ici.

Le World Wide Web, littéralement la " toile (d'araignée)[1] mondiale ", est communément appelé le Web, parfois la Toile ou le WWW[2]. C'est un système hypertexte (Un système hypertexte est un système contenant des documents liés entre eux par des hyperliens...) public fonctionnant sur Internet (Internet est le réseau informatique mondial qui rend accessibles au public des services...) et qui permet de consulter, avec un navigateur, des pages mises en ligne dans des sites. L'image de la toile vient des hyperliens qui lient les pages Web entre elles.

Le Web n'est qu'une des applications d'Internet, avec le courrier électronique (Le courrier électronique, courriel ou email/e-mail, est un service de transmission de messages...), la messagerie instantanée (La messagerie instantanée ou le clavardage (qc), également désignée par...), Usenet, etc. Le Web a été inventé plusieurs années après Internet, mais c'est le Web qui a rendu (Le rendu est un processus informatique calculant l'image 2D (équivalent d'une photographie)...) les médias grand public attentifs à Internet. Depuis, le Web est fréquemment confondu avec Internet ; en particulier, le mot Toile est souvent utilisé dans le langage courant sans qu'il soit clair s'il désigne le Web ou Internet.

logo historique du WWW par Robert Cailliau
logo historique du WWW par Robert Cailliau (Robert Cailliau est un pionnier du World Wide Web, parfois décrit comme co-inventeur, né...)

Terminologie

Termes désignant le World Wide Web (Le World Wide Web, littéralement la « toile (d’araignée)...)

Le World Wide Web est et a été désigné par de nombreux noms et abréviations synonymes : WorldWideWeb, World Wide Web, World-wide Web, Web, WWW, W3, Toile d'araignée mondiale, Toile mondiale, Toile.

Le nom du projet (Un projet est un engagement irréversible de résultat incertain, non reproductible a...) originel était WorldWideWeb[3]. Les mots ont été rapidement séparés en World Wide Web pour améliorer la lisibilité. Le nom World-Wide Web a également été utilisé par les inventeurs du Web, mais le nom désormais préconisé par le World Wide Web Consortium (Le World Wide Web Consortium, abrégé W3C, est un consortium fondé en octobre 1994 pour...) sépare les trois mots sans trait d'union[4]. Bien que " mondial " s'écrive world-wide ou worldwide en anglais, l'orthographe World Wide Web et l'abréviation Web sont maintenant bien établis.

En inventant le Web, Tim Berners-Lee (Tim Berners-Lee - citoyen britannique né à Londres le 8 juin 1955 et dont le...) avait aussi pensé à d'autres noms, comme Information Mesh (maillage d'informations), Mine of Information ou encore The Information Mine (la mine d'informations, dont le sigle serait Tim).

Le sigle WWW a été largement utilisé pour abréger World Wide Web avant que l'abréviation Web ne prenne le pas. La prononciation laborieuse en français comme en anglais de WWW a sans doute précipité (En chimie et en métallurgie, un précipité est la formation d'une phase...) son déclin. Les lettres www restent cependant très utilisées dans les adresses Web et quelques autres usages formels ou techniques, bien que cela ne réponde à aucune contrainte technique. Dans la seconde ( Seconde est le féminin de l'adjectif second, qui vient immédiatement après le premier ou qui...) moitié des années 1990, alors que les réseaux étaient engorgés par la popularité grandissante du Web, une blague répandue prétendait que WWW signifiait World Wide Wait, soit " attente mondiale ". WWW est parfois abrégé en W3, abréviation qu'on retrouve dans le sigle W3C du World Wide Web Consortium.

Pour écrire " le Web ", l'usage (L’usage est l'action de se servir de quelque chose.) de la minuscule (" le web ") est de plus en plus courant. L'Office québécois de la langue française préconise la majuscule[5], le Journal officiel français préconise " la toile d'araignée mondiale "[6]. Cet article fait la distinction entre " le Web " et " un web ", aussi la majuscule est toujours utilisée pour désigner le Web.

Termes rattachés au Web

La terminologie propre au Web contient plusieurs dizaines de termes. Ce chapitre expose ceux qui sont utilisés dans cet article.

L'expression en ligne signifie " connecté à un réseau ", en l'occurrence le réseau informatique (Un réseau informatique est un ensemble d'équipements reliés entre eux pour...) Internet. Cette expression n'est pas propre au Web, on la retrouve à propos du téléphone (Le téléphone est un système de communication, initialement conçu pour transmettre la voix...).

Un hôte est un ordinateur (Un ordinateur est une machine dotée d'une unité de traitement lui permettant...) en ligne. Chaque hôte d'Internet est identifié par une adresse IP (Une adresse IP (avec IP pour Internet Protocol) est le numéro qui identifie chaque ordinateur...) à laquelle correspondent zéro (Le chiffre zéro (de l’italien zero, dérivé de l’arabe sifr,...), un ou plusieurs noms d'hôte. Cette terminologie n'est pas propre au Web, mais à Internet.

Une ressource du Web est une entité informatique (L´informatique - contraction d´information et automatique - est le domaine...) (texte, image, forum Usenet, boîte aux lettres électronique, etc.) accessible indépendamment d'autres ressources. Une ressource en accès public est librement accessible depuis Internet. Une ressource locale est présente sur l'ordinateur utilisé, par opposition à une ressource distante (ou en ligne), accessible à travers un réseau (Un réseau informatique est un ensemble d'équipements reliés entre eux pour échanger des...).

On ne peut accéder à une ressource distante qu'en respectant un protocole de communication (Dans les réseaux informatiques et les télécommunications, un protocole de communication est une...). Les fonctionnalités de chaque protocole varient : réception, envoi, voire échange continu d'informations.

HTTP (pour HyperText Transfer Protocol) est le protocole de communication (La communication concerne aussi bien l'homme (communication intra-psychique, interpersonnelle,...) communément utilisé pour transférer les ressources du Web. HTTPS est la variante sécurisée de ce protocole.

Une URL (pour Uniform Resource Locator) pointe sur une ressource. C'est une chaîne de caractères (En informatique, une chaîne de caractères est une suite ordonnée de caractères....) permettant d'indiquer un protocole de communication et un emplacement pour toute ressource du Web.

Un hyperlien (Un hyperlien ou lien hypertexte ou simplement lien, est une référence dans un système hypertexte...) (ou lien) est un élément dans une ressource associé à une URL. Les hyperliens du Web sont orientés : ils permettent d'aller d'une source à une destination. Seule la ressource à la source contient les données définissant l'hyperlien, la ressource de destination n'en porte aucune trace (TRACE est un télescope spatial de la NASA conçu pour étudier la connexion entre le...). Il existe deux types d'hyperlien : ceux du premier type doivent être activés pour accéder à la destination ; ceux du second causent un accès automatique (L'automatique fait partie des sciences de l'ingénieur. Cette discipline traite de la...) à la destination.

HTML (pour HyperText Markup Language) est un langage informatique (On appelle langage informatique un langage formel utilisé lors de la conception, la mise en...) permettant de décrire le contenu d'un document (Dans son acception courante un document est généralement défini comme le support physique d'une...) (titres, paragraphes, disposition des images, etc.) et d'y inclure des hyperliens. Un document HTML est un document décrit avec le langage HTML. Les documents HTML sont les ressources les plus consultées du Web.

Dans un mode de communication client-serveur (L'architecture client/serveur désigne un mode de communication entre plusieurs ordinateurs d'un...), un serveur est un hôte sur lequel fonctionne un logiciel serveur auquel peuvent se connecter des logiciels clients fonctionnant sur des hôtes clients.

Un serveur Web est un hôte sur lequel fonctionne un serveur HTTP (ou serveur Web). Un serveur Web héberge les ressources qu'il dessert.

Un navigateur Web (Un navigateur Web est un logiciel conçu pour consulter le World Wide Web. Techniquement, c'est...) est un logiciel client (Le mot client a plusieurs acceptations :) HTTP conçu pour accéder aux ressources du Web. Sa fonction de base est de permettre la consultation des documents HTML disponibles sur les serveurs HTTP. Le support d'autres types de ressource et d'autres protocoles de communication dépend du navigateur considéré.

Une page Web (Une page Web est une ressource du World Wide Web conçue pour être consultée par des...) (ou page) est un document destiné à être consulté avec un navigateur Web. Une page Web est toujours constituée d'une ressource centrale (généralement un document HTML) et d'éventuelles ressources liées automatiquement accédées (typiquement des images).

Un éditeur HTML (Un éditeur HTML (ou éditeur Web) est un logiciel conçu pour faciliter la préparation et la...) (ou éditeur Web) est un logiciel conçu pour faciliter l'écriture de documents HTML et de pages Web en général.

Un site Web (Un site Web est un ensemble de pages Web hyperliées entre elles et mises en ligne à une...) (ou site) est un ensemble (En théorie des ensembles, un ensemble désigne intuitivement une collection...) de pages Web et d'éventuelles autres ressources, liées dans une structure cohérente, publiées par un propriétaire (une entreprise, une administration, une association, un particulier, etc.) et hébergées sur un ou plusieurs serveurs Web.

Visiter un site Web signifie " consulter ses pages ". Le terme visite vient du fait que l'on consulte généralement plusieurs pages d'un site, comme on visite les pièces d'un bâtiment. La visite est menée par un utilisateur (ou visiteur ou internaute (Un internaute est un utilisateur du réseau Internet.)). La mesure d'audience est obtenue en copiant le code en javascript (JavaScript est un langage de programmation de scripts principalement utilisé dans les pages...) d’un lien vers le site d'un prestataire spécialisé suivant la technique du marqueur à distance.

Une adresse Web (Les adresses Web sont l'une des trois inventions à la base du World Wide Web, et selon ses...) est une URL de page Web, généralement écrite sous une forme simplifiée limitée à un nom d'hôte. Une adresse (Les adresses forment une notion importante en communication, elles permettent à une entité de...) de site Web est en fait l'adresse d'une page du site prévue pour accueillir les visiteurs.

Un hébergeur Web est une entreprise de services informatiques hébergeant (mettant en ligne) sur ses serveurs Web les ressources constituant les sites Web de ses clients.

Une agence Web (Une agence Web est une entreprise spécialisée dans la création et la mise à jour de sites Web....) est une entreprise de services informatiques réalisant des sites Web pour ses clients.

L'expression surfer sur le Web signifie " consulter le Web ". Elle a été inventée pour mettre l'accent sur le fait que consulter le Web consiste à suivre de nombreux hyperliens de page en page. Elle est principalement utilisée par les médias ; elle n'appartient pas au vocabulaire technique.

Un annuaire (Un annuaire est une publication (imprimée ou électronique) mise à jour chaque année qui...) Web est un site Web répertoriant des sites Web.

Un portail Web (Un portail Web (de l'anglais Web portal) est un site Web qui offre une porte d'entrée unique...) est un site Web tentant de regrouper la plus large palette d'informations et de services possibles dans un site Web. Certains portails sont thématiques.

Un service Web (Un service web (ou service de la toile) est un programme informatique permettant la communication...) est une technologie (Le mot technologie possède deux acceptions de fait :) client-serveur basée sur les protocoles du Web.

Architecture (L’architecture peut se définir comme l’art de bâtir des édifices.)

Modèle mathématique (Un modèle mathématique est une traduction de la réalité pour pouvoir lui appliquer les outils,...)

Le World Wide Web, en tant qu'ensemble de ressources hypertextes, est modélisable en graphe orienté avec les ressources pour sommets et les hyperliens pour arêtes. Du fait que le graphe est orienté, certaines ressources peuvent constituer des puits (ou des cul-de-sac, moins formellement) : il n'existe aucun chemin vers le reste du Web. À l'inverse (En mathématiques, l'inverse d'un élément x d'un ensemble muni d'une loi de...), certaines ressources peuvent constituer des sources : il n'existe aucun chemin depuis le reste du Web.

Techniquement, rien ne distingue le World Wide Web d'un quelconque autre web utilisant les mêmes technologies ; d'ailleurs d'innombrables webs privés existent. Dans la pratique, on considère qu'une page d'un site Web populaire, comme un annuaire Web, fait partie du Web. Le Web peut alors être défini comme étant l'ensemble des ressources et des hyperliens que l'on peut récursivement découvrir à partir de cette page, ce qui exclut les sources et les webs privés.

Exploration (L'exploration est le fait de chercher avec l'intention de découvrir quelque chose d'inconnu.) du Web

L'exploration récursive du Web à partir de ressources bien choisies est la méthode de base des robots d'indexation des moteurs de recherche (La recherche scientifique désigne en premier lieu l’ensemble des actions entreprises en vue...). Dans la pratique, plusieurs catégories de ressources découvertes sont souvent ignorées :

  • les ressources sans accès public, notamment les pages personnelles, administratives ou payantes, protégées par un mot de passe ;
  • les ressources appartenant à des systèmes distincts et souvent plus anciens que le Web (courrier électronique, Usenet, sites FTP), voire simplement les ressources non servies par un serveur HTTP ou HTTPS ;
  • les ressources de format de données non supportés ;
  • les ressources listées dans un fichier ( Un fichier est un endroit où sont rangées des fiches. Cela peut-être un meuble, une pièce,...) d'exclusion des robots ;
  • les ressources vers lesquels les hyperliens sont créés dynamiquement en réponse aux interrogations des visiteurs.

En 2004, les moteurs de recherche indexent environ 4 milliards de ressources.

Web profond (Le web profond ou web invisible (en anglais deep web) est la partie du web accessible en ligne,...)

Le " Web profond " ou " Web invisible " est la partie du Web qui n'est pas explorée par les robots d'indexation et donc introuvable avec les moteurs de recherche généralistes. Des études indiquent que la partie invisible du Web représente plus de 99% du Web. Le Web profond est notamment fait des ressources dans un format de donnée (Le format des données est la manière utilisée en informatique pour représenter...) incompatible avec les moteurs de recherche, des ressources contenues dans des sites Web si grands que les robots d'indexation renoncent à les indexer entièrement et des ressources qui n'ont pas d'adresse connue. Ces dernières ressources proviennent généralement de bases de données et sont servies en réponse aux requêtes entrées par les visiteurs.

Serveurs publics

L'exploration récursive n'est pas le seul moyen utilisé pour indexer le Web et mesurer sa taille. L'autre solution consiste à mesurer l'infrastructure informatique connectée à Internet pour héberger des sites Web. Au lieu de suivre des hyperliens, cette méthode consiste à utiliser les noms de domaine enregistrés dans le Domain Name System et essayer de se connecter à tous les serveurs Web potentiels. C'est notamment la méthode utilisée par la société Netcraft (Netcraft est une entreprise basée à Bath en Angleterre. Elle est spécialisée dans les...), qui publie régulièrement les résultats de ses explorations, dont les mesures de popularité des serveurs HTTP. Cette mesure porte plus sur l'utilisation des technologies du Web que sur le Web lui-même. Elle permet notamment de trouver des sites publics qui ne sont pas liés au World Wide Web.

Intranets et webs privés

Un web disponible sur un intranet est privé. Il est soit totalement séparé du Web, soit une source du Web. Il est une source lorsque l'intranet est relié à Internet et qu'un hyperlien du web pointe sur une ressource du Web. Les liens depuis le Web sont en revanche impossibles car par définition (Une définition est un discours qui dit ce qu'est une chose ou ce que signifie un nom. D'où la...) un intranet n'offre pas d'accès public.

Une source peut aussi se trouver sur Internet. En ce cas, elle constitue un web virtuellement privé, car le public ne peut pas le découvrir en suivant des hyperliens.

Archivage (L'archivage est l'action de mettre en archive, d'archiver. Employé surtout à l'origine pour les...)

Le Web change constamment : les ressources ne cessent d'être créées, modifiées et supprimées. Il existe quelques initiatives d'archive du Web dont le but est de permettre de retrouver ce que contenait un site à une date donnée (Dans les technologies de l'information (TI), une donnée est une description élémentaire, souvent...). Le projet Internet Archive (L’Internet Archive (IA) est une organisation à but non lucratif consacrée à...) est l'un d'eux.

Types de ressource

Les divers types de ressource du Web ont des usages assez distincts :

  • les ressources constituant les pages Web : documents HTML, images JPEG (La norme JPEG est une norme qui définit le format d'enregistrement et l'algorithme de...) ou PNG ou GIF, scripts JavaScript, feuilles de style CSS, sons, animations ;
  • les ressources accessibles depuis une page Web mais consultables avec une interface (Une interface est une zone, réelle ou virtuelle qui sépare deux éléments. L’interface...) particulière : flux (Le mot flux (du latin fluxus, écoulement) désigne en général un ensemble d'éléments...) audio, flux vidéo ;
  • les ressources conçues pour être consultées séparément : documents (PDF, PostScript (Le PostScript est un langage informatique spécialisé dans la description de pages, mis au...), Word, etc), fichier texte, images de tout (Le tout compris comme ensemble de ce qui existe est souvent interprété comme le monde ou...) types, morceaux de musique, vidéo (La vidéo regroupe l'ensemble des techniques, technologie, permettant l'enregistrement ainsi que la...), fichiers à sauvegarder ;
  • les ressources appartenant à des systèmes bien distincts du Web : forums Usenet, boîtes aux lettres électronique, fichiers locaux.

Documents HTML

Le document HTML est la principale ressource d'une page Web, celle qui contient les hyperliens, qui contient et structure le texte, qui lie et dispose les ressources multimédias. Un document HTML contient uniquement du texte : le texte consulté, le texte en langage HTML plus d'éventuels autres langages de script ou de style.

La présentation de documents HTML est la principale fonctionnalité d'un navigateur Web. HTML laisse au navigateur le soin d'exploiter au mieux les capacités de l'ordinateur pour présenter les ressources. Typiquement, la police de caractère, la longueur (La longueur d’un objet est la distance entre ses deux extrémités les plus...) des lignes de texte, les couleurs, etc, doivent être adaptées au périphérique de sortie (écran, imprimante (Les imprimantes ont été conçues dès l’apparition des premiers...), etc).

Multimédia (Le mot multimédia est apparu vers la fin des années 1980, lorsque les CD-ROM se sont...)

Les éléments multimédias proviennent toujours de ressources indépendantes du document HTML. Les documents HTML contiennent des hyperliens pointant sur les ressources multimédias, qui peuvent donc être éparpillées sur Internet. Les éléments multimédias liés sont automatiquement transférés pour présenter une page Web.

Seul l'usage des images et des petites animations est standardisé. Le support du son, de la vidéo, d'espaces tridimensionnels ou d'autres éléments multimédias repose encore sur des technologies non standardisées. De nombreux navigateurs Web proposent la possibilité de greffer des logiciels (plugin) pour étendre leurs fonctionnalités, notamment le support de types de média (On nomme média un moyen impersonnel de diffusion d'informations (comme la presse, la radio, la...) non standard.

Les flux (audio, vidéo) nécessitent un protocole de communication au fonctionnement différent de HTTP. C'est une des raisons pour lesquelles ce type de ressource nécessite souvent un plugin (En informatique, un plugin ou plug-in (aussi nommé module d'extension, greffon ou plugiciel au...) et est mal intégré aux pages Web.

Images

Ce chapitre concerne les images intégrées aux pages Web.

L'usage du format de données JPEG est indiqué pour les images naturelles, principalement les photographies.

L'usage du format de données PNG est indiqué pour les images synthétiques (logos, éléments graphiques). Il est aussi indiqué pour les images naturelles, mais uniquement lorsque la qualité prime totalement sur la durée du transfert.

L'usage du format de données GIF est indiqué pour les petites animations. Pour les images synthétiques, la popularité ancienne de GIF le fait souvent préférer à PNG. Cependant, GIF souffre de quelques désavantages, notamment la limitation du nombre (La notion de nombre en linguistique est traitée à l’article « Nombre...) de couleurs et un degré (Le mot degré a plusieurs significations, il est notamment employé dans les domaines...) de compression généralement moindre. En outre une controverse a entouré l'usage de GIF de 1994 à 2004 car Unisys a fait valoir un brevet couvrant la méthode de compression.

L'usage d'images de format de données XBM est obsolète.

Scripts

Un langage de script permet d'écrire le texte d'un programme directement exécuté par un logiciel. Dans le cadre du Web, un script est exécuté par un navigateur Web et programme des actions répondant à l'usage que le visiteur fait de la page Web consultée. Un script peut être intégré au document HTML ou provenir d'une ressource liée. Le premier langage de script du Web fut JavaScript, développé par Netscape. Ensuite Microsoft (Microsoft Corporation (NASDAQ : MSFT) est une multinationale américaine de solutions...) a développé une variante concurrente sous le nom de JScript. Finalement, la norme (Une norme, du latin norma (« équerre, règle ») désigne un...) ECMAScript (ECMAScript est un langage de programmation de type script standardisé par Ecma International...) a été proposée pour la syntaxe du langage, et les normes DOM pour l'interface avec les documents.

Styles

Le langage CSS a été développé pour gérer en détail la présentation des documents HTML. Le texte en langage CSS peut être intégré au document HTML ou provenir de ressources liées, les feuilles de style. Cette séparation (D'une manière générale, le mot séparation désigne une action consistant à séparer quelque...) permet une gestion séparée de l'information (contenue dans des documents HTML) et de sa présentation (contenue dans des feuilles de style). On parle aussi de " séparation du fond et de la forme ".

Autres

La gestion des autres types de ressource dépend des logiciels installés sur l'hôte client et de leurs réglages.

Lorsque le logiciel correspondant est disponible, les documents et images de tout types sont généralement automatiquement présentés, selon des modalités (fenêtrage, dialogues) dépendant du navigateur Web et du logiciel gérant le type. Lorsque le type de la ressource n'est pas géré, il est généralement possible de la sauver dans un fichier local.

Pour gérer les ressources de systèmes différents du Web comme le courrier électronique, les navigateurs font habituellement appel à des logiciels séparés. Si aucun logiciel ne gère un type de ressource, un simple message (La théorie de l'information fut mise au point pour déterminer mathématiquement le taux...) d'erreur l'indique.

Conception

Universalité

Le Web a été conçu pour être accessible avec les équipements informatiques les plus divers : station de travail, terminal informatique en mode texte (En informatique, le mode texte, par opposition au mode graphique, est un type d'affichage sur...), ordinateur personnel (Un ordinateur personnel, encore appelé micro-ordinateur ou ordinateur individuel, est un...), PDA, etc. Cette universalité d'accès dépend en premier lieu de l'universalité des protocoles Internet. En second lieu, elle dépend de la flexibilité de présentation des pages Web, offerte par HTML. En outre, HTTP offre aux navigateurs la possibilité de négocier le type de chaque ressource. Enfin, CSS permet de proposer différentes présentations, sélectionnées pour leur adéquation avec l'équipement utilisé.

L'accessibilité du Web pour les individus handicapés est aussi l'objet (De manière générale, le mot objet (du latin objectum, 1361) désigne une entité définie dans...) d'attentions particulières comme la Web Accessibility Initiative.

Décentralisation

Les technologies du Web n'imposent pas d'organisation (Une organisation est) entre les pages Web, ni a fortiori entre les sites Web. Toute page du Web peut contenir un hyperlien vers toute autre ressource accessible d'Internet. L'établissement d'un hyperlien ne requiert absolument aucune action du côté de la ressource pointée. Il n'y a pas de registre centralisé d'hyperliens, de pages ou de sites. Le seul registre utilisé est celui du DNS, c'est une base de donnée (Dans les technologies de l'information, une donnée est une description élémentaire,...) distribuée qui répertorie des hôtes et est utile à tous les systèmes basés sur Internet.

Cette conception décentralisée devait favoriser, et a favorisé, une augmentation rapide de la taille du Web. Elle a aussi favorisé l'essor de sites spécialisés dans les informations sur les autres sites : les annuaires et les moteurs de recherche. Sans ces sites, la recherche d'information dans le Web serait extrêmement laborieuse. La démarche inverse, le portail Web, tente de concentrer un maximum d'informations et de services dans un seul site.

Une faiblesse de la décentralisation est le manque de suivi lorsqu'une ressource est déplacée ou supprimée : les hyperliens qui la pointaient se retrouvent cassés. Et cela n'est visible qu'en activant l'hyperlien, le résultat le plus courant étant le message d'erreur 404.

Technologies

Pré-existantes

Le Web repose sur les technologies d'Internet, notamment TCP/IP pour assurer le transfert des données, DNS pour convertir les noms d'hôte en adresses IP et MIME pour indiquer le type des données. Les formats d'image numérique (On désigne sous le terme d’image numérique toute image (dessin, icône,...) GIF et JPEG ont été développé indépendamment.

Spécifiques

Trois technologies ont dû être développées pour le World Wide Web :

  • les URL pour pouvoir identifier toute ressource dans un hyperlien ;
  • le langage HTML pour écrire des pages Web contenant des hyperliens ;
  • le protocole de communication HTTP utilisé entre les navigateurs et les serveurs Web, qui permet d'indiquer le type MIME (Un Internet media type, à l'origine appelé Type MIME ou juste MIME ou encore...) des ressources transférées.

Ces premières technologies ont été normalisées comme les autres technologies d'Internet : en utilisant le processus des Request for Comments ( ). Cela a donné le RFC 1738 pour les URL, le RFC 1866 pour HTML 2.0 et le RFC 1945 pour HTTP/1.0.

Le World Wide Web Consortium (W3C) a été fondé en 1994 pour développer et promouvoir les nouveaux standards du Web. Son rôle est notamment de veiller à l'universalité des nouvelles technologies. Des technologies ont également été développées par des entreprises privées.

Actuelles

Les principaux standards actuels sont :

  • XML 1.0 développé pour donner aux langages de balises, dont HTML, une syntaxe plus simple que SGML ;
  • HTML 4.01 basé sur SGML, et XHTML 1.0 basés sur XML ;
  • le RFC 2396 (Uniform Resource Identifiers), qui recouvre les URL ;
  • le RFC 2616 (HTTP/1.1) ;
  • les feuilles de styles en cascade CSS level 1 et level 2 ;
  • les modèles de document DOM level 1 et level 2 ;
  • le langage de script JavaScript pour manipuler les documents ;
  • les formats d'image numérique (Une information numérique (en anglais « digital ») est une information...) PNG, JPEG et GIF.

Historique

Tim Berners-Lee travaille comme informaticien (On nommait dans les années 1960-1980 informaticien ou informaticienne une personne...) à l'Organisation européenne pour la recherche nucléaire (Le terme d'énergie nucléaire recouvre deux sens selon le contexte :) (CERN) lorsqu’il propose, en 1989, de créer un système hypertexte distribué sur le réseau informatique pour que les collaborateurs puissent partager les informations au sein du CERN.[7] Cette même année (Une année est une unité de temps exprimant la durée entre deux occurrences d'un évènement lié...), les responsables du réseau du CERN décident d'utiliser le protocole de communication TCP/IP et le CERN ouvre sa première connexion extérieure avec Internet.[8]

L’année suivante, l’ingénieur système Robert Cailliau se joint au projet d'hypertexte au CERN, immédiatement convaincu de son intérêt, et se consacre énergiquement à sa promotion.[9] Tim Berners-Lee et Robert Cailliau sont reconnus comme les deux personnes à l'origine du World Wide Web.

Jusqu'en 1993, le Web est essentiellement développé sous l'impulsion de Tim Berners-Lee et Robert Cailliau. Les choses changent avec l'apparition de NCSA Mosaic, un navigateur Web développé par Eric Bina et Marc Andreessen (Marc Andreessen (9 juillet 1971 - ) était un des membres de l'équipe d'étudiants de...) au National Center for Supercomputing Applications (NCSA), dans l'Illinois. NCSA Mosaic jette les bases de l'interface graphique des navigateurs modernes et cause un accroissement exponentiel de la popularité du Web. Le NCSA produit également le NCSA HTTPd, un serveur HTTP qui évoluera en Apache HTTP Server, le serveur HTTP le plus utilisé depuis 1996.

En 1994, Netscape Communications Corporation est fondée avec une bonne partie de l'équipe de développement de NCSA Mosaic. Sorti fin 1994, Netscape Navigator (Netscape Navigator était un navigateur Web qui dominait le marché au milieu des...) supplante NCSA Mosaic en quelques mois (Le mois (Du lat. mensis «mois», et anciennement au plur. «menstrues») est une période de temps...).

En 1995, Microsoft essaie de concurrencer Internet avec The Microsoft Network (MSN, anciennement The Microsoft Network, était originellement conçu par Microsoft pour...) (MSN) et échoue. Fin 1995, après la sortie de Windows 95 sans le moindre navigateur Web préinstallé, Microsoft lance avec Internet Explorer (Internet Explorer (officiellement Windows Internet Explorer depuis la version 7), parfois...) la guerre des navigateurs contre Netscape Navigator.

Chronologie

Les premières années de cet historique sont largement basées sur A Little History of the World Wide Web (Une petite histoire du World Wide Web).

  • 1989
    • Tim Berners-Lee, engagé au CERN à Genève en 1984 pour travailler sur l'acquisition (En général l'acquisition est l'action qui consiste à obtenir une information ou à acquérir un...) et le traitement des données,[10] propose de développer un système hypertexte organisé en web, afin d'améliorer la diffusion (Dans le langage courant, le terme diffusion fait référence à une notion de...) des informations internes : Information Management: A Proposal.[7]
  • 1990
    • Robert Cailliau rejoint le projet et collabore à la révision de la proposition : WorldWideWeb: Proposal for a HyperText Project.[3]
    • Étendue : Le premier serveur Web est nxoc01.cern.ch ; la première page Web est http://nxoc01.cern.ch/hypertext/WWW/TheProject.html ; la plus ancienne page conservée date du 13 novembre.
    • Logiciels : Le premier navigateur, appelé WorldWideWeb (plus tard rebaptisé Nexus) est développé en Objective C sur NeXT (NeXT Computer, Inc (devenue NeXT Software, Inc) était une entreprise d’informatique...) (lien). En plus d'être un navigateur, WorldWideWeb est un éditeur Web. Le navigateur mode texte line-mode est développé en langage C pour être portable sur les nombreux modèles d'ordinateurs et simples terminaux de l'époque.
    • Technologies : Les trois technologies à la base du Web, URL, HTML et HTTP, sont à l'œuvre. Sur NeXT, des feuilles de style simples sont également utilisées, ce qui ne sera plus le cas jusqu'à l'apparition des Cascading Style Sheets.
  • 1991
    • Le 6 août, Tim Berners-Lee rend le projet WorldWideWeb public dans un message sur Usenet (lien).
    • Étendue : premier serveur Web hors d'Europe (L’Europe est une région terrestre qui peut être considérée comme un...) au SLAC ; passerelle avec WAIS (lien).
    • Logiciels : fichiers développés au CERN disponibles par FTP.
  • 1992
    • Le World Wide Web est promu sur le World Wide Web (lien).
    • Étendue : 26 sites Web " raisonnablement fiables " (lien).
    • Logiciels : navigateurs Erwise (lien), ViolaWWW (lien) ; serveur NCSA HTTPd.
  • 1993
    • Le 30 avril, le CERN met les logiciels du World Wide Web dans le domaine public (lien). À la fin de l'année, les médias grand public remarquent Internet et le WWW.
    • Étendue : 130 sites Web en juin, 623 en décembre (lien) ; l'usage croît d'un rythme annuel de 341 634 %.
    • Logiciels : Apparitions des navigateurs NCSA Mosaic et Lynx (Le genre Lynx de la famille des félins (Felidae) et de la sous-famille des félinés...). Disponible d'abord sur X Window (Windows est une gamme de systèmes d'exploitation produite par Microsoft, principalement destinées...), puis sur Windows et MacOS, Mosaic cause un phénoménal accroissement de la popularité du Web.
    • Technologies : images dans les pages Web (Mosaic 0.10) ; formulaires interactifs (Mosaic 2.0pre5).
  • 1994
    • Étendue : 2738 sites en juin, 10 022 en décembre.
    • Sites : Yahoo! (Yahoo!,Inc. est une société américaine de services sur Internet opérant...) créé par deux étudiants ; apparition de la publicité (Bien que le terme (Werbung en allemand, Publicity et Advertising en anglais) désignât d'abord le...) sur HotWired.
    • Logiciels : Netscape Navigator 1.0.
    • Standards : fondation du World Wide Web Consortium ; RFC 1738 (Uniform Resource Locators).
  • 1995
    • Microsoft crée MSN pour concurrencer Internet et le Web, puis change d'avis (Anderlik-Varga-Iskola-Sport (Anderlik-Varga-Ecole-Sport) fut utilisé pour désigner un...) et lance la guerre des navigateurs.
    • Étendue : 23 500 sites en juin (18 957 en août selon la première mesure de Netcraft (lien)).
    • Logiciels : serveur HTTP Apache ; Microsoft Internet Explorer 1 (Explorer 1 (officiellement Satellite 1958 Alpha) est le premier satellite artificiel terrestre des...).0 et 2.0.
    • Sites : moteur de recherche (Un moteur de recherche est une application permettant de retrouver des ressources (pages Web,...) AltaVista (AltaVista (littéralement « vue d'en haut ») est un moteur de recherche du World Wide Web. Il...).
    • Technologies : formatage tabulaire (Netscape Navigator 1.1b1), documents multi-cadres (Netscape Navigator 2.0b1), Java, JavaScript (Netscape Navigator 2.0b3), PHP (PHP (sigle de PHP: Hypertext Preprocessor), est un langage de scripts libre principalement...).
    • Standards : RFC 1866 (HTML 2.0).
  • 1996
    • Étendue : 100 000 sites en janvier, environ 230 000 en juin.
    • Logiciels : Netscape Navigator 2.0 et 3.0 ; Internet Explorer 3.0 ; Opera 2.1.
    • Standards : RFC 1945 (HTTP/1.0) ; CSS level 1.
  • 1997
    • Étendue : plus de 1 000 000 sites en avril selon Netcraft.
    • Logiciels : Netscape Navigator 4.0 ; Internet Explorer 4.0.
    • Standards : HTML 3.2 ; HTML 4.0.
  • 1998
    • America Online (America Online (AOL) est une société américaine de services internet, ancienne...) rachète Netscape qui a perdu la guerre des navigateurs pour 4 milliards US$.
    • Étendue : plus de 2 000 000 sites en mars.
    • Logiciels : Netscape Navigator 4.5 ; projet Mozilla (Mozilla est un nom utilisé en informatique avec beaucoup de significations différentes....).
    • Sites : Google (Google, Inc. est une société fondée le 7 septembre 1998 dans la Silicon Valley en Californie par...).
    • Standards : XML 1.0 ; CSS level 2 ; DOM level 1.
  • 1999
    • Étendue : plus de 4 000 000 de sites en janvier, plus de 7 400 000 en août.
    • Logiciels : Internet Explorer 5.0.
    • Standards : HTML 4.01 ; RFC 2616 (HTTP/1.1).
  • 2000
    • Étendue : 11 161 854 sites en février, 19 823 296 en août selon Netcraft (lien).
    • Standards : XHTML™ 1.0.
  • 2001
    • Étendue : 27 585 719 sites en janvier, 30 775 624 en août.
    • Logiciels : Internet Explorer 6 (Internet Explorer 6 (abrégé IE6) est la sixième version majeure d'Internet Explorer,...).
    • Sites : Wikipedia.
  • 2002
    • Étendue : 36 689 008 sites en janvier, 35 991 815 en août.
    • Logiciels : Mozilla 1.0.
  • 2003
    • Étendue : 35 863 952 sites en février, 42 807 275 en août.
    • Logiciels : Safari.
  • 2004
    • Le concept de Web 2.0 apparaît.
    • Étendue : 46 067 743 sites en janvier, 53 341 867 en août.
    • Standards : création du WHATwg.
    • Logiciels : Mozilla Firefox (Mozilla Firefox est un navigateur Web gratuit, développé et distribué par la Mozilla...) 1.0.
  • 2005
    • Étendue : 59 100 880 sites en février, 70 392 567 en août
    • Logiciels : Mozilla Firefox 1.5.
  • 2006
    • Étendue : 76 184 000 sites en février, 92 615 362 en août.
    • Logiciels : Internet Explorer 7 (Internet Explorer 7 (officiellement Windows Internet Explorer 7), communément abrégé...), Mozilla Firefox 2.0.
  • 2007
    • Étendue : 108 810 358 sites en février.
Cet article vous a plu ? Partagez-le sur les réseaux sociaux avec vos amis !
Page générée en 0.010 seconde(s) - site hébergé chez Contabo
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
Ce site est édité par Techno-Science.net - A propos - Informations légales
Partenaire: HD-Numérique