Techno-Science.net

Mercredi 22 Octobre 2025

Rechercher 🔍

UTF-8 - Définition

Source: Wikipédia sous licence CC-BY-SA 3.0.
La liste des auteurs de cet article est disponible ici.

- Introduction - Description - Inconvénients - Avantages - Histoire

Avantages

Universalité:

Ce codage permet de représenter les milliers de caractères du répertoire universel, commun à la norme ISO/CEI 10646 et au standard Unicode (du moins depuis sa version 1.1).

Compatibilité avec US-ASCII:

Un texte en US-ASCII est codé identiquement en UTF-8.

Interopérabilité:

Du fait qu’un caractère est découpé en une suite d’octets (et non en mots de plusieurs octets), il n'y a pas de problème d’endianness (ou « boutisme »).

Ce problème apparaît avec les codages UTF-16 et UTF-32 par exemple, si on ne les utilise pas avec un marqueur d’ordonnancement (appelé BOM pour Byte Order Mark) codé en début de fichier à l’aide du caractère U+FEFF, qui était auparavant destiné à un autre usage (ZWNBSP pour zero-width non-breaking space, une fonction d’agglutination de mots à afficher sans espace séparatrice ni césure que remplit aujourd’hui le caractère ZWWJ pour zero-width word-joiner). En revanche, les codages dérivés UTF-16BE, UTF-16LE, UTF-32BE et UTF-32LE sont conçus avec un ordonnancement précis ne nécessitant l’emploi d’aucun BOM.
Pour différentes raisons de compatibilité (notamment via des processus de transcodage), il est cependant resté admis qu’un BOM (U+FEFF), non absolument nécessaire, puisse encore être codé en tête d’un fichier UTF-8 (leur interprétation reste celle du caractère ZWNBSP, même si de nombreux protocoles ont choisi d’ignorer et filtrer silencieusement ce caractère puisqu’il ne sert plus qu’à cet usage et que son ancienne fonction, quand elle reste nécessaire à l’interprétation du texte lui-même, est désormais transférée sur un autre caractère codé exprès).

Efficacité:

Pour la plupart des langues à écriture latine, les fichiers de données numériques ou les codes sources de programmes, ou de nombreux protocoles textuels de communication (comme FTP, HTTP ou MIME), qui utilisent abondamment (voire parfois exclusivement dans certaines parties) les caractères US-ASCII, UTF-8 nécessite moins d’octets que l’UTF-16 ou l’UTF-32.

Réutilisabilité:

De nombreuses techniques de programmation informatique valables avec les caractères uniformément codés sur un octet le restent avec UTF-8, notamment :

la manière de repérer la fin d’une chaîne de caractères C, car tout octet binaire 00000000 trouvé dans une chaîne de caractères codés en UTF-8 est toujours le caractère nul (en revanche il est alors impossible de représenter le caractère NUL lui-même comme membre de la chaîne de caractères, à moins que l’information de longueur effective du texte codé soit stockée ou transportée ailleurs de celui-ci, auquel cas cet octet sera interprété comme tel au sein même des chaînes codées en UTF-8).
la manière de trouver une sous-chaîne est identique.

Fiabilité:

Il s’agit d’un codage auto-synchronisant (en lisant un seul octet on sait si c’est le premier d’un caractère ou non).

Il est possible, depuis n’importe quelle position dans un texte codé, de remonter au premier octet de la séquence en lisant une toute petite quantité d’octets antérieurs, soit au maximum 3 octets, ou de trouver facilement le début de la séquence suivante, là encore en ne sautant qu’au maximum 3 octets) ;
Une séquence décrivant un caractère n’apparaît jamais dans une séquence plus longue décrivant un autre caractère (comme c’est le cas de Shift-JIS).
Il n’existe pas de code « d'échappement » changeant l’interprétation (comme caractères) de la suite d’une séquence d’octets.

- Introduction - Description - Inconvénients - Avantages - Histoire

miniature

💉 Des scientifiques réussissent à inverser le vieillissement

miniature

🔭 Découverte d'un objet invisible d'un million de masses solaires

miniature

💉 De l'ARN messager plus solide pour les futurs vaccins

miniature

🪐 A la recherche des Neptunes perdues

miniature

🌊 Découverte: la mer Rouge a disparu puis est réapparue brutalement

miniature

🌊 Quand la fonte des glaces nord-américaines a fait monter les océans de 10 mètres

miniature

🧲 Des étrangetés magnétiques identifiées autour de la Terre

miniature

🐁 Ces souris sauvages possèdent un langage jamais vu

miniature

💥 La fin de l'Univers se précise, sa date de mort est déjà calculée

miniature

⚠️ Les inhalateurs polluent autant que 530 000 voitures chaque année

miniature

🕷️ Découverte d'une araignée mi-mâle mi-femelle qui étonne les scientifiques

miniature

🌟 Découverte de la première étoile affichant des caractéristiques originelles !

miniature

💊 Cancer du sein: ce nouveau traitement montre des résultats très encourageants

miniature

🧻 Voici la première trace fossile de frottement de fesses !

miniature

🔌 Voitures électriques: comment optimiser au maximum le coût de recharge ?

miniature

🛰️ Quelle est cette anomalie gravitationnelle apparue en Afrique ?

miniature

👀 Voici le tout premier animal de la Terre

miniature

🔭 Le télescope James Webb aurait-il découvert les premières étoiles noires ?

miniature

🤔 Cette femme rit sans raison ni contrôle: pourquoi ?

miniature

🔭 Cette cicatrice géante pourrait avoir été causée par un trou noir supermassif errant

miniature

🫀 Crise cardiaque: les globules blancs percent des trous dans le cœur !

miniature

🏆 Un ordinateur quantique bat enfin les ordinateurs classiques sur un point crucial

miniature

🦟 Découverte exceptionnelle: des insectes de 112 millions d'années conservés dans de l'ambre

miniature

🔭 Utiliser la Lune pour révéler la matière noire

miniature

🧠 Quand le stress renforce l'intelligence collective

miniature

💊 Cancer: cette thérapie prête à l'emploi promet d'éliminer les tumeurs

miniature

🐶 Les chiens montrent des addictions aux jouets, comme les humains pour les substances

miniature

💥 Ils construisent par erreur une puce laser générant toutes les couleurs de l'arc-en-ciel

miniature

🐆 Le chat doré asiatique: un félin aux couleurs étonnantes

miniature

💥 Cette unique équation fait disparaitre matière noire, énergie noire, et autres anomalies de l'Univers

miniature

🗣️ Respirer pour parler: quand le cerveau prend le contrôle de la respiration

miniature

⚫ Première image de deux trous noirs en orbite mutuelle

miniature

🌊 Découverte fracassante: un tsunami de 100 mètres en mer du Nord

miniature

🐝 Les abeilles transportent involontairement des antibiotiques

miniature

💬 Votre oreille ne fait plus la différence entre une voix humaine et un clone IA

miniature

🪐 On en sait plus sur une planète tempérée du système TRAPPIST-1

miniature

💓 Le cœur s'use-t-il plus vite chez les sportifs ou chez les sédentaires ?

miniature

⚡ On sait enfin pourquoi les trous noirs expulsent autant d'énergie

miniature

🐛 Cette découverte sur l'alimentation pourrait changer notre façon de vieillir

miniature

🔭 3I/ATLAS: le visiteur interstellaire, voyageant à une vitesse impressionnante, observé depuis Mars

miniature

🦠 Deux microbes insoupçonnés auraient frappé la Grande Armée napoléonienne en Russie en 1812

miniature

🌍 La vie sur Terre pourrait s'expliquer par cette rare caractéristique de notre planète

miniature

⚡ Pourquoi reçoit-on parfois une petite décharge électrique en touchant certains objets ?

miniature

💥 LHC: observation d'une désintégration du boson de Higgs

miniature

🍖 Les premiers humains étaient des proies, et non des prédateurs

miniature

💧 3I/ATLAS: l'objet venu d'ailleurs a commencé à ensemencer notre Système solaire

miniature

⚛️ Record impressionnant: voici le plus grand réseau quantique avec 6100 qubits

miniature

🌕 Cette pierre lunaire provient de 50 km sous la surface, et révèle une belle surprise...

miniature

🫁 Pourquoi avons-nous le hoquet ?

miniature

🦴 La pollution plastique pénètre jusque dans nos os

Page générée en 0.146 seconde(s) - site hébergé chez Contabo
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
A propos - Informations légales
Version anglaise | Version allemande | Version espagnole | Version portugaise