Techno-Science.net

Vendredi 18 Juillet 2025

Rechercher 🔍

UTF-8 - Définition

Source: Wikipédia sous licence CC-BY-SA 3.0.
La liste des auteurs de cet article est disponible ici.

- Introduction - Description - Inconvénients - Avantages - Histoire

Inconvénients

Taille variable:: Les caractères sont représentés en UTF-8 par des séquences d’octets de taille variable, ce qui rend certaines opérations sur les chaînes de caractères plus compliquées : le calcul du nombre de caractères ; le positionnement à une distance donnée (exprimée en caractères) dans un fichier texte et en règle générale toute opération nécessitant l’accès au caractère de position N dans une chaîne.
Efficacité:: Pour les langues utilisant beaucoup de caractères extérieurs à US-ASCII, UTF-8 occupe sensiblement plus d’espace.; Par exemple, les idéogrammes courants employés dans les textes de langues asiatiques comme le chinois, le coréen ou le japonais (kanji, par exemple) utilisent 3 octets en UTF-8 contre 2 octets en UTF-16.; De manière générale, les écritures employant beaucoup de caractères de valeur égale ou supérieure à U+0800 occupent plus de mémoire que s’ils étaient codés avec UTF-16 (UTF-32 sera plus efficace uniquement pour les textes utilisant majoritairement des écritures anciennes ou rares codées hors du plan multilingue de base, c’est-à-dire à partir de U+100000, mais il peut aussi s’avérer utile localement dans certains traitements pour simplifier les algorithmes, car les caractères y ont toujours une taille fixe, la conversion des données d’entrée ou de sortie depuis ou vers UTF-8 ou UTF-16 étant triviale).
Séquences invalides:: Par son système de codage, il était éventuellement possible de représenter un code de différentes manières en UTF-8, ce qui pouvait poser un problème de sécurité : un programme mal écrit peut accepter un certain nombre de représentations UTF-8, normalement invalides selon la RFC 3629 et dans les spécifications (maintenant équivalentes entre elles) publiées par l’ISO 10646 et Unicode ; mais ce n’était pas le cas selon la spécification originale, qui permettait de les convertir comme un seul et même caractère.; De fait, un logiciel détectant certaines chaînes de caractères (pour prévenir les injections SQL, par exemple) pouvait échouer dans sa tâche (ce n’est plus le cas si la conformité du codage avec la définition stricte et normalisée d’UTF-8 est vérifiée avant toute chose).; Prenons un exemple tiré d'un cas réel de virus attaquant des serveurs HTTP du Web en 2001 ((en)[2] [3] [4]). Une séquence à détecter pourrait être « /../ » représentée en ASCII (a fortiori en UTF-8) par les octets « 2F 2E 2E 2F » en notation hexadécimale.; Cependant, une manière malformée de coder cette chaîne en UTF-8 serait « 2F C0 AE 2E 2F », appelée aussi en anglais overlong form (forme superlongue). Si le logiciel n’est pas soigneusement écrit pour rejeter cette chaîne, en la mettant par exemple sous forme canonique, une brèche potentielle de sécurité est ouverte. Cette attaque est appelée directory traversal.; Les logiciels acceptant du texte codé en UTF-8 ont été blindés pour rejeter systématiquement ces formes longues car non conformes à la norme : soit le texte entier est rejeté ; mais parfois les séquences invalides sont remplacées par un code de substitution (généralement U+FFFD si l’application accepte et traite ce caractère normalement, parfois un point d’interrogation qui peut poser d’autres problèmes) ; moins souvent, ces séquences interdites sont éliminées silencieusement (ce qui est très peu recommandé).

- Introduction - Description - Inconvénients - Avantages - Histoire

miniature

🤔 Personne ne comprend ces mystérieux dodecaèdres romains

miniature

🌋 Vidéo - Un volcan de boue entre en éruption devant un temple à Taiwan

miniature

🦉 Vue d'une impressionnante chouette cosmique

miniature

🧬 Cette IA biologique accélère la sélection naturelle

miniature

🍖 Des orques partagent leur nourriture avec les humains

miniature

🔢 Les animaux peuvent-ils vraiment compter ? Découvrez les surprises de la nature

miniature

🛰️ GIRO: cet instrument pourra cartographier l'intérieur de tout objet extraterrestre

miniature

💀 Ce crâne d'enfant pourrait être celui d'un humain croisé avec une autre espèce

miniature

🌀 D'où viennent les ouragans ? Le pouvoir caché de l'océan

miniature

🔴 Pourquoi Mars a perdu son habitabilité et pas la Terre ?

miniature

🚀 Cet objet, qui retombe toujours du même côté, pourrait sauver robots et missions spatiales

miniature

🌍 Comment les premiers organismes ont vaincu l'arsenic il y a 2,1 milliards d'années ?

miniature

🪐 Les "planètes de l'impossible" expliquées

miniature

🦅 Découverte d'une très ancienne espèce de ptérosaure, si petit qu'il tiendrait sur votre épaule

miniature

💥 Ce nouvel atome super-lourd remet en question la stabilité nucléaire

miniature

Pourquoi y a-t-il du vent à la plage ?

miniature

📜 Un hymne babylonien perdu retrouvé après 3000 ans grâce à l'IA

miniature

💥 Etrange: cette étoile a explosé deux fois

miniature

🌋 La fonte des glaces pourrait déclencher des super-éruptions volcaniques

miniature

🧭 L'épave de ce navire ayant transporté un trésor de 138 millions de dollars refait surface

miniature

☄️ Il ne devrait pas être là: que fait ce minéral sur l'astéroïde Ryugu ?

miniature

Dispersion de micro-organismes: une loi pour les gouverner tous

miniature

🛠️ Ces outils vieux de 361 000 ans révèlent une technologie inconnue

miniature

❄️ La glace ne se comporte pas comme on le supposait dans l'espace

miniature

🦟 Comment les moustiques transmettent-ils des maladies ?

miniature

⚡ Cette découverte pourrait rendre nos appareils électroniques 1000 fois plus rapides

miniature

🔭 Un objet a-t-il percuté Saturne ? Un appel à témoins est lancé

miniature

🦴 Découverte d'une usine à graisse vieille de 125 000 ans

miniature

💥 Exceptionnel: deux novas illuminent le ciel en même temps

miniature

🌡️ Quelle est la température la plus haute que le corps humain peut supporter ?

miniature

🔭 Un troisième visiteur interstellaire se dirige vers nous à grande vitesse

miniature

🚀 La microgravité, une arme inattendue contre le cancer ?

miniature

👣 Découverte de chaussures romaines gigantesques... Les romains étaient-ils des géants ?

miniature

🔭 Découverte d'une très rare naine blanche vampire

miniature

❄️ L'Antarctique devient mystérieusement plus salé

miniature

🧠 Cette IA prédit le comportement humain avec une précision étonnante

miniature

⚫ L'observation des trous noirs pourraient révéler la fameuse gravité quantique

miniature

🌊 L'eau de mer se transforme en acide carbonique: que se passe-t-il vraiment ?

miniature

🕷️ Cette toile d'araignée géante sur Mars intrigue les scientifiques

miniature

Pourquoi certains animaux changent de couleur l'été ?

miniature

🧠 Découverte: les nouveau-nés ont un niveau très élevé de cette protéine pourtant associée à Alzheimer

miniature

👽 Cette exoplanète abriterait la vie ? Les scientifiques en discutent

miniature

Pourquoi bronze-t-on au soleil ? Ce que la peau essaie de faire

miniature

🌍 La Terre tourne plus vite, et on ne sait pas pourquoi

miniature

🌪️ Comment les ouragans reçoivent-ils leurs noms ?

miniature

🧬 Conception d'un génome humain artificiel: le projet est lancé

miniature

🔭 Une planète géante gazeuse confirmée par des astronomes amateurs

miniature

🧠 Voici l'architecte inattendu du cerveau humain

miniature

🚀 Cette "nébuleuse" visible dans le ciel est d'origine artificielle

miniature

D'où vient le sable des plages ?

Page générée en 0.242 seconde(s) - site hébergé chez Contabo
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
A propos - Informations légales
Version anglaise | Version allemande | Version espagnole | Version portugaise