Techno-Science.net

Vendredi 1er Août 2025

Rechercher 🔍

Regroupement hiérarchique - Définition

Source: Wikipédia sous licence CC-BY-SA 3.0.
La liste des auteurs de cet article est disponible ici.

- Introduction - La classification ascendante hiérarchique - Logiciels - Dendrogramme

Introduction

Dans le domaine informatique, et plus précisément dans le domaine de l'analyse et de la classification automatique de données, la notion de regroupement hiérarchique recouvre différentes méthodes de clustering, c'est-à-dire de classification par algorithme de classification.

La classification ascendante hiérarchique

C'est une méthode de classification automatique utilisée en analyse des données ; à partir d'un ensemble $Ω$ de n individus, son but est de répartir ces individus dans un certain nombre de classes.

La méthode suppose qu'on dispose d'une mesure de dissimilarité entre les individus; dans le cas de points situés dans un espace euclidien, on peut utiliser la distance comme mesure de dissimilarité. La dissimilarité entre des individus x et y sera notée $d i s s i m (x, y)$ .

La classification ascendante hiérarchique est dite ascendante car elle part d'une situation où tous les individus sont seuls dans une classe, puis sont rassemblés en classes de plus en plus grandes. Le qualificatif "hiérarchique" vient du fait qu'elle produit une hiérarchie H, l'ensemble des classes à toutes les étapes de l'algorithme, qui vérifie les propriétés suivantes:

$\Omega \in H$ : au sommet de la hiérarchie, lors qu'on groupe de manière à obtenir une seule classe, tous les individus sont regroupés
$\forall \omega \in H, \{\omega\} \in H$ : en bas de la hiérarchie, tous les individus se trouvent seuls
$\forall (h,h') \in H^2, h \cap h' = \emptyset$ ou $h \subset h'$ ou $h' \subset h$

Algorithme

Principe

Initialement, chaque individu forme une classe, soit n classes. On cherche à réduire le nombre de classes à $n b c l a s s e s < n$ , ceci se fait itérativement. A chaque étape, on fusionne deux classes, réduisant ainsi le nombre de classes. Les deux classes choisies pour être fusionnées sont celles qui sont les plus "proches", en d'autres termes, celles dont la dissimilarité entre elles est minimale, cette valeur de dissimilarité est appelée indice d'agrégation. Comme on rassemble d'abord les individus les plus proches, la première itération a un indice d'agrégation faible, mais celui va croître d'itération en itération.

Mesure de dissimilarité inter-classe

La dissimilarité de deux classes $C 1 = x, C 2 = y$ contenant chacune un individu se définit simplement par la dissimilarité entre ces individus. $d i s s i m (C 1, C 2) = d i s s i m (x, y)$

Lorsque les classes ont plusieurs individus, il existe de multiples critères qui permettent de calculer la dissimilarité. Les plus simples sont les suivants:

Le saut minimum retient le minimum des distances entre individus de $C 1$ et $C 2$ : $dissim(C_1,C_2) = \min_{x\in C_1, y\in C_2}(dissim(x,y))$
Le saut maximum est la dissimilarité entre les individus de $C 1$ et $C 2$ les plus éloignés: $dissim(C_1,C_2) = \max_{x\in C_1, y\in C_2}(dissim(x,y))$
Le lien moyen consiste à calculer la moyenne des distances entre les individus de $C 1$ et $C 2$ : $dissim(C_1,C_2) = moyenne_{x\in C_1, y\in C_2}(dissim(x,y))$
La distance de Ward vise à maximiser l'inertie inter-classe: $dissim(C_1,C_2) = \frac{n_1*n_2}{n_1+n_2} dissim(G_1,G_2)$ avec $n 1$ et $n 2$ les effectifs des deux classes, $G 1$ et $G 2$ leurs centres de gravité respectifs

Implémentation en pseudo-code

Entrées:

individus: liste d'individus
nbClasses: nombre de classes qu'on veut obtenir au final

Sortie:

classes: liste de classes initialement vide, une classe est vue comme une liste d'individus

      Pour i=1 à individus.longueur Faire          classe.ajouter(nouvelle classe(individu[i]));      Fin Pour      Tant Que classes.longueur > nbClasses Faire          // Calcul des dissimilarités entre classes dans une matrice triangulaire supérieure          matDissim = nouvelle matrice(classes.longueur,classes.longueur);          Pour i=1 à classes.longueur Faire              Pour j=i+1 à classes.longueur Faire                  matDissim[i][j] = dissim(classes[i],classes[j]);             Fin Pour          Fin Pour          // Recherche du minimum des dissimilarités          Soit (i,j) tel que matDissim[i][j] = min(matDissim[k][l]) avec 1<=k<=classes.longueur et k+1<=l<=classes.longueur;          // Fusion de classes[i] et classes[j]          Pour tout element dans classes[j] Faire              classes[i].ajouter(element);          Fin pour          supprimer(classes[j]);      Fin Tant Que

- Introduction - La classification ascendante hiérarchique - Logiciels - Dendrogramme

🔭 Cette observation suggère que tout pourrait venir de la ceinture d'astéroïdes

miniature

🦴 Comment les pythons digèrent-ils les os sans laisser de trace ?

miniature

💫 Comment un pulsar milliseconde a trompé les astronomes pendant des années ?

miniature

🌱 Par évolution dirigée, le MIT a fortement amélioré l'efficacité de la photosynthèse

miniature

🌍 Une météorite a-t-elle modifié le Grand Canyon il y a 56 000 ans ?

miniature

🕒 Le lien surprenant entre repas tardifs, santé et prise de poids

miniature

💥 Cette collision de trous noirs est si massive qu'elle fait trembler nos lois de l'astrophysique

miniature

🩺 Cancer: des cellules "oubliées" passent à l'offensive

miniature

🔭 Quel est cet objet mystérieux, lié à Neptune dans une orbite jamais vue auparavant ?

miniature

🍄 Découverte surprenante: vivre 25 ans de plus grâce aux "champignons magiques" ?

miniature

🩺 L'âge des premières règles est un indicateur de la santé à venir

miniature

⚛️ Cette découverte pourrait expliquer pourquoi notre Univers existe

miniature

🌋 Découverte majeure sous Yellowstone grâce à l'IA

miniature

🏹 Violence préhistorique: découverte d'un surprenant homicide raté

miniature

🌌 Des scientifiques découvrent dans l'Univers un gigantesque filament de matière "manquante"

miniature

🐱 Ce chat a aidé à découvrir un virus inconnu... deux fois !

miniature

🪐 Cette planète provoque la fureur de son étoile

miniature

👂 Et si nous pouvions entendre une caresse ?

miniature

👑 Cette découverte archéologique révèle les prémices des pharaons

miniature

🦈 Le requin bleu peut changer de couleur, comme un caméléon

miniature

🌞 La NASA dévoile les images les plus proches jamais prises du soleil

miniature

⏳ Il est maintenant possible de mesurer le vieillissement avec précision

miniature

🚀 1 pétabit/seconde: ce nouveau record permet de télécharger tout le catalogue de Netflix en 1 seconde

miniature

🩺 Donald Trump et insuffisance veineuse chronique: une maladie aux complications graves

miniature

🌍 Les barrages construits par l'Homme ont déplacé les pôles de la Terre

miniature

🍖 Les Néandertaliens avaient leurs propres recettes de cuisine, qui veut goûter ?

miniature

🔭 À l'observatoire Rubin, le grand film de l'Univers démarre

miniature

🧬 Réparer l'ADN cassé et sauver nos cellules

miniature

🪨 Découverte d'un important gisement de "kryptonite" en Europe, au potentiel énergétique hors norme

miniature

🕰️ La Terre possède sa propre horloge géologique

miniature

☄️ Les scientifiques ne comprennent pas la trajectoire des fragments de l'astéroïde Dimorphos

miniature

🦖 Les protéines survivent bien plus longtemps que l'ADN, et pourraient réécrire l'histoire

miniature

📢 Pourquoi certains sons nous réveillent, et d'autres non ?

miniature

🌋 Des BLOBS se déplacent sous nos pieds: des structures à l'origine d'éruptions cataclysmiques

miniature

🌀 Une centaine de galaxies invisibles autour de la Voie lactée ?

miniature

🐛 Ces chenilles "plastivores" transforment le plastique en graisse corporelle

miniature

⛈️ La météo sur Titan vue par James Webb et Keck

miniature

💀 Cette pieuvre tue avec un venin 1200 fois plus toxique que le cyanure, et il n'y a pas d'antidote

miniature

👀 Une "Bête" géante observée en train de danser au-dessus du Soleil

miniature

⏳ Des séismes lents filmés pour la première fois en temps réel. De quoi s'agit-il ?

miniature

✨ Découverte "d'étoiles ratées" de l'extrême: que nous apprennent-elles ?

miniature

🎨 Pourquoi les hommes sont-ils beaucoup plus souvent daltoniens que les femmes ?

miniature

☄️ Un visiteur interstellaire bientôt visible à l'œil nu dans le ciel ?

miniature

🧬 Vous avez des migraines ? Vous avez peut-être du crâne de Néandertal en vous !

miniature

🩺 L'IMC doit être remplacé: voici pourquoi et par quoi

miniature

👽 Découverte de conditions propices à la vie sur Titan, la lune de Saturne

miniature

🦖 Insolite: Ce musée trouve un fossile de dinosaure... sous son parking !

miniature

🍦 Pourquoi les glaces nous donnent parfois mal à la tête ?

miniature

🤔 Personne ne comprend ces mystérieux dodecaèdres romains

miniature

🌋 Vidéo - Un volcan de boue entre en éruption devant un temple à Taiwan

Page générée en 0.437 seconde(s) - site hébergé chez Contabo
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
A propos - Informations légales
Version anglaise | Version allemande | Version espagnole | Version portugaise