Théorie des "petits mondes": quel est le centre de Wikipedia ?
Publié par Adrien le 26/06/2008 à 01:21
Source: internetactu.net sous Licence Creative Commons by-nc
Quel est le centre de Wikipedia ? Et quel est son diamètre ? Voila par exemple quelques-unes des questions étranges qu'on peut se poser lorsqu'on étudie la théorie des “petits mondes”, ce champ des mathématiques qui analyse la configuration des relations au sein d'un réseau (Un réseau informatique est un ensemble d'équipements reliés entre eux pour échanger des informations. Par analogie avec un filet (un réseau est un « petit rets », c'est-à-dire un petit filet),...).

L'exemple le plus connu dans ce domaine est la notion des “six degrés de proximité” existant entre tous les êtres humains. Dès les années 60, Stanley Milgram (également connu pour ses expériences sur l'autorité) a montré qu'il était possible de relier tous les habitants de cette planète (Une planète est un corps céleste orbitant autour du Soleil ou d'une autre étoile de l'Univers et possédant une masse suffisante pour que sa gravité la...) en passant environ par six intermédiaires. Depuis, l'idée a été reproduite dans de nombreux domaines, par exemple dans le cas du “jeu de Kevin Bacon“, qui consiste à se demander combien de connexions permettent de relier Kevin Bacon à n'importe quel autre acteur (Un acteur est un artiste qui incarne un personnage dans un film, dans une pièce de théâtre, à la télévision, à la radio, ou même dans des spectacles de rue. En plus de l'interprétation proprement dite, un acteur (ou...) (il existe d'ailleurs une version avancée de ce jeu qui ne se limite pas à Kevin Bacon mais examine les relations entre deux comédiens pris au hasard).

Cette théorie (Le mot théorie vient du mot grec theorein, qui signifie « contempler, observer, examiner ». Dans le langage courant, une théorie est une idée ou une connaissance...) des petits mondes est en train (Un train est un véhicule guidé circulant sur des rails. Un train est composé de plusieurs voitures (pour transporter des personnes) et/ou de plusieurs wagons (pour transporter des marchandises), et peut être...) de devenir la nouvelle révolution scientifique (Un scientifique est une personne qui se consacre à l'étude d'une science ou des sciences et qui se consacre à l'étude d'un domaine avec la rigueur et...) à la mode, et on l'applique aujourd'hui tant à la physique (La physique (du grec φυσις, la nature) est étymologiquement la « science de la nature ». Dans un sens général et ancien, la physique désigne la connaissance de la...) qu'à la biologie (La biologie, appelée couramment la « bio », est la science du vivant. Prise au sens large de science du vivant, elle recouvre une partie...) ou à la sociologie, et bien sûr au web, la distance entre deux sites s'exprimant par le nombre (La notion de nombre en linguistique est traitée à l’article « Nombre grammatical ».) de clics de souris (Le terme souris est un nom vernaculaire ambigu qui peut désigner, pour les francophones, avant tout l’espèce commune Mus musculus, connue aussi comme animal de compagnie ou de laboratoire, mais aussi de nombreuses...) nécessaires pour se rendre de la page de départ à celle d'arrivée. On ne s'étonnera donc pas qu'un certain Stephen Dohan l'ait appliqué aussi à Wikipedia, afin d'examiner les connexions reliant les différents articles.

L'idée en soi est excellente et prolonge les nombreux outils qui permettent déjà de documenter les évolutions de la plateforme. Elle pourrait permettre d'établir une cartographie (La cartographie désigne la réalisation et l'étude des cartes géographiques. Le principe majeur de la cartographie est la...) des différents domaines de connaissance, de repérer des associations restées enfouies... Malheureusement, certaines idiosyncrasies de Wikipedia rendent ce projet (Un projet est un engagement irréversible de résultat incertain, non reproductible a priori à l’identique, nécessitant le concours et...) difficile.

En théorie des réseaux, on appelle le “diamètre” la plus longue chaîne (Le mot chaîne peut avoir plusieurs significations :) de connexions nécessaire pour unir deux éléments du réseau. Si le “diamètre” des relations humaines est d'environ 6, celui de Wikipedia, lui, tend à créer de la confusion: il est de 70 ! Mais ce chiffre (Un chiffre est un symbole utilisé pour représenter les nombres.) ne signifie pas grand-chose, parce qu'il est le produit d'une série de 70 listes particulières, celles des astéroïdes du système solaire (Le système solaire est un système planétaire composé d'une étoile, le Soleil et des corps célestes ou objets définis gravitant autour de...), organisées dans Wikipedia de telle manière qu'il faut parfois 70 clics pour aller d'une liste à une autre ! Si on corrige ce type d'aberration, en réalité, la “moyenne” des clics nécessaires pour se rendre d'un article à un autre est de 4,75.

L'autre question que s'est posée Stephen Dohan était la nature du “centre” de Wikipedia: c'est-à-dire l'article qui proposait le trajet le plus court vers tous les autres. Le vainqueur est “2007” qui est à 3,65 clics de n'importe quelle entrée de l'encyclopédie. Mais “2007″ est surtout une liste, ce qui le rend peu intéressant à analyser. Bizarrement le “vrai” centre de Wikipedia est “United Kingdom” avec une moyenne (La moyenne est une mesure statistique caractérisant les éléments d'un ensemble de quantités : elle exprime la grandeur qu'auraient chacun des membres de l'ensemble s'ils...) de 3,67 clics. Plus étrange encore, le second est Billie Jean King, une ancienne joueuse de tennis !

Sur la page de Dohan, on peut trouver un jeu “à la Kevin Bacon” qui permet de voir par soi même les connexions existantes entre deux articles. Ainsi nous apprenons qu'il n'existe que deux clics de distance entre Britney Spears et le philosophe Hegel, l'intermédiaire étant... la date du 14 novembre (mort du second, et vague (Une vague est un mouvement oscillatoire de la surface d'un océan, d'une mer ou d'un lac. Les vagues sont générées par le vent et ont une amplitude crête-à-crête allant de quelques centimètres à 34 m...) référence à un article pour la première) !

Il semble donc qu'il reste du temps (Le temps est un concept développé par l'être humain pour appréhender le changement dans le monde.) avant d'envisager une cartographie de Wikipedia comme un descriptif de la connaissance humaine. Pour ce faire, il faudrait exclure des calculs l'ensemble (En théorie des ensembles, un ensemble désigne intuitivement une collection d’objets (les éléments de l'ensemble),...) des articles qui pointent sur de trop nombreuses entrées sans apporter une contribution notable à leur signification (les dates, les pays (Pays vient du latin pagus qui désignait une subdivision territoriale et tribale d'étendue restreinte (de l'ordre de quelques centaines de km²), subdivision de la civitas gallo-romaine. Comme la civitas qui subsiste le...), les lieux, sauf dans les articles spécifiquement historiques ou géographiques, bien sûr...).

Page générée en 0.158 seconde(s) - site hébergé chez Amen
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
Ce site est édité par Techno-Science.net - A propos - Informations légales
Partenaire: HD-Numérique