Spamdexing
Source: Wikipédia sous licence CC-BY-SA 3.0.
La liste des auteurs de cet article est disponible ici.

Spamdexing est un néologisme anglais composé du substantif spam et du suffixe dexing pris sur le terme indexing signifiant référencement. En français, on traduit spamdexing par référencement abusif.

C'est un ensemble (En théorie des ensembles, un ensemble désigne intuitivement une collection d’objets (les éléments de l'ensemble), « une multitude qui peut être comprise comme un tout », comme...) de techniques consistant à tromper les moteurs de recherche (La recherche scientifique désigne en premier lieu l’ensemble des actions entreprises en vue de produire et de développer les connaissances scientifiques. Par extension métonymique, la...) sur la qualité d'une page ou d'un site afin d'obtenir, pour un mot-clef donné, un bon classement dans les résultats des moteurs (de préférence dans les tous premiers résultats, car les utilisateurs vont rarement au-delà de la première page qui, pour les principaux moteurs, ne comprend par défaut que dix adresses). Elle est parfois sévèrement punie par les moteurs, même s'il n'y a pas de code de conduite précis pour les référenceurs (il est parfois difficile de distinguer le référencement (Le référencement est l'action de référencer, c'est-à-dire mentionner quelque chose ou y faire référence.) abusif de la SEO, l'optimisation " honnête "). Les techniques habituelles de référencement abusif consistent par exemple à truffer une page satellite (Une page satellite est une page web destinée à améliorer la place d'un site donné sur les moteurs de recherche en proposant de nombreux liens vers le site en question, associées à des combinaisons de...) de listes de mots-clefs (pour attirer les utilisateurs de moteurs qui font une recherche sur ces mots), ou à créer des dizaines de sites qui pointent les uns vers les autres (link farms ou pépinières de liens) pour améliorer leur classement dans les moteurs qui jugent la qualité d'une page en fonction du nombre (La notion de nombre en linguistique est traitée à l’article « Nombre grammatical ».) de liens pointant vers elle.

Fonctionnement

En principe, les moteurs de recherche classent les résultats selon la qualité des pages et leur pertinence par rapport à la requête ; mais les moteurs actuels (s'opposant ainsi aux annuaires, produits par des humains, qui refusent les sites de qualité insuffisante) tentent d'estimer la qualité et la pertinence des pages par des procédés automatiques, dont les principes sont connus, dans leurs grandes lignes, par les polluposteurs et les optimiseurs de sites:

  • une page est supposée de bonne qualité si un grand nombre de liens externes pointent vers elle (quand un concepteur (Un concepteur est une personne qui imagine et réalise quelque chose. Ce mot vient du verbe concevoir.) de page web (Une page Web est une ressource du World Wide Web conçue pour être consultée par des visiteurs à l'aide d'un navigateur Web. Elle a une adresse Web....) place un lien vers une page, il est ainsi censé " voter " pour cette page); il est facile de créer plusieurs sites qui pointent vers le site qu'on veut promouvoir (ou bien d'échanger des liens avec des sites amis, gérés par d'autres personnes. C'est le "netlinking", littéralement "Mise en liens du réseau (Un réseau informatique est un ensemble d'équipements reliés entre eux pour échanger des informations. Par analogie avec un filet (un réseau est un...)", communément appelé "Echange de liens").
  • une page est supposée pertinente, en réponse à une requête (Le mot requête, synonyme de demande, est employé dans les domaines suivants :) donnée (Dans les technologies de l'information, une donnée est une description élémentaire, souvent codée, d'une chose, d'une transaction, d'un événement, etc.), si elle contient beaucoup de mots présents dans la requête
  • les différents mots de la page obtiennent un poids (Le poids est la force de pesanteur, d'origine gravitationnelle et inertielle, exercée par la Terre sur un corps massique en raison uniquement du voisinage de la...) plus important selon leur emplacement (par exemple, si l'expression " vente de voitures (Une automobile, ou voiture, est un véhicule terrestre se propulsant lui-même à l'aide d'un moteur. Ce véhicule est conçu pour le transport terrestre de personnes ou...)" figure dans le titre, la page est très probablement consacrée à ce sujet)
  • les moteurs tiennent également compte des mots présents dans l'adresse (Les adresses forment une notion importante en communication, elles permettent à une entité de s'adresser à une autre parmi un ensemble d'entités. Pour qu'il n'y ait pas d'ambiguïté, chaque adresse doit correspondre à une unique entité, une...) de la page (ce qui explique qu'on trouve parfois des URL longues, avec des répétitions de mots, comme www.exemple.com/voyages-pas-chers/voyage-en-chine/voyage-en-chine.html)

Les techniques de référencement évoluent dans le temps (Le temps est un concept développé par l'être humain pour appréhender le changement dans le monde.) et s'adaptent aux moteurs. Une nouvelle technique voit le jour (Le jour ou la journée est l'intervalle qui sépare le lever du coucher du Soleil ; c'est la période entre deux nuits, pendant laquelle les rayons du Soleil éclairent le ciel. Son début (par...): la "saturation par des intégrations multiples". Le principe est le suivant: le titulaire du site à promouvoir propose son contenu à une série de partenaires qui ont un nom de domaine (Dans le système de noms de domaine, un nom de domaine (NDD en notation abrégée française ou DN pour Domain Name en anglais) est un identifiant de domaine internet.) avec un pagerank (Le PageRank (terme anglais signifiant « classement d'une page ») ou PR désigne le système de classement des pages Web utilisé par le moteur de recherche Google pour attribuer l'ordre des liens dans les résultats de recherche. Le...) élevé et un nombre de pages élevé, ce qui facilitera leur ascension dans les résultats. Exemple: www.site-du-spamdexeur.com propose le contenu. Puis, on retrouve le même contenu sur http://mot-clé.partenaire.com, http://mot-clé.partenaire2.com, etc. En résulte une saturation de la page de résultats des moteurs de recherche. On peut ainsi à obtenir 80% des résultats de recherche affichés en première page par les moteurs de recherche. Comme la plupart des clics se font sur la première page de résultats d'une requête, ils s'assurent ainsi un maximum de visibilité (En météorologie, la visibilité est la distance à laquelle il est possible de distinguer clairement un objet, quelle que soit l'heure. On peut mesurer la visibilité horizontale et...) et évincent leurs concurrents.

Le référencement abusif et le droit

Le référencement abusif entre en totale contradiction (Une contradiction existe lorsque deux affirmations, idées, ou actions s'excluent mutuellement.) avec la loi sur les pratiques du commerce. De plus il s'apparente à de la fraude informatique (L´informatique - contraction d´information et automatique - est le domaine d'activité scientifique, technique et industriel en rapport avec le traitement automatique...) puisque le but est de détourner un processus informatique automatisé de son but initial et ce dans un but d'enrichissement personnel. Cet article traite bien du sujet: http://www.journaldunet.com/juridique/juridique040127.shtml

Le référencement éthique

Par opposition aux techniques de référencement dites abusives, certaines personnes avancent l'idée d'un référencement "éthique" censé reposer sur un code déontologique. Divers sites, ou association de référenceurs, se sont avancés à proposer leur vision d'un code déontologique en matière (La matière est la substance qui compose tout corps ayant une réalité tangible. Ses trois états les plus communs sont l'état solide, l'état liquide, l'état gazeux. La matière occupe de l'espace et possède...) de marketing (Le marketing (on utilise aussi parfois — dans 7% des cas, d'après les chiffres donnés par Google — le néologisme français mercatique) est une discipline qui cherche à...) des moteurs de recherche. Bien entendu ces préceptes n'ont aucune force (Le mot force peut désigner un pouvoir mécanique sur les choses, et aussi, métaphoriquement, un pouvoir de la volonté ou encore une vertu morale « cardinale » équivalent au courage (cf. les articles...) de loi, varient d'une appréciation individuelle à l'autre, et n'engagent que ceux qui veulent bien se reconnaitre dans de tels modèles "éthiques". Ces même codes d'éthique sont rédigés par intimidation des moteurs de recherche. Il est cependant étrange de constater que le moteur de recherche (Un moteur de recherche est une application permettant de retrouver des ressources (pages Web, forums Usenet, images, vidéo, fichiers, etc.) associées à des mots quelconques. Certains sites...) qui occupe 90% de part de marché adopte des positions diverses à l'égard du spamdexing (Spamdexing est un néologisme anglais composé du substantif spam et du suffixe dexing pris sur le terme indexing signifiant référencement. En français, on traduit...). Tantôt il le tolère en l'interdisant, tantôt il réprimande lourdement ( blacklisting de l'index ) sans prévenir ceux qui y ont recours... Ces actions s'apparentent en quelques sorte à un abus de position dominante car l'acteur (Un acteur est un artiste qui incarne un personnage dans un film, dans une pièce de théâtre, à la télévision, à la radio, ou même dans des spectacles de rue. En plus de l'interprétation...) en position dominante fausse le jeu de la concurrence.

Dissimulation du pourriel

Pour ne pas donner des soupçons à l'utilisateur qui verrait sur son écran (Un moniteur est un périphérique de sortie usuel d'un ordinateur. C'est l'écran où s'affichent les informations saisies ou demandées par l'utilisateur et générées...) une longue liste de mots, les nombreux termes placés dans une page pour " piéger " les moteurs sont souvent camouflés par différents procédés:

  • relégation de ces listes de mots en bas de page
  • écriture en caractères minuscules
  • mots placés dans une section " noframes ", " noscript " ou " display:none " (généralement non affichée par le navigateur, mais lue par les robots des moteurs)
  • caractères de même couleur (La couleur est la perception subjective qu'a l'œil d'une ou plusieurs fréquences d'ondes lumineuses, avec une (ou des) amplitude(s) donnée(s).) que le fond de la page (ce qui rend le texte invisible)
  • moteurs ou annuaires affichant de longues listes de " dernières recherches " ou de " recherches populaires "
  • pages dynamiques - par exemple celles de moteurs de recherche - déguisées en pages statiques, avec des adresses telles que example.com/trouver-requete.php (PHP (sigle de PHP: Hypertext Preprocessor), est un langage de scripts libre principalement utilisé pour produire des pages Web dynamiques via un serveur HTTP, mais pouvant également fonctionner comme n'importe quel langage...): une telle adresse ressemble à celle d'un fichier ( Un fichier est un endroit où sont rangées des fiches. Cela peut-être un meuble, une pièce, un bâtiment, une base de données informatique. Par exemple : fichier des patients...) statique (Le mot statique peut désigner ou qualifier ce qui est relatif à l'absence de mouvement. Il peut être employé comme :) qui s'appellerait trouver-requete.php, qui serait situé sur le serveur du moteur (Un moteur est un dispositif transformant une énergie non-mécanique (éolienne, chimique, électrique, thermique par exemple) en une énergie mécanique ou travail.[réf. nécessaire]), sur le serveur, alors qu'il s'agit en fait d'une page dynamique (Le mot dynamique est souvent employé désigner ou qualifier ce qui est relatif au mouvement. Il peut être employé comme :) (la sortie d'un script PHP, affichant les résultats de recherche) créée au moment de la requête: le fait de " déguiser " ainsi l'URL permet de faciliter son indexation si on suppose que les pages dynamiques peuvent ne pas être indexées par les moteurs, ou obtenir un classement inférieur à celui des pages statiques. En général, les pages de résultats des principaux moteurs possèdent des adresses telles que example.com/search.cgi?requete, où le contenu de la requête n'est pas déguisé en nom de fichier ; de plus, ces moteurs interdisent expressément l'indexation de ces pages au moyen d'un fichier robots.txt
  • Retrait des mots via un script (ex.: Javascript)
  • Une page satellite (Satellite peut faire référence à :) (doorway) , truffée de mots-clefs, est lue par les robots des moteurs de recherche; mais quand un humain la consulte, il est redirigé vers une autre page (et donc il ne voit pas la page bidon).
  • Le cloaking (l'occultage) consiste à présenter des résultats différents selon le logiciel (En informatique, un logiciel est un ensemble d'informations relatives à des traitements effectués automatiquement par un appareil informatique. Y sont inclus les...) utilisé pour afficher la page: une page anodine pour un navigateur web (Un navigateur Web est un logiciel conçu pour consulter le World Wide Web. Techniquement, c'est au minimum un client HTTP.), une page optimisée, remplie de mots-clefs, réservée aux robots des moteurs
  • Les sociétés de SEO, sur leur page d'accueil, donnent des exemples de sites qu'elles ont optimisés, chacune de ces adresses étant placée derrière un mot décrivant le sujet du site en question; ce qui permet aux pages des optimiseurs de contenir des mots qui n'ont rien à voir avec leur activité (Le terme d'activité peut désigner une profession.) (et donc de figurer parmi les résultats des recherches portant sur ces mots). Elles peuvent aussi mettre un lien vers leur propre site dans chaque page qu'elles modifient
Page générée en 0.169 seconde(s) - site hébergé chez Amen
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
Ce site est édité par Techno-Science.net - A propos - Informations légales
Partenaire: HD-Numérique