Web Analytics
Source: Wikipédia sous licence CC-BY-SA 3.0.
La liste des auteurs de cet article est disponible ici.

Les Web Analytics regroupent la mesure, la collecte, l'analyse et la présentation de données provenant d'Internet utilisées à fin de comprendre et d'optimiser l'utilisation du Web.

Dans un contexte de vente en ligne, les Web Analytics (Les Web Analytics regroupent la mesure, la collecte, l'analyse et la présentation de données provenant d'Internet utilisées à fin de comprendre et d'optimiser l'utilisation...) font référence à la mesure d'aspects d'un site web (Un site Web est un ensemble de pages Web hyperliées entre elles et mises en ligne à une adresse Web. On dit aussi site Internet par métonymie, le...) liés à la stratégie (La stratégie - du grec stratos qui signifie « armée » et ageîn qui signifie « conduire » - est :) commerciale de l'entreprise comme, par exemple, quelles sont les pages web ayant conduit au plus grand nombre (La notion de nombre en linguistique est traitée à l’article « Nombre grammatical ».) d'achats en ligne?

Les technologies utilisées

L'analyse des logs

Un log (anglicisme) est un fichier ( Un fichier est un endroit où sont rangées des fiches. Cela peut-être un meuble, une pièce, un bâtiment, une base de données informatique. Par exemple : fichier des patients d'un médecin, fichier des...) texte regroupant l’ensemble des événements survenus sur un serveur web incluant les requêtes et les réponses. Les fichiers logs sont des fichiers générés par les serveurs web à chacune de leurs transactions. On peut en modifier le format pour les rendre plus compatibles avec les différents outils d'analyse.

La pose de marqueurs ou 'tags'

Le manque de précision de l'analyse des logs ont conduit au développement des technologies de marqueurs, appelés en anglais 'tags' [1] Les marqueurs ou 'tags' sont généralement des appels d'images invoqués par Javascript (JavaScript est un langage de programmation de scripts principalement utilisé dans les pages web interactives mais aussi coté serveur. C'est un langage orienté...) dans le code de la page web (Une page Web est une ressource du World Wide Web conçue pour être consultée par des visiteurs à l'aide d'un navigateur Web. Elle a une adresse Web....). ( à compléter )

  1. on parle aussi de web beacons ou de web bugs (mouchards)

Logs ou tags?

L'avantage des logs

Les logs sont générés par défaut par le serveur web. Ils suivent [#Liens_externes différents formats] relativement standardisés. Ils enregistrent

L'avantage des tags

Les tags utilisent Javascript pour définir des variables ou des évènements à traquer. Comme le code Javascript est exécuté à chaque visualisation de la page web, on court-circuite ainsi le système de cache du navigateur en rendant plus exhaustif le suivi du trafic, des variables et des évenements.

Méthodes mixtes dites 'hybrides'

Certains outils de web Analytics, comme Webtrends, utilisent une méthode hybride (En génétique, l'hybride est le croisement de deux individus de deux variétés, sous-espèces (croisement intraspécifique), espèces (croisement...) qui consiste à insérer par Javascript (via un serveur séparé) les informations correspondants au tags dans les logs.

Autres méthodes

L'analyse de trames réseau (Un réseau informatique est un ensemble d'équipements reliés entre eux pour échanger des informations. Par analogie avec un filet (un réseau est un « petit rets », c'est-à-dire un petit filet), on appelle...) (en anglais packet sniffing), permet d'observer l'activité (Le terme d'activité peut désigner une profession.) réseau d'un serveur web et d'en déduire son traffic. A l'instar d'une solution de type logs, on y perd les notions d'évènements et d'interactivité (L'interactivité est une activité nécessitant la coopération de plusieurs êtres ou systèmes, naturels ou artificiels qui agissent en ajustant leur comportement.).

L'argument financier

Les logs sont générés automatiquement par le serveur web mais peuvent, au bout d'un certain temps (Le temps est un concept développé par l'être humain pour appréhender le changement dans le monde.), représenter une masse (Le terme masse est utilisé pour désigner deux grandeurs attachées à un corps : l'une quantifie l'inertie du corps (la masse...) de données (Dans les technologies de l'information (TI), une donnée est une description élémentaire, souvent codée, d'une chose, d'une transaction d'affaire, d'un événement, etc.) assez considérable (plusieurs gigaoctets. Il devient préférable de générer des logs par semaine ou par mois (Le mois (Du lat. mensis «mois», et anciennement au plur. «menstrues») est une période de temps arbitraire.) de l'année (Une année est une unité de temps exprimant la durée entre deux occurrences d'un évènement lié à la révolution de la Terre autour du Soleil.). Ces logs doivent être stockés et pouvoir être aussi accessibles et transférables que possible.

Les méthodes à base de tags stockent souvent leurs informations directement dans une base de données (En informatique, une base de données (Abr. : « BD » ou « BDD ») est un lot d'informations stockées dans un dispositif informatique. Les technologies existantes permettent...) qui sert par la suite à générer les rapports.

Définitions et vocabulaire

  • Pages vues: désigne le nombre de fois où une page web est affichée ('rendue') dans un navigateur web (Un navigateur Web est un logiciel conçu pour consulter le World Wide Web. Techniquement, c'est au minimum un client HTTP.). On parle aussi d'impressions.
  • Visites: Une visite est définie comme une série de pages web consultées de façon consécutives durant un laps de temps défini. On parle aussi de sessions.
  • Visiteur / visiteur unique: Un visiteur est un internaute (Un internaute est un utilisateur du réseau Internet.) qui:
    • consulte une série de pages web consécutives (détectées par les tags)
    • effectue une série de requêtes Web (enregistrés dans les logs)

Le caractère unique vient de l'attribution d'un identifiant (En informatique, on appelle identifiants (également appelé parfois en anglais login) les informations permettant à une personne de s'identifier auprès d'un...) unique: numéro de session (log) ou cookie.

Les différents acteurs du marché

  • (fr) Google (Google, Inc. est une société fondée le 7 septembre 1998 dans la Silicon Valley en Californie par Larry Page et Sergey Brin, auteurs du moteur de recherche Google. Depuis 2001, Eric Schmidt en est le PDG (CEO). La société compte...) Analytics
  • (fr) Unica
  • (en) WebTrends
  • (en) Omniture
  • (en) Visual Sciences autrefois connu en tant que WebSideStory
  • (en) CoreMetrics
  • (en) XiTi
  • (en) IndexTools
  • (fr) Nedstat
  • (fr) eStat de Médiamétrie
  • (fr) Edatis

Méthodes liées aux web Analytics

Les problèmes inhérents aux cookies

Deux attributs caractérisent un cookie en termes de web analytics: son domaine et sa date d'expiration. C'est d'ailleurs très souvent la date d'expiration du cookie qui détermine l'unicité d'un visiteur.

Si le domaine est le même que celui du site qui est consulté, on parle de cookie d'origine (en anglais: first-party cookie). En revanche, si le domaine est différent du site consulté, on parle de cookie tiers (en anglais: third-party cookie). La plupart des cookies tiers sont générés par des sites d'annonceurs publicitaires ou de ciblage d'audience Internet (Internet est le réseau informatique mondial qui rend accessibles au public des services variés comme le courrier électronique, la messagerie instantanée et le World Wide Web, en utilisant le protocole de...).

Les cookies tiers sont très souvent la cible d'outils ou de filtres anti-spyware ou anti-publicitaires qui bloquent la création de ces cookies. En ajoutant à cela les différents mécanismes d'effacement des cookies, les chiffres concernant les visiteurs uniques peuvent être réduits de 5% à 40%. Ce grand écart est une estimation car il est extrêmement difficile d'évaluer avec précision le taux de blocage et/ou d'effacement des cookies.

De manière générale, les cookies d'origine sont moins sujets au blocage car jugés moins intrusifs que les cookies tiers mais demeurent quand même sensibles à l'effacement.

Campagnes: pages personnalisées ou liens entrants?

Page générée en 0.059 seconde(s) - site hébergé chez Amen
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
Ce site est édité par Techno-Science.net - A propos - Informations légales
Partenaire: HD-Numérique