Définitions et vocabulaire
- Pages vues : Désigne le nombre de fois où une page web est affichée ('rendue') dans un navigateur web. On parle aussi d'impressions.
- Visites : Une visite est définie comme une série de pages web consultées de façon consécutive durant un laps de temps défini. On parle aussi de sessions.
- Visiteur / visiteur unique: Un visiteur est un internaute qui:
- consulte une série de pages web consécutives (détectées par les tags)
- effectue une série de requêtes Web (enregistrées dans les logs)
- Le caractère unique vient de l'attribution d'un identifiant unique : numéro de session (log) ou cookie.
- Le visiteur unique se définit comme le dédoublonnement des visites sur la base d'un cookie. La notion de visiteur unique est liée au temps (visiteur unique sur une journée, une semaine, un mois, ...). Il y a de grandes discussions sur cette notion puisque les outils "site centric" mesurent précisément des "navigateurs uniques" et ne savent pas reconnaitre la même personne connectée depuis son travail et depuis son domicile alors que les outils "user centric" savent reconnaitre la personne mais n'ont en général pas assez de données pour faire une mesure précise.
- Temps moyen par visite : c'est la moyenne des temps des visites mesurées sur un site. Cette moyenne ne prend en compte que les visites d'au moins deux pages vues afin d'avoir un temps.
- Taux de rebond : Cette métrique s'applique à une page. Elle indique le pourcentage de visiteurs qui ont vu, durant leurs visites, uniquement cette page. Le taux de rebond est le pourcentage de visites pour lesquelles la personne a quitté votre site à partir de la page d'entrée. Un fort taux de rebond n'est pas nécessairement une mauvaise chose, cela dépend du type de site que vous avez et comment vous voulez que les visiteurs interagissent avec votre site. Si les internautes trouvent toutes les informations sur une seule page, un taux de rebond proche de 100% est prévisible mais la visite a été de qualité.
Autres méthodes
L'analyse de trames réseau (en anglais packet sniffing), permet d'observer l'activité réseau d'un serveur web et d'en déduire son trafic. À l'instar d'une solution de type logs, on y perd les notions d'événements et d'interactivité.
L'argument financier
Les logs sont générés automatiquement par le serveur web mais peuvent, au bout d'un certain temps, représenter une masse de données assez considérable (plusieurs gigaoctets). Il devient préférable de générer des logs par semaine ou par mois de l'année. Ces logs doivent être stockés et pouvoir être aussi accessibles et transférables que possible.
Les méthodes à base de tags stockent souvent leurs informations directement dans une base de données qui sert par la suite à générer les rapports.
Méthodes liées aux web Analytics
Les problèmes inhérents aux cookies
Deux attributs caractérisent un cookie en termes de Web Analytics : son domaine et sa date d'expiration. C'est d'ailleurs très souvent la date d'expiration du cookie qui détermine l'unicité d'un visiteur.
Si le domaine est le même que celui du site qui est consulté, on parle de cookie d'origine (en anglais: first-party cookie). En revanche, si le domaine est différent du site consulté, on parle de cookie tiers (en anglais: third-party cookie). La plupart des cookies tiers sont générés par des sites d'annonceurs publicitaires ou de ciblage d'audience Internet.
Les cookies tiers sont très souvent la cible d'outils ou de filtres anti-spyware ou anti-publicitaires qui bloquent la création de ces cookies. En ajoutant à cela les différents mécanismes d'effacement des cookies, les chiffres concernant les visiteurs uniques peuvent être réduits de 5% à 40%. Ce grand écart est une estimation car il est extrêmement difficile d'évaluer avec précision le taux de blocage et/ou d'effacement des cookies.
De manière générale, les cookies d'origine sont moins sujets au blocage car jugés moins intrusifs que les cookies tiers mais ils demeurent quand même sensibles à l'effacement.
Campagnes: pages personnalisées ou liens entrants?