logo
abonnez go
Revue de presse
Archives Revue de presse
 
 

Les limites du traitement interne des fichiers logs (21 mars 2006)

L’utilisation d’un outil de traitement interne des fichiers logs présente quelques limites.

 

Le phénomène de caching
Pour limiter le volume de données transitant sur le réseau, les fournisseurs d’accès ou gestionnaires de réseaux d’entreprises ont mis en place des serveurs proxy qui vont stocker les pages les plus demandées par les utilisateurs. Dans ce cas, l’appel d’une page stockée sur le proxy ne se fera plus sur le serveur du site et ne pourra être comptabilisé dans les fichiers logs.

Un phénomène de cache peut également se produire sur le poste de l’utilisateur, sur le disque dur ou en mémoire vive. Une page carrefour d’un site peut être ainsi visualisée plusieurs fois mais être comptabilisée comme vue une seule fois coté serveur.

Selon les sources, la minoration d’audience provenant du phénomène de caching est estimée entre 20 et 50 %. Cet éventail très large regroupe en fait différents cas de figure qui dépendent de la nature du site mais également des pages considérées.

On peut par exemple penser qu’un site à cible professionnelle sera globalement moins affecté par le caching car l’audience à une provenance plus éclatée à partir d’un grand nombre de réseaux d’entreprise.

Au contraire, un site dont l’audience est essentiellement grand public subira un phénomène de caching plus important à cause des serveurs proxy des grands fournisseurs d’accès.

Coté pages se sont évidemment les pages les plus consultées (pages carrefour) qui vont voir leur audience la plus minorée.

 

Le rapatriement des fichiers logs
Lorsque le traitement des fichiers logs se fait sur un ordinateur distant du serveur, ceux ci doivent être rapatriés sur le poste ou se trouve l’outil de mesure d’audience. Bien que ce rapatriement puisse être programmé, il peut être contraignant en fonction du volume d’audience et donc du volume des fichiers à récupérer. Le recueil des données peut également se compliquer lorsque les données proviennent de différents serveurs qui peuvent même parfois avoir des localisations géographiques distinctes.
Pour des sites à forte audience, le rapatriement et le traitement des données peut être rendu plus compliqués par le volumes des fichiers à manipuler.

Le prestataire doit également laisser librement l’accès à ces fichiers logs, ce qui n’est pas toujours le cas dans le cas d’un hébergement mutualisé utilisé souvent par les PME.

 

Parfois un manque d’adaptabilité des rapports
Lorsque l’analyse d’audience est un service compris dans la prestation d’hébergement, le rapatriement des fichiers n’est plus un problème. Par contre, les données fournies seront souvent standardisées et pas toujours personnalisables.
Cet inconvénient est surtout présent pour les prestations d’hébergement bas et moyennes gammes.

Dans le cadre des gros contrats d’hébergement le prestataire pourra fournir des prestations de mesure d’audience sur mesure.

 

 

Les limites de la mesure d’audience interne par traitement des fichiers logs sont en partie compensées par son avantage en terme de coûts. En effet, mise à part les quelques couts humains liés à la configuration de la procédure. Le coût d’un tel traitement est modeste et lié au coût d’acquisition du logiciel.

L’alternative aux logiciels de traitement des fichiers logs est la mesure distante par un service spécialisé. C’est ce dernier type de mesure qui est le plus utilisé actuellement car il comporte moins de contraintes technique et est donc plus simple à mettre en place.