![]() ![]() |
|
![]() |
![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() |
Publications |
Évaluation de l'utilisation d'un site Web : Analyse d'un fichier journalpar Susan Haigh et Janette MegarityFlash Réseau no57 ISSN 1200-5304 Services de technologie de l'information Bibliothèque nationale du Canada
Le 4 août 1998 1.0 Introduction Compte tenu que de plus en plus d'organismes considèrent le Web comme faisant partie intégrante de leurs activités et de leurs communications externes, l'intérêt suscité pour l'évaluation de l'utilisation d'un site Web est à la hausse. Il est possible d'utiliser des journaux de serveurs afin de recueillir certain renseignements sur l'utilisation quantitative. Lorsqu'ils sont compilés et interprétés correctement, les renseignements contenus dans les journaux offrent une ligne de base de données statistiques qui indique les niveaux d'utilisation et les comparaisons de l'utilisation de mesures de soutien ou de la croissance, qu'il s'agisse des parties d'un site ou d'une mesure étalée dans le temps. Une telle analyse fournit également certains renseignements techniques relatifs au chargement du serveur, à l'activité inhabituelle ou aux demandes infructueuses; elle peut contribuer au développement et à la commercialisation du site ainsi qu'aux activités de gestion. 2.0 Utilisation du site Web : l'image en plus grande perspective Une analyse de l'utilisation pourrait comporter une étude précise d'un vaste éventail de questions, à savoir non seulement quoi, quand et par qui, mais aussi comment et pourquoi les renseignements ont été (ou non) cherchés et utilisés. L'évaluation de manière explicite de l'utilisation d'un site Web ne constitue pas une activité sans valeur. Il est essentiel de commencer en déterminant les questions relatives à l'utilisation auxquelles il faut répondre, puis de choisir un ou plusieurs mécanismes d'évaluation appropriés afin de fournir des réponses cohérentes. L'analyse de journaux n'est qu'un mécanisme de ce genre parmi plusieurs. Des méthodes qualitatives de collecte de données, tels les sondages sur les utilisateurs, les groupes de discussion et les autres mécanismes de rétroaction, peuvent réunir les opinions des utilisateurs sur le contenu d'un site, la navigation ou l'apparence du site et le confort de l'utilisation. Elles peuvent évaluer la satisfaction des utilisateurs et les raisons pour lesquelles ils ont visité le site ou y ont navigué de telle ou telle façon. Il est possible d'évaluer la capacité d'exploitation d'un site, laquelle aura des incidences tant sur le taux que la manière d'utilisation, par diverses méthodes afin de savoir si le site est accessible, s'il est facile d'y naviguer et s'il est attrayant pour les utilisateurs. Les points de référence auxquels sont comparés et évalués les chiffres sur l'utilisation les rendent plus cohérents. Quelle est la croissance de mon site par rapport aux taux de croissance globaux du Web? Quelle volatilité des niveaux d'utilisation est normale ou jusqu'à quel point les niveaux d'utilisation peuvent être attribués à nos efforts promotionnels? Pouvons-nous trouver des sites comparables aux nôtres qui emploient leurs journaux de serveurs en utilisant des paramètres et des soins semblables ? Le présent Flash Réseau a comme priorité l'analyse de fichiers journaux comme étant une méthode de recherche quantitative aux fins de l'analyse de l'utilisation, en offrant un aperçu de ce qui peut ou non être recueilli des données et des outils logiciels qui servent actuellement au soutien de l'analyse de journaux. 3.0 Le contenu d'un fichier journal Toute communication entre un navigateur client et un serveur Web mène à une entrée au journal du serveur qui consigne la transaction. Un site Web occupé, tel celui de la Bibliothèque nationale du Canada, produit des centaines ou des milliers d'entrées au journal par heure et les compile dans un fichier journal. Les données saisies dans un fichier journal varient selon le type de serveur utilisé et le ou les formats de fichier journal qu'elles soutiennent. Les formats les plus utilisés sont le format de fichier journal commun et le format de fichier journal combiné ou étendu. En règle générale, une entrée au fichier journal contient : l'adresse de l'ordinateur demandant le fichier Deux entrées au fichier journal sont indiquées ci-dessous. Il s'agit dans le premier cas d'une demande pour un message sur le droit d'auteur provenant d'une notice bibliographique de resAnet, le catalogue de la Bibliothèque nationale. La deuxième demande une image incorporée à une page du produit numérique de la Bibliothèque nationale « Femmes à l'honneur : leurs réalisations ». Les deux demandes ont été consignées à zéro heure quatre secondes le 24 juillet 1998. 192.117.240.3 - - [24/Jul/1998:00:00:04 -0400] "www.collectionscanada.ca/femmes/002026-221-f.html 4.0 Que pouvez-vous apprendre d'un fichier journal ? Les données provenant d'un fichier journal peuvent être compilées et combinées de diverses façons, offrant les données statistiques ou les inscriptions suivantes : nombre de demandes effectuées («réponses obtenues») nombre total de fichiers et de kilos-octets servis avec succès nombre de demandes par type de fichier, comme les visualisations de pages HTML adresses IP distinctes servies et nombre de demandes effectuées par chacune nombre de demandes par suffixe de domaine (provenant d'adresses IP) nombre de demandes pour des fichiers ou répertoires particuliers nombre de demandes par code d'état HTTP (réussi, échoué, redirigé, informationnel) totaux et moyennes par périodes de temps particulières (heures, jours, semaines, mois, années) adresses URL à partir desquelles l'utilisateur est arrivé sur le site (pages de renvoi) navigateurs et versions soumettant les demandes. 5.0 Qu'est-ce que vous ne pouvez pas apprendre d'un fichier journal ? Les lacunes des fichiers journaux en tant qu'indicateurs de l'utilisation se divisent en trois catégories principales : certains types de données sur l'utilisation ne sont pas consignés; les données consignées peuvent être incomplètes et il est tentant d'extraire des inférences peu valables de certaines de ces données. 5.1. Données non consignées dans les journaux
5.2 Données consignées, mais fondamentalement incomplètes Nombre de demandes (et toute autre donnée statistique établie à partir de ce chiffre) : les journaux de serveurs ne donnent une image exacte de l'utilisation en raison de la mise en antémémoire. Une page téléchargée est automatiquement mise dans l'antémémoire du client pour une période (déterminée par la quantité de mémoire allouée à cette fonction). Par conséquent, un document qui est souvent demandé peut être directement extrait de l'antémémoire et le serveur n'a pas de dossier sur ce qui a été visionné. Le serveur ne consigne les cas que lorsque le document à antémémoire est comparé à la version du serveur aux fins de la mise à jour. Si cela se produit, cela dépend des paramètres du navigateur. L'exemple le plus simple de ce qui est dénombré est la «visualisation» de pages au cours d'une séance avec un navigateur : les gens qui utilisent les boutons Précédent et Suivant ou les caractéristiques Allez ne sont pas dénombrés au serveur, tandis que ceux qui utilisent le bouton Recharger le sont. Partout dans Internet, on utilise de plus en plus des blocs de mémoire d'envergure ou des antémémoires afin de réduire le temps de réponse. Cela signifie qu'un fichier peut avoir une antémémoire à divers autres points dans le réseau sur la voie qui sépare le serveur et le navigateur, telle que l'antémémoire d'un site, une antémémoire locale régionale, l'antémémoire d'un fournisseur de services ou même une antémémoire nationale. Si le navigateur trouve le fichier dans une antémémoire intermédiaire, le serveur ne consigne pas le moment du visionnement de ce fichier. Le nombre d'utilisations consignées par le serveur est donc réduit à l'extrême à cause de ces facteurs. Les totaux des fichiers journaux sont, par conséquent, tout au plus des indicateurs du nombre d'utilisations saisi dans les journaux. 5.3 Inférences peu valables provenant de données consignées Les fichiers journaux ne peuvent soutenir les inférences suivantes, bien qu'elles soient tentantes, étendues et, à un degré élevé ou moindre, encouragées par la plupart des logiciels d'analyse de journaux :
6.0 Autres considérations en matière d'utilisation de données du fichier journal
7.0 Logiciel d'analyse de journaux On retrouve sur le marché bon nombre de progiciels d'analyse de journaux comportant plusieurs caractéristiques. Chez certains fournisseurs l'analyse de journaux fait partie d'un ensemble de logiciels de gestion globale du Web qui effectue également une analyse des liens et du rendement. Les outils d'analyse de journaux offrent aussi les caractéristiques suivantes : Interface conviviale Divers formats de sortie (HTML, Word, Excel, texte, courrier électronique) Fonctions de rapports solides Soutien pour divers formats de fichier journal Bon nombre d'options de filtrage Analyse en temps réel Traitement de fichier journal compressé Base de données sommaire incorporée Accès à distance au logiciel Rapport d'analyse d'approximation Ordonnancement d'un rapport automatique Consultations inverses du DNS On retrouve une liste des visualisations de logiciels des outils d'analyse de fichier Web à la fin de ce document. 8.0 Conclusion Actuellement, l'analyse de fichier journaux est peut-être d'abord perçue comme un art déguisé en science. Les limites des données d'un fichier journal, d'un logiciel d'analyse d'un journal Web et la nature inhérente du Web signifient que les données statistiques du fichier journal devraient faire l'objet d'une analyse minutieuse et être interprétées avec la plus grande prudence. Dans unb proche avenir, au fur et à mesure que l'utilisation d'antémémoires et de logiciels agents au sein des réseaux va augmenter, la précision des fichiers journaux et l'utilisation d'indicateurs vont diminuer. D'un autre côté, l'utilisation accrue de témoins ou de nouveaux protocoles de communication et de serveurs peuvent nous aider à mieux connaître les utilisateurs et nous éclairer davantage sur l'utilisation. Pour le moment, on doit se rappeler que l'ampleur de l'utilisation et le nombre véritable d'utilisateurs du site nous sont inconnus. Toutefois, si les fichiers journaux de serveurs Web sont compilés de façon adéquate et interprétés de façon sérieuse, ils peuvent encore fournir certains indicateurs statistiques cohérents en matière d'utilisation d'un site Web. Choix de lectures Goldberg, Jeff. Why web usage statistics are (worse than) meaningless. (Pourquoi les données statistiques utilisées sur le Web sont-elles sans signification) Linder, Doug. Interpreting WWW Statistics (Interprétation des données statistiques du Web) Neilsen, Jakob. Tracking the Growth of a Site (Suivre la croissance d'un site). Stehle, Tim. Getting Real About Usage Statistics. (À propos de l'utilisation des données statistiques) Turner, Stephen. Readme for analog 3.0 : How the web works (Mise à jour de l'analogie 3.0 : Le fonctionnement du Web) Critiques de logiciels d'analyse de fichiers Web Randell, Neil. (10 mars 1998). The Results Are In. (Voici les résultats) PC Magazine [online]. http://www.zdnet.com/pcmag/features/webanalysis2/index.html Randell, Neil. (10 mars 1998). Web Site Analysis Tools: The Under-$100 Crowd. PC Magazine [online] (Outils d'analyse du site Web à des prix inférieurs à 100 $) http://www.zdnet.com/pcmag/features/webanalysis2/sb5.html. Randell, Neil. (7 octobre 1997). Who Goes There? Seven Inexpensive Web Analysis Tools Can Help You Determine Who's Visiting Your Site. PC Magazine [online].(Qui va là? Sept outils bon marché et utiles pour l'analyse du Web Vous déterminez qui visite votre site) Taschek, James. (avril 1997). Analyzing Your Website. ZD Internet Magazine [online]. www5.zdnet.com/products/content/zdim/0204/ zdim0012.html. (Analysez votre site Web) Zieger, Anne. (13 octobre 1997). Tracking Tools: Your Next Stop. Internet Week [online]. techweb.cmp.com/internetwk/trends/1013a.htm. (Outils d'analyse : votre prochain arrêt) |