Projets de recherche et de mise en uvre de normes
Participation du RCIP au banc d'essai du CIMI sur les métadonnées
Le RCIP est membre du CIMI
(Consortium for the Interchange of Museum Information Consortium
pour l'échange d'information muséologique), qui uvre en vue de l'échange
électronique d'information muséologique. En 1998 et 1999, le RCIP
a participé à un banc d'essai du CIMI sur les métadonnées, qui portait
sur la création et l'utilisation de métadonnées afin de faciliter
la recherche d'information muséologique sous forme électronique.
Plus précisément, le projet a porté sur les métadonnées de la norme
Dublin Core
en tant qu'outil de description des collections d'un musée et sur
la manière d'exploiter cette norme pour la recherche de ressources
dans un environnement informatique en réseau tel que celui du Web.
Ce projet comprenant entre autres la création d'une base de données consultable,
conforme à la norme Dublin Core, alimentée par divers organismes
partenaires du CIMI. Le RCIP s'est adressé à plusieurs musées
canadiens qui contribuent à Artefacts Canada et a obtenu
la permission d'utiliser un petit nombre de leurs enregistrements
dans Artefacts Canada pour le banc d'essai du CIMI. Le
RCIP a produit un tableau de correspondance
entre les zones d'Artefacts Canada et la norme Dublin
Core, ainsi qu'un logiciel de conversion d'enregistrements
d'Artefacts Canada vers le format Dublin Core. Le
RCIP a ensuite fourni au CIMI un sous-ensemble de la base de données
Artefacts Canada, en format Dublin Core, en vue
du banc d'essai du CIMI sur les métadonnées.
Le CIMI a utilisé ces enregistrements fournis par le RCIP, ainsi que ceux d'autres organismes,
pour créer la base de données de son banc d'essai. Le CIMI s'est servi de l'expérience des
participants au projet pour mettre à l'épreuve « les hypothèses relatives à la
souplesse et à la simplicité de la norme Dublin Core, ainsi qu'à sa pertinence et
à son degré de préparation pour son déploiement »1.
Il a aussi exploré divers moyens de représenter des métadonnées.
Suite à ces recherches, le CIMI a également produit le
Guide to Best
Practice: Dublin Core concernant la création et la modification par les musées
d'enregistrements conformes à la norme Dublin Core.
Correspondances entre les normes du RCIP et d'autres normes
Recherche et mise en uvre de métadonnées dans le site Apprenons avec les musées
du RCIP
Le RCIP participe également à un projet de création de métadonnées
pour un répertoire pancanadien des ressources d'apprentissage
accessibles dans les sites Internet de musées canadiens. Ce projet,
auquel participent le CIMI
(Consortium for the Interchange of Museum Information Consortium
pour l'échange d'information muséologique), le GEM
(Gateway to Educational Materials Passerelle
vers des ressources pédagogiques)
et Rescol, comporte l'élaboration d'un
guide des pratiques exemplaires et d'un outil de catalogage en vue de la
production de métadonnées pour des outils pédagogiques en ligne.
Ce projet comprend aussi la définition de métadonnées conformes
à la norme Dublin Core pour chacune des ressources pédagogiques
en ligne créées par des musées canadiens. Les métadonnées
de Apprenons avec les musées sont fondées sur la norme
Dublin Core.
Elles s'inspirent également des métadonnées du GEM et de Rescol
pour ce qui est des éléments et du vocabulaire propres à l'éducation.
Le RCIP a en outre défini plusieurs éléments requis pour l'application
Apprenons avec les musées. Remarque : Les métadonnées
et les listes de vocabulaire de Apprenons avec les musées
sont actuellement en cours de révision. Adressez-vous au RCIP
pour obtenir de plus amples renseignements sur les modifications
à venir. Pour le projet Apprenons avec les musées, le RCIP
a mis au point un outil de catalogage, appelé MetaCollector,
qui permet aux musées de créer facilement des métadonnées. MetaCollector
consiste en un formulaire en ligne qui, une fois rempli, produit
des métadonnées en HTML
et RDF.
Ces métadonnées peuvent être renvoyées aux musées pour être incluses
dans l'en-tête HTML de leurs pages Web. Elles sont aussi
chargées dans une base de données à utiliser avec la passerelle
du RCIP pour Apprenons avec les musées.
Utilisation par le RCIP du protocole de communication Z39.50 Fishnet
CHIN participe au projet Fishnet,
un projet international sur la biodiversité qui vise à rendre
accessibles les données sur les espèces. Le projet Fishnet
fait appel au protocole Z39.50
pour permettre une recherche intégrée des enregistrements à propos
de spécimens de poisson conservés dans des musées et d'autres
établissements. Le RCIP a mis sur pied un serveur Z39.50 et, en
collaboration avec le Musée canadien de la nature, a versé dans
Fishnet 28 626 enregistrements sur des poissons.
Dans Fishnet, la recherche et l'extraction de données se
font à l'aide du protocole Z39.50. La présentation des résultats
s'effectue à l'aide d'un client Z39.50 ou XML.
Vocabulaires structurés et outils d'accès dans les bases de données du RCIP
Le RCIP s'est rendu compte que les vocabulaires structurés,
employés depuis de nombreuses années par les musées comme outils
de catalogage et d'indexation de leurs collections, sont également
de précieux outils de recherche et d'extraction de données. Artefacts
Canada : Sciences humaines et la Galerie d'images
du Musée virtuel du Canada (MVC) se servent du AAT
(Art & Architecture Thesaurus Thésaurus des
arts et de l'architecture) pour faciliter l'accès à environ 2 millions
d'enregistrements sur des objets de musée.
Étant donné que les enregistrements d'Artefacts Canada sont versés par des musées
de partout au Canada, qui n'ont pas de norme commune de vocabulaire (souvent même aucune norme
de vocabulaire), la terminologie employée pour décrire les objets des musées est très variable.
Il est impossible et irréaliste d'imposer une norme de vocabulaire commune aux musées qui
contribuent à Artefacts Canada et au Musée virtuel du Canada. De plus, les
termes employés dans les musées pour le catalogage des collections ne sont pas toujours
ceux utilisés par le public qui consulte Artefacts Canada. À titre d'exemple, les
musées de sciences naturelles emploient généralement des noms latins pour désigner leurs
spécimens alors que le public emploie le plus souvent des noms vernaculaires. Il devient
crucial de mettre l'accent sur la mise au point d'outils qui permettront d'accéder aux
données sans égard à la langue et aux termes employés par les catalogueurs et par ceux
qui font des recherches.
Le RCIP a mené une étude
afin de déterminer si le AAT (Art & Architecture Thesaurus
Thésaurus des arts et de l'architecture) pourrait
servir d'outil d'accès aux bases de données du RCIP. Cette
étude a montré que le AAT correspond en très grande partie aux
données du RCIP dans les zones importantes de recherche (Nom de
l'objet, Type de l'objet, Matériaux, Technique de fabrication,
École/Style, Culture). Le RCIP a donc inclus le AAT dans le moteur
de recherche d'Artefacts Canada. Grâce aux relations définies
dans le AAT, une recherche sur « peinture »
permet de trouver des aquarelles, et une recherche sur « Eskimo »
permet de trouver des objets catalogués de culture Inuit.
Le AAT a été élaboré à l'origine en anglais, mais le RCIP lui a ajouté 2 600 équivalents en
français (pour les termes les plus utilisés dans les principales zones de recherche), afin de
faciliter la recherche et l'extraction de données en français. Par exemple, une recherche
sur « peinture » permet de trouver les objets catalogués sous
« painting ». Le RCIP continuera d'ajouter des termes en français à ses
outils de vocabulaire afin d'améliorer l'accès à tous les enregistrements de la base de données.
L'emploi du AAT comme outil d'accès dans Artefacts Canada :
- permet aux musées, ainsi qu'aux personnes qui font des recherches, d'employer les
termes qu'ils jugent appropriés,
- permet à un généraliste de trouver tous les enregistrements pertinents, y compris ceux
des objets qui ont été catalogués avec des termes spécialisés ou des régionalismes,
- améliore l'accès dans les deux langues (grâce aux équivalents linguistiques ajoutés
au AAT par le RCIP).
L'emploi du AAT comme outil d'accès dans Artefacts Canada :
Sciences humaines et dans la galerie d'images du Musée virtuel du Canada
aide à contourner certains problèmes dus à des incohérences de vocabulaire,
différences linguistiques, etc. Mais, à cause de sa grande taille et de sa richesse,
le AAT contient beaucoup plus de termes et de relations que nécessaire pour accéder
aux données du RCIP, ce qui cause les difficultés suivantes :
- Il consomme énormément de ressources une recherche sur un terme tel que
bois, qui comporte beaucoup de relations, surcharge le système. Le RCIP compte
supprimer de nombreux termes du AAT qui ne sont pas nécessaires pour accéder aux
données du RCIP. Cela se fera probablement en procédant à une comparaison informatique
entre les données du RCIP et celles du AAT et en supprimant les termes du AAT qui ne
sont pas employés. Il faudra sans doute reprendre ce processus à intervalles réguliers,
au fur et à mesure de la croissance des bases de données du RCIP, afin d'assurer
que tous les termes du AAT requis soient inclus.
- Des termes peuvent figurer à plusieurs endroits dans la hiérarchie du AAT.
Par exemple, peinture appartient à la hiérarchie des uvres d'art visuel mais
aussi à celle des processus et techniques. Le système utilise la première occurrence
du terme dans le AAT et ignore les autres. Cela fonctionne parfois (si la première
occurrence correspond à ce que l'on recherche) mais donne souvent des résultats
étranges. Il n'y a pas de solution simple à ce problème, mais le RCIP tente
d'améliorer la situation :
- en analysant soigneusement les hiérarchies du AAT à utiliser selon la
recherche effectuée dans Artefacts Canada,
- en modifiant l'ordre des hiérarchies du AAT de telle sorte que le moteur
de recherche du RCIP trouve d'abord celle qui risque le plus d'être pertinente,
- en limitant le nombre de hiérarchies du AAT examinées au regard des
données du RCIP.
- Certaines difficultés sont dues aux différentes langues employées. Par exemple,
une recherche sur le mot français cloche donne entre autres plusieurs
enregistrements qui décrivent des chapeaux en anglais. En effet, le mot cloche
désigne en anglais un type particulier de chapeau. Un problème semblable survient
si l'on fait une recherche sur la culture africaine : plusieurs
enregistrements en français qui contiennent le mot de font partie du
résultat parce que De est le nom d'un peuple africain. Ce problème
est difficile à expliquer aux utilisateurs de la base de données, et encore
plus ardu à corriger.
Le RCIP continue de travailler à l'amélioration des performances des moteurs
de recherche par le recours à des outils de vocabulaire, et espère utiliser
d'autres vocabulaires structurés tels que la
Union List of Artist Names (ULAN)
et le Thesaurus
of Geographic Names (TGN), pour améliorer les recherches dans
Artefacts Canada : Sciences humaines.
Travaux du RCIP sur des outils de recherche par reconnaissance de formes
En 1999, le RCIP s'est penché sur l'utilisation d'une application de recherche
par reconnaissance de formes mise au point par Practical Reasoning, Inc.,
afin d'améliorer l'accès thématique à Artefacts Canada. Les outils de
recherche par reconnaissance de formes peuvent aider les utilisateurs à obtenir
des réponses à des questions complexes auxquelles les moteurs traditionnels de
recherche dans des bases de données ne peuvent pas répondre facilement.
Exemples : Les uvres abstraites de Lionel Fitzgerald étaient-elles
surtout réalisées au crayon ou à l'huile ? Les paysages d'hiver par les
membres du Groupe des Sept sont-ils surtout des peintures, des gravures ou des
dessins ? La recherche par reconnaissance de formes pourrait permettre
aux utilisateurs de voir la co-occurrence de termes, qui constituent des
associations (ou formes au sens large) dans les données.
Le RCIP a constitué avec la Winnipeg Art Gallery un ensemble d'environ
1 000 enregistrements d'Artefacts Canada sur des uvres
du Groupe des Sept. Ces données ont été envoyées à Practical Reasoning, Inc.,
qui les a analysées et a fait parvenir les résultats au RCIP.
Cette étude avait une portée limitée en raison de la taille et de la composition
de l'échantillon, mais elle a montré qu'une recherche par reconnaissance de formes
peut aider à répondre à des questions qui vont au-delà des possibilités des
moteurs de recherche traditionnels dans des bases de données. Pour obtenir
de plus amples renseignements sur cette étude, veuillez vous adresser au RCIP.
Le RCIP continuera d'étudier des outils susceptibles d'améliorer l'accès au
contenu d'Artefacts Canada et à celui d'autres ressources.
Participation du RCIP à l'élaboration d'une terminologie multilingue des objets religieux
Le RCIP a collaboré avec la Direction des Musées de France et la Réunion des Musées Nationaux
à la rédaction de l'ouvrage Objets
religieux Méthode d'analyse et vocabulaire. Cette publication comprend
un guide illustré de saisie des données et un ensemble hiérarchisé (en français et
en anglais) de plus de 300 termes standard d'objets et ameublement religieux
catholiques, de même que de vêtements et linges liturgiques.
Un second projet, auquel collaborent le RCIP, le
Getty Information Institute,
le ministère français de la Culture et l'Institut central de catalogage et
de documentation d'Italie, a donné lieu à l'élaboration d'un lexique multilingue
(anglais, français, italien) de noms d'objet religieux. Ce lexique, intitulé
Religious Objects of the Catholic Faith/Objets religieux du culte
catholique/Corredo ecclesiastico di culto cattolico, est disponible sous
forme imprimée auprès du ministère français de la Culture :
Ministère de la Culture
6, rue des Pyramides
75041 Paris cedex 01
FRANCE
Participation du RCIP à des groupes de travail gouvernementaux sur les normes
Le RCIP est représenté au sein de plusieurs groupes de travail et comités du gouvernement
du Canada sur des questions liées aux normes, entre autres :
- le groupe de travail interministériel sur les métadonnées en ligne,
- le sous-groupe interministériel sur les métadonnées de matériel didactique électronique,
- le groupe de travail interministériel sur les thésaurus en ligne,
- le groupe du ministère du Patrimoine canadien sur les métadonnées.
CHIO (Cultural Heritage Information Online
Information en ligne sur le patrimoine culturel)
Le projet CHIO, qui s'est déroulé en deux phases, a été mené
par le CIMI
(Consortium for the Interchange of Museum Information
Consortium pour l'échange d'information muséologique)
afin de démontrer la mise en uvre du protocole
Z39.50 et de SGML
pour la recherche et l'extraction d'information muséologique structurée.
- Au cours de la première phase du projet CHIO, le CIMI a procédé à
une étude qui a permis de définir les
points d'accès du CIMI, un ensemble d'attributs communément utilisés pour
l'extraction d'information muséologique. À partir de ces points d'accès,
le CIMI a créé une DTD
(définition de type de document) spécifique pour un contenu muséologique.
Cette DTD du CIMI « correspond à un système accepté par la
communauté muséale pour le codage de textes en SGML et constitue un cadre
pour les travaux futurs que le CIMI ou tout autre organisme du patrimoine
culturel pourrait entreprendre pour appliquer SGML à de l'information
muséologique »2.
- Au cours de la seconde phase du projet CHIO, les points d'accès
du CIMI ont servi à la création d'un
profil Z39.50
(le profil du CIMI) destiné à la recherche et à l'extraction
d'information muséologique. Le CIMI a ensuite mis à l'épreuve ce profil
dans un banc d'essai et l'a développé davantage. En 1998, le profil du
CIMI a été de nouveau mis à l'épreuve dans le cadre du projet européen
Aquarelle. La version actuelle du profil du CIMI résulte de l'harmonisation
du profil original utilisé dans le projet CHIO et du profil mis au point pour le projet Aquarelle.
.
Banc d'essai de métadonnées du CIMI
MIDIIS (Museum Initiative
for Digital Information Interchange Standards)
La MIDIIS est un ensemble de projets de recherche et de bancs d'essai planifiés
par le CIMI pour 20002001 :
- Banc d'essai de la DTD XML SPECTRUM
Le CIMI participe à l'élaboration de la
DTD XML SPECTRUM
et met à l'épreuve cette DTD
dans un banc d'essai. Ce projet comprend également une recherche sur
« la manière dont les produits
XML
de la communauté muséale peuvent fonctionner avec des produits semblables
des secteurs des archives, des bibliothèques et de la
recherche »3.
- Banc d'essai Handscape Mise à l'épreuve
de la technologie sans fil dans le contexte des musées.
- Banc d'essai de collecte de données
Le CIMI utilise la méthodologie de
l'Open Archives Initiative
pour rendre la base de données de son banc d'essai disponible pour la collecte de données.
Le projet HILT (High-Level Thesaurus)
Le projet HILT, du Royaume-Uni, vise « à étudier le problème de la recherche transversale
et du parcours par sujet dans un contexte où il y a une variété de communautés, de
services ainsi que de types de services ou de ressources »4.
Le projet HILT cherche à analyser la nature du problème de la recherche transversale,
à cerner les questions d'interface utilisateurmachine, et à définir
les besoins d'intégration avec des vocabulaires dans des domaines précis.
Les participants au projet HILT vont également s'entendre sur la possibilité
d'adopter ou d'adapter un vocabulaire existant à des fins de recherche transversale,
ou d'en créer un de toutes pièces, ou encore sur l'impossibilité de résoudre le problème.
Les travaux du projet HILT feront l'objet d'un rapport.
Le projet HITITE
Le projet HITITE, qui sera entrepris par English Heritage et
Adlib Information Systems, illustrera le
Thesaurus of Monument Types
avec des images d'archives du NMR (National Monuments Record) et offrira certains
mécanismes intéressants d'accès aux données par les utilisateurs :
- une recherche par mots-clés avec des opérateurs booléens, portant sur le thésaurus
lui-même et sur les métadonnées complètes à propos des images contenues dans le thésaurus
(dimensions, forme, etc., et termes du patrimoine),
- un système expert, qui permettra à l'utilisateur de faire une recherche en répondant
à quelques questions simples illustrées par des photos ou schémas généraux
les questions aideront l'utilisateur à préciser sa recherche en
éliminant les termes ou les images non pertinents ,
- la réalité virtuelle L'équipe du projet étudie la possibilité de
présenter des mondes de réalité virtuelle en 3 dimensions pour permettre
à l'utilisateur d'explorer les types de monuments et la terminologie correspondante.
Le projet prototype de
conservation
de matériel audiovisuel numérique de la Bibliothèque du Congrès
« Ce projet, qui s'étend de 1999 à 2003, explore divers aspects
d'un système de référentiel de documents audio et vidéo numériques. Ce
projet conjoint étudie de nouvelles méthodes de stockage et de gestion
de collections de documents sonores et d'images animées numérisés ou créés
d'entrée de jeu sous forme numérique. Il expérimente également de nouvelles
manières de rendre ces documents disponibles aux personnes qui font des
recherches. Ce projet permettra à la Bibliothèque du Congrès de mieux
maîtriser la numérisation de matériel audiovisuel, ainsi que l'acquisition
et la conservation de contenu sous forme numérique5.
Ce projet a donné lieu à l'élaboration d'un
dictionnaire de données des métadonnées
audio et vidéo.
RLG Cultural Materials Initiative
Le RLG (Research Libraries Group) et les établissements (bibliothèques, services d'archives
et musées) qui en sont membres ont créé une collection Web de « versions numériques
de manuscrits, photos, objets d'art, documents historiques, souvenirs, etc., provenant
de partout dans le monde6. Ce projet comporte
l'élaboration de normes relatives à la constitution et à la diffusion de collections
numériques. Des groupes consultatifs concernant les politiques, le développement du contenu,
le format et la qualité des fichiers numériques, la description des objets et la conception
de l'interface utilisateur ont été mis sur pied. Le RLG Cultural Materials Resource
qui en est résulté est accessible par abonnement au RLG.
(Linking and Exploring Authority Files) Project
Le projet LEAF vise la mise au point d’une architecture modèle pour l’établissement de liens entre les listes d’autorité réparties et pour leur accessibilité. Le système permet de télécharger les listes d’autorité réparties dans le système central et lie automatiquement les listes qui appartiennent à la même entité7.