Sauter les liens de navigation (touche d'accès : Z)Bibliothèque et Archives Canada / Library and Archives Canada
Élément graphique EnglishContactez-nousAideRechercheSite du Canada
AccueilÀ notre sujetQuoi de neuf?À l'affichePublications


Glossaire des normes, des protocoles et des formats liés à la bibliothèque numérique

par Susan Haigh
Flash Réseau no54
ISSN 1200-5304
Services de technologie de l'information
Bibliothèque nationale du Canada

Le 6 mai 1998


Introduction

Le présent document donne un aperçu structuré de plus de 90 termes choisis portant sur les normes, les protocoles et les formats de documents axés sur la technologie et qui sont pertinents aux activités d'une bibliothèque numérique. Pour chaque entrée, on retrouve l'acronyme, le nom au complet et une description ou un commentaire succinct, selon le cas.

Même si la plupart des employé(e)s de bibliothèque, même ceux qui travaillent directement aux initiatives de la bibliothèque numérique, n'ont pas besoin de tout savoir sur ces normes, ils en entendent souvent parler ou lisent sur le sujet. Ce guide d'introduction vise à servir d'outil de consultation facile aux employés(ées) de bibliothèque qui disposent de peu de temps, et peut-être d'un peu moins d'intérêt, pour apprendre les détails techniques associés aux normes et protocoles axés sur la technologie et qui sont pertinents au monde de la bibliothéconomie.

Certaines définitions initiales

Les normes sont un ensemble de règles ou de caractéristiques servant à la conception ou à l'exploitation d'un dispositif de calcul. Il existe des normes privées, qui sont les normes élaborées et répandues par les compagnies dans l'espoir d'assurer ou d'augmenter leur part du marché. Il y a aussi les normes ouvertes, qui sont publiées et peuvent être utilisées par tous. Chaque type de normes peut devenir de fait, à savoir un ensemble de règles ou de caractéristiques dont l'utilisation est tellement répandue sur le marché qu'il devient la norme; ou de droit, c'est-à-dire une norme qui a été approuvée par un organisme de normalisation officiel comme l'Organisation internationale de normalisation (ISO).

Les protocoles sont un ensemble de règles normalisé qui régissent les fonctions de communications en réseau en décrivant le format que doit prendre un message et la façon selon laquelle les messages sont échangés entre les ordinateurs.

Les formats représentent les diverses façons selon lesquelles l'information est mémorisée. Le format d'un fichier c'est l'algorithme d'un logiciel servant à encoder les données, ainsi que tout renseignement sur les données (p. ex. structure, disposition, algorithme de compression). Il existe des centaines de formats de fichiers différents mais seulement quelques-uns sont essentiels aux activités d'une bibliothèque numérique.

Certains avertissements

  1. Ce document contient des renseignements généraux recueillis par une profane. Alors que tous les efforts ont été faits pour identifier et inclure les normes, protocoles et formats les plus pertinents, la liste ne vise pas à être exhaustive. Il existe des domaines complets d'activités de normalisation  -  l'échange de renseignements sur les couleurs, le commerce numérique, l'authentification, la sécurité et les domaines plus techniques des télécommunications, par exemple  -  qui n'ont pas été couverts. De plus, les formats émergents des documents composés et le maintien de relations entre les objets numérisés ne sont pas traités.
  2. L'objectif de structurer les entrées par fonction et de les décrire avec précision et de façon succincte s'est avéré un défi de taille. La structure et la définition ne devraient pas être considérées comme faisant autorité. Les ressources choisies qui ont été consultées sont inscrites à la fin.
  3. Certaines des entrées ne sont pas des normes mais représentent plutôt des nouvelles technologies ou des langages de programmation. Elles ont été incluses pour leur pertinence à une fonction particulière ou à un type d'information.

Normes de validation d'Internet et de communication

Transmission de données entre ordinateurs

OSI : Open Systems Interconnection (Interconnexion des systèmes ouverts)

A été éclipsé graduellement par TCP/IP, suite comparable de protocoles. Les normes basées sur OSI (p. ex. courrier X.400, répertoires X.500, Z39.50, protocole PEB) fonctionnent maintenant sur les réseaux TCP/IP. L'architecture OSI comporte sept couches; chaque couche utilise la couche située immédiatement sous elle et fournit un service à la couche située au-dessus. Les données sortantes traversent les couches, suivent le réseau, puis remontent les couches une fois à destination. Ces couches sont, de la plus basse à la plus haute :

  1. Couche physique  -  câbles physiques, etc. à travers desquels les signaux voyagent.
  2. Couche liaison de données  -  s'occupe du problème d'intégrité des données lors de la transmission de paquets dans différents réseaux physiques.
  3. Couche réseau  -  s'occupe de l'acheminement des paquets de données et de ses multiplexages et démultiplexages (défilant avec les autres paquets de données).
  4. Couche transport  -  gère la création de paquets à partir de données et le rassemblement de données à partir des paquets.
  5. Couche session  -  plus important chez les réseaux locaux, gère les sessions entre les utilisateurs de réseaux.
  6. Couche présentation  -  a trait à la compression et au chiffrement (le cas échéant).
  7. Couche application  -  il s'agit des programmes utilisateurs qui transmettent et reçoivent les données, et les protocoles qui les régissent.

TCP/IP : Transmission Control Protocol over Internet Protocol (protocole de contrôle de la transmission par le protocole d'Internet)
Dénote particulièrement les protocoles de réseaux et de couches transport au sein de la pile de protocoles des cinq couches d'Internet, bien qu'il soit souvent utilisé pour référer à toute la pile. La suite de protocoles d'Internet correspond généralement aux couches liaison de données, réseau, transport, présentation et application décrites ci-dessus. La suite de protocoles non spécifiques à un constructeur d'Internet permet la communication entre un plus grand nombre d'hôtes et de types de formats de données que toutes les autres suites de protocoles.

IPv6 : Internet Protocol, version 6 (également Ipng, «I-Ping», pour Internet Protocol (prochaine génération)
IPv6 est un nouveau système, en voie d'élaboration, qui servira à assigner des adresses de protocole Internet dans l'avenir. Un consensus du Groupe IETF (Internet Engineering Task Force) a déterminé que Ipv6 sera le système d'adressage IP de la prochaine génération. IPv6, qui est un chiffre à huit sections de 32 bits, remplacera éventuellement le système d'adressage actuel Internet Protocol, connu sous le nom d'IPv4, qui est un nombre à quatre sections de huit bits.

Courrier électronique

SMTP : Simple Mail Transfer Protocol (protocole de transfert de courrier simple)
Protocole d'application TCP/IP qui est la norme de courrier électronique la plus utilisée. Ne peut recevoir le transfert de messages sans texte ou des parties de messages, comme les fichiers graphiques, audio ou vidéo ou de traitement de texte ou de tableurs électroniques parce que le code de format privé est sans texte. Peut recevoir uniquement l'ensemble de caractères standard ASCII (c.-à-d., non diacritique).

MIME : Multi-Purpose Internet Mail Extension (extension de courrier Internet à usage multiples)
Ajoute un soutien de messagerie à volets multiples (p. ex. documents hypertextes W3, annexes en traitement de texte, etc.) et à multimédias (sans texte comme les fichiers audio et graphiques) au SMTP. Soutient également le chiffrement de messages.

X.400 : services de messagerie (ISO 10021/CCITT X.400 1988)
Soutient le chiffrement, alors plus sûr que le SMTP sans l'extension MIME, et soutient les parties de messages sans texte. Le seul protocole de la suite OSI à être utilisé couramment, principalement au gouvernement.

Nouvelles

NNTP : Network News Transport Protocol (protocole de transport des nouvelles en réseau)
Il s'agit d'un protocole TCP/IP qui permet aux articles de discussion de se déplacer aisément sur Internet. La plupart des groupes de discussion existent dans le réseau USENET.

Transfert de fichiers

Protocole FTP : File Transfer Protocol (protocole de transfert de fichier)
Un protocole d'application TCP/IP utilisé comme moyen de transférer sur demande des fichiers texte et sans texte (p. ex. fichier audio), et des fichiers de logiciel d'un système à un autre. Un FTP anonyme permet à l'utilisateur d'extraire des fichiers choisis d'un système éloigné sans autorisation.

FTAM : File Transfer Access Method (méthode de transfert et d'accès de fichiers)
Protocole de transfert de fichier basé sur OSI, qui a été grandement surpassé par le protocole FTP.

Transfert de documents

Protocole HTTP : Hypertext Transfer Protocol (version 1.1) (protocole de transfert hypertexte)
Soutient les liaisons hypertextes entre les documents multimédias qui caractérisent le World Wide Web, un ensemble de serveurs HTTP. Le protocole HTTP version 1.1 est deux fois plus rapide que la version initiale 1.0.

Gopher
Utilise une structure de menus hiérarchiques (aucun lien hypertexte) et une interface à caractères (non graphique) pour avoir accès à des documents multimédias. A été rapidement éclipsé par HTTP/W3.

Accès par terminaux (accès à distance)

Telnet
Application TCP/IP qui permet à un utilisateur éloigné d'avoir accès à des applications comme les catalogues de bibliothèques. Est en train d'être supplanté par des interfaces de recherches Web qui utilisent un programme CGI (Common Gateway Interface) pour interroger une base de données et retourner les résultats.

Formats et normes en matière d'échange de données

Jeux de caractères

ASCII (American Standard Code for Information Interchange) (ISO 641)
Codeur de jeu de caractères le plus utilisé. Contient 7 bits par caractère; est limité à 128 caractères principalement en anglais.

ISO Latin 1 (ISO 8859-1:1987, partie 1)
Extension courante et remplacement d'ASCII, «Latin 1» est le jeu de caractères le plus utilisé d'ISO 8859-n (n=1-9), une série de neuf caractères alphabétiques à 8 bits, pour un total de 256, et est destiné principalement aux langues européennes. Utilisé par Windows.

UNICODE (ISO 10646-1  -  jeu de caractères universels)
Code de caractères à 16 bits visant à couvrir tous les systèmes d'écriture du monde. N'est pas mis en oeuvre à grande échelle en ce moment, bien que XML (voir plus loin) le soutienne.

Documents : formats textes en clair

ASCII (ISO 641)
Le plus petit dénominateur commun : code texte ASCII non structuré (voir plus haut). Devient vite désuet car certains des formats de documents plus complexes sont plus généralement acceptés.

Documents : Formats de textes disposés privés

MSWord, WordPerfect, etc. (applications de traitement de texte)
Approche tel écran - tel écrit au codage de format (code caché). Le codage de format est privé, de sorte qu'il peut représenter un problème de portabilité entre les progiciels ou même entre les diverses versions d'un même progiciel. Utilisé couramment pour les textes pouvant être révisés. Peut contenir des parties de fichiers multimédias.

PageMaker, Ventura, etc. (applications d'éditique)
Un codage de format privé est entré comme une commande particulière, et effectué uniquement à la sortie.

Format RTF (Rich Text Format)
Un format entrée-sortie portable pour de nombreux progiciels de traitement de texte conçus par Microsoft.

Documents : Formats de description de pages

Ces formats décrivent la forme sur la page, c.-à-d., la disposition d'un document mais pas son contenu ou sa structure. Utilisé pour présentation pour simple lecture d'images de pages finales formatées pour sortie sur n'importe quelle imprimante ou tout autre périphérique de sortie. De plus en plus utilisé pour les publications électroniques.

Langage PostScript («.ps»)
Langage de programmation créé par Adobe comprenant 420 opérateurs de format de commande (niveau 2) qui contrôle l'impression (mais pas l'affichage à l'écran). Permet l'impression formatée sur n'importe quelle imprimante à partir de n'importe quelle plate-forme (Windows, UNIX, etc.). Le format EPS (Encapsulated PostScript, «.eps») est un sous-programme compris dans les fichiers PostScript, habituellement utilisé pour les images produites avec un logiciel autre que PostScript.

Format PDF : Portable Document Format (format de documents transférables) («.pdf»)
Autre développement d'Adobe, le format PDF exclusif utilise l'ensemble de logiciels Acrobat pour être créé, édité, visualisé, etc. Il est indépendant du dispositif imprimeur et il soutient l'édition électronique en utilisant un formatage et des graphiques complexes, y compris des liens incorporés, des annotations, des croquis de pages et les grandes lignes de chapitres pour accès direct. Adobe a indiqué son intention d'intégrer la structure ainsi que la disposition en format PDF en l'étendant pour englober le langage SGML.

Documents : Formats structurés d'information

Comparé aux langages de description de page, les langages structurés de marquage de l'information décrivent les renseignements (contenu) et la structure, et non la disposition. Ce sont des outils et des plates-formes de traitement indépendants qui facilitent l'indexage automatique en décrivant les en-têtes, les chapitres, les paragraphes, les notes de bas de page, etc.

Langage SGML : Standard Generalized Mark-Up (langage standard généralisé de balisage) (ISO norme 8879-1986)
Une métalangue normalisée, ou syntaxe, conçue pour la spécification d'un nombre illimité de langages de marquage. Un document en langage SGML comporte trois éléments : la déclaration (décrit le milieu de traitement requis); la définition de document type (DTD) (un renvoi défini qui forme un gabarit pour la description de la structure et du contenu d'un type particulier de document); et la suite de documents elle-même. Le langage SGML est indépendant de tout système, appareil, langage ou application et, parce qu'il sépare la définition du contenu d'un document de la présentation, il permet un accès ou une présentation des renseignements de manières qui n'étaient pas prévisibles lors du marquage. Les logiciels de visualisation du langage SGML (p. ex., Panorama) analysent et interprètent le contenu du document SGML selon les directives DTD. On s'attend à ce que le langage SGML devienne une norme importante dans le développement de la bibliothèque numérique.

Voici certains DTD pertinents :

EAD (Encoded Archival Description) (description encodée d'archives) - une définition de document type pour le matériel d'archives;

US MARC DTD (voir sous Métadonnées-Description);

TEI (Text Encoding Initiative) (initiative d'encodage de texte) - une définition de document type pour les ressources érudites, conçus au départ pour les sciences humaines;

XML (voir plus loin);

HTML est la définition de document type la plus courante (voir plus loin).

Langage DSSSL : Document Style, Semantic and Specification Language (langage de style, de sémantique et de spécifications de document) (ISO 10179)
Une norme associée au langage SGML qui précise les règles d'un langage ouvert afin de régir l'apparence et le style des composantes logiques (p. ex., en-têtes de chapitres), définies par le langage SGML.

Langage XML : Extensible Mark-up Language (langage de balisage extensible) (« .xml »)
Un sous-ensemble réduit et simple du langage SGML conçu (en 1996) pour faciliter la mise en oeuvre et interfonctionnement avec les langages complets SGML et HTML. Il s'agit en ce moment de l'élaboration d'un profil d'application métalangue, il est plus simple à utiliser que le langage SGML (il réduit un document de référence de 500 pages à 26). Contrairement au langage HTML, le langage XML soutient (de façon facultative) les étiquettes et les attributs définis par l'utilisateur, permet l'emboîtement dans les documents à n'importe quel degré de complexité, et peut contenir une description facultative de sa grammaire pour être utilisée par les applications qui ont besoin d'exécuter une validation structurelle. Chaque document en langage XML valide sera un document conforme en langage SGML. Aucune rétrocompatibilité avec les documents en langage HTML, bien que ceux qui se conforment au langage HTML 3.2 peuvent être facilement convertis. Ne vise pas à supplanter le langage HTML mais à le compléter. Le jeu de caractères du langage XML est Unicode. Ce langage fait présentement l'objet de discussions importantes et les lancements futurs des navigateurs MS Internet Explorer et Netscape peuvent être validés XML.

Langage HTML : Hypertext Mark-up Language (langage de balisage hypertexte) («.htm», «.html»)
Version réduite d'un jeu d'étiquettes du langage SGML DTD qui fournit un ensemble de styles de plates-formes indépendantes (définies par les étiquettes) utilisés pour définir les composantes d'un document Web. Le langage HTML 2.0 est une norme du Groupe IETF; la version 3.0 était une ébauche du Groupe IETF (qui a eu duré six mois); le langage HTML 3.2 a été annoncé en mai 1996 afin de supplanter la version 2.0 comme le plus petit dénominateur commun. La version 3.2 comprend toute la version 2.0 et les caractéristiques populaires de 3.0 comme les tableaux, mais ne comprend pas de cadres. La version 4.0 a été lancée comme ébauche en juillet 1997. Alors que les étiquettes HTML sont principalement liées à la structure, il existe de plus en plus d'étiquettes acceptées pour préciser la présentation et la disposition.

Langage DHTML : Dynamic HTML (langage HTML dynamique)
Dénote les développements récents réalisés par Netscape et Microsoft et qui utilisent un ensemble de feuilles de style en cascade (voir plus loin) et un langage de script en code machine comme Visual Basic script et Javascript afin de fusionner le document HTML avec la feuille de style. Permet un plus grand contrôle créateur sur la présentation visuelle d'une page HTML et permet à la page de réagir de façon dynamique, sans un appel au serveur, pour les événements produits par les utilisateurs.

Cascading Style Sheets (Feuilles de style en cascade) («.css»)
Une nouvelle approche afin d'augmenter le contrôle sur le formatage visuel des documents HTML (p. ex., espacement, couleurs, fonds, choix de polices, ombrage, organisation en couches, positionnement relatif ou absolu, visibilité des options marche/arrêt, choix des médias tels que imprimé, affichage, braille, compréhension). Les étiquettes CSS sont dans un document séparé ou font partie du document (au lieu d'être enchâssés dans le texte comme avec le langage HTML traditionnel), de sorte qu'ils peuvent être modifiés, mis à jour dans divers documents rapidement. Les feuilles de style en cascade peuvent être mises en antémémoire localement et réutilisés, de sorte que leur déploiement peut entraîner des gains au niveau de la largeur de bande ou du temps de réponse.

Documents : Formats d'intégratiion de documents

OpenDoc
Vise à permettre l'intégration des caractéristiques de différents programmes d'application en un seul document de travail.

OLE : Object Linking and Embedding (liaison et incorporation d'objets)
Système répardi d'objets (propriété de Microsoft) qui permet à une application de gérer les parties de son contenu dans une autre application. Par exemple, la version à jour d'un tableau de données changeantes en Excel pourrait être demandée à partir d'un document de traitement de texte.

Images fixes : Formats adressables par bit (ou trame)

Ces formats enregistrent des renseignements sur les pixels ou les points particuliers. Ils sont habituellement destinés à la mémorisation, donc ils ont tendance à être utilisés pour les images simples.

Format GIF : Graphics Interchange Format (format de transfert des graphiques) («.gif»)
Format d'image très utilisé qui permet un bon affichage sur la plupart des systèmes informatiques, mais est limité à 256 couleurs. Il utilise une technique de compression sans perte. Il rend disponible des fichiers relativement petits pour affichage immédiat avec des textes dans les documents Web, il est donc couramment utilisé pour les barres d'outil, les icônes et les images intégrées. Il peut être «entrelacé» (toute l'image est affichée avec clarté au lieu d'un affichage séquentiel ligne par ligne). Une couleur peut être transparente (convient aux images/icônes flottantes sur fonds d'écran). Il convient mieux que le format JPEG pour obtenir des lignes nettes, des images noir et blanc et en divers tons de gris.

JPEG : Joint Photographics Expert Group (Groupe mixte d'experts en photographie) («.jpg»)
Format de compression à qualité contrôlée. Plus de 16 millions de teintes de couleur sont disponibles. Convient mieux que le format GIF pour les images réelles comme les photographies couleurs.

TIFF : Tagged-Image File Format (format d'étiquette de fichier vidéo) («.tif» ou «tiff»)
Emmagasine une très grande quantité de renseignements à propos d'une image. Soutient différents types de compression (à qualité contrôlée et sans perte). Très utilisé, mais est principalement un format intermédiaire entre les lecteurs et les programmes d'éditique.

PNG : Portable Network Graphics (graphiques de réseaux portables) («.png»; prononcé «ping»)
Vise à remplacer le format GIF, et comporte des améliorations au niveau de la détection d'erreur et de la vitesse d'entrelacement, ainsi qu'un taux de compression plus grand. Format en émergence mais pas encore très utilisé.

Format disque compact photo
Le format disque compact photo est un format privé de Kodak pour l'entreposage numérique sur disque compact d'images à haute résolution. Les images peuvent être visualisées à un éventail de résolutions, et être manipulées à l'aide de logiciels de traitement de l'image.

Groupe 4 du CCITT
Le CCITT a conçu une série de mécanismes de compression d'images en noir et blanc et de transmission par ligne téléphonique via le télécopieur. Ces normes sont connues officiellement sous le nom de Recommandations T.4 et T.6 du CCITT mais sont mieux connues sous le nom de compression Groupe 3 et Groupe 4 respectivement. Le Groupe 4 est le plus utilisé.

Images fixes : Formats vectoriels

Ces formats sont utilisés pour emmagasiner de l'information (algorithmes mathématiques) sur les lignes et les courbes qui composent l'image. Utilisé pour les documents composites (p.ex., les documents qui combinent les textes formatés de façon complexe, les images, etc.). Change facilement d'échelle pour afficher différents niveaux de grossissement. PostScript et PDF utilisent l'imagerie vectorielle (voir la section Formats de description de page, plus haut).

CGM : Computer Graphics Metafile (métafichier d'images graphiques informatiques)
Norme pour la mémorisation et l'échange de données graphiques à deux dimensions. Était au départ un format vectoriel, mais a récemment été élargi pour comprendre les capacités de mémoire de trame. Quatre normes internationales ont été élaborées et précisent la façon dont CGM doit être utilisé dans les courriers électroniques avec extension MIME et sur le Web.

Formats sonores

On a récemment assisté à une prolifération de produits et de formats sonores privés pour Internet. Voici ceux qui sont les plus utilisés :

AIFF : Audio Interchange File Format (format d'échange de fichiers audio) («.aif» ou «aiff»)
Format de ficher sonore Macintosh.

RIFF WAVE («.wav»)
À l'origine, format de fichier sonore de Microsoft Windows, il est maintenant élargi à d'autres plates-formes. Son stéréophonique.

mLaw («.au»)
Autre format de fichier sonore courant d'Internet, de Sun Microsystems. Fonctionne bien sur toutes les plates-formes, mais est de qualité inférieure. Son stéréophonique.

RealAudio («.ra» ou «.raf»)
Produit sonore privé très populaire de Progressive Networks. Utilise une sortie en «chaîne», ce qui veut dire que le son commence dès que l'ordinateur de l'utilisateur reçoit les premiers bits. Le document sonore n'est pas sauvegardé chez le client. Son stéréophonique avec version 3.0 (les autres versions étaient uniquement monophoniques).

Formats de fichiers d'images mobiles

On a également assisté récemment à une prolifération de produits et de formats vidéo privés pour Internet. Voici ceux qui sont les plus utilisés :

QuickTime Movies (films Quick Time) («.mov»)
Normes de compression privées d'Apple pour les fichiers vidéo; fonctionne maintenant sur d'autres plates-formes.

Format AVI : Audio-Video Interleaved (entrelacement audio-vidéo) («.avi»)
Format de fichier vidéo pour Windows.

Norme MPEG : Moving Picture Expert Group (groupe d'experts d'images mobiles(«.mpg»)
Une norme de compression pour vidéo qui transfère tous les renseignements de chaque dixième cadre, tandis que les neufs cadres subséquents sont transmis uniquement comme changements importants à ce cadre de référence. Fonctionne sur toutes les plates-formes mais est de qualité inférieure.

RealVideo
Produit vidéo de Progressive Networks qui utilise la sortie en chaîne.

Format GIF 89a: Graphic Interchange Format 89a («animated GIF»)
Approche simple, populaire et omniprésente à l'animation infographique simple.

Formats multimédias/interactifs

ShockWave
Le produit multimédia de Macromedia soutient les jeux, les interfaces d'animation, les annonces interactives, les démonstrations et une sortie audio de qualité disque compact. Compris dans Netscape Navigator et Microsoft Explorer.

Java, Active X
Une des fonctions du langage de programmation Java, de Sun Microsystems, ou de Active X de Microsoft, est de soutenir la transmission en continu de données multimédias à multifenêtres. Microsoft et Netscape ont intégré les deux technologies dans leurs navigateurs.

Formats de modélisation à trois dimensions

QTVR : QuickTime Virtual Reality (realité virtuelle QuickTime)
Produit privé d'Apple qui permet à un utilisateur de visualiser les objets et l'emplacement à partir d'un angle de 360o en ayant accès à un petit fichier et en l'exécutant comme un film QuickTime. Les options de visionnement de l'utilisateur (ou mouvement) sont en fait limitées au nombre de points fixes à partir desquels l'objet réel a été photographié. Incorporé à Netscape 3.0.

Langage VRML : Virtual Reality Modeling Language (langage de modélisation en réalité virtuelle) («.wrl»)
La spécification actuelle de domaine public (Version 2.0) prévoit la conception et la mise en oeuvre d'un langage basé sur ASCII utilisant une plate-forme indépendante pour la description de scènes en réalité virtuelle. L'objet doit être modelé (contrairement à QuickTime VR, ce n'est pas un objet réel qui est photograhié). L'image ressemble à l'animation sur ordinateur et est souvent lente et saccadée. Incorporé à Netscape 3.0.

Protocole de transmission de données en continu

RTSP : Real Time Streaming Protocol (protocole de transmission en continu en temps réel)
Norme de l'industrie proposée et annoncée par Netscape, Progressive Networks et 40 autres entreprises, ce protocole règle les problèmes comme la fiabilité, la qualité, la fidélité, la perte de paquets et les commandes marche/arrêt pour la transmission en continu des données vidéo et audio en temps réel.

Norme NetShow
Spécification concurrentielle de Microsoft pour la transmission de données en continu. Va plus loin que RRSP pour ce qui est de tenter de préciser une norme en matière de compression et de décompression en plus de la commande marche/arrêt.

Métadonnées

Ce terme signifie « des données sur des données » ou, plus particulièrement dans le contexte Web, des renseignements compris par une machine afin d'identifier, de localiser ou de décrire les ressources Web. Les normes traditionnelles de bibliothèques équivalentes comprennent l'ISBN et l'ISSN (identification), le numéro de rayon/cote (emplacement), l'ISBD et les RCAA2 (description bibliographique), le numéro de contrôle LC et la CDD (classification par matière), les LCSH (vedette-matière) et le MARC (format de communication lisible par machine).

Échange de métadonnées

RDF : Resource Description Framework (cadre de définition des ressources)
Cadre technique qui est en voie d'élaboration par le W3C pour appuyer l'interfonctionnement des métadonnées décrivant tout article qui peut avoir un URI (voir plus loin). Les codes comme PICS et Dublin Core (voir plus loin) sont des vocabulaires normalisés prédéfinis dans le cadre. XML est la syntaxe d'encodage.

Identification unique

URI : Uniform Resource Identifier (identificateur de ressources uniformes)
Terme inclusif pour l'ensemble de technologies  - comprend présentement URL, URC et URN mais est extensible  -  qui a été conçu sous les auspices du Groupe IETF, pour nommer, adresser et, jusqu'à un certain point, décrire les ressources Web.

URN : Uniform Resource Name (nom de ressources uniformes)
Conçu pour répondre aux besoins d'un identificateur général, persistant et unique pour une ressource électronique (par opposition à un URL, qui, bien qu'il ait présentement une fonction d'identification, est lié à l'emplacement de la ressource, qui peut être multiple et peut changer en tout temps). Nécessite des registres URN (pour veiller à ce qu'il n'y ait aucun dédoublement) et des systèmes de résolution (pour établir une correspondance avec le ou les emplacement(s) de la ressource). Une syntaxe simple est urn:hdl:cnri.dlib/august95. Aucune mise en oeuvre jusqu'à maintenant.

ISBN, ISSN, ISMN
Identificateurs bibliographiques standard pour les documents imprimés qui peuvent être attribués aux livres électroniques, aux publications en série et à la musique.

SICI : Serial Item and Contribution Identifier (identificateur d'articles et de contributions à des publications en série) (ANSI/NISO Z39.56-1996, vers. 2)
En voie d'élaboration afin d'identifier les questions relatives aux publications en série et uniquement les articles sans égard au support de diffusion (papier, électronique, microforme). Pas encore mis en oeuvre.

DOI : Digital Object Identifier (identificateur d'objets numériques)
Est en voie d'élaboration par l'Association of American Publishers et la Corporation for National Research Initiatives (CNRI) afin d'identifier les objets numériques, qui pourraient être des livres, des chapitres, des articles, des images, des enregistrements, des vidéos ou toute autre oeuvre de création, principalement à des fins de gestion efficace des droits et du commerce numérique. Ressemble quelque peu à l'ISBN dans sa formulation : un composant à la gauche de la barre oblique dénote le préfixe du déposant, et un composant à la droite de la barre est l'identificateur unique de l'objet, tel que désigné par le déposant (p. ex., 10.65478/45920). Certains éditeurs ont commencé à mettre en oeuvre un prototype DOI.

Localisation

URL : Adresse URL (localisateur de ressources uniformes)
Adresse électronique qui précise (en ordre) : le protocole de communication, le domaine/serveur hôte, le chemin du répertoire, le nom du fichier et le type de fichier. Lorsque l'une ou l'autre de ces données change (emplacement, méthode d'accès ou nom), le lien est interrompu à moins qu'il n'existe une page reliant l'utilisateur au nouvel emplacement; l'adresse URL devient alors un PURL.

PURL : Persistent Uniform Resource Locator (localisateur persistant de ressources uniformes)
Une approche au problème de permanence de l'adresse URL proposé par l'OCLC. Le PURL est un alias public pour un document. Il reste stable, tandis que le fond du document URL change selon la gestion (p. ex., déplacement qui en est fait). Un PURL est créé par un administrateur de site Web qui est enregistré comme un «propriétaire» de PURL et qui maintient une mise en correspondance du PURL pour un URL à jour et en fonction. Un PURL est une forme d'URN.

Description

URC : Uniform Resource Citation (citation de ressources uniformes) ou Uniform Resource Characteristics (caractéristiques de ressources uniformes)
Conçu conjointement avec l'URN comme moyen de décrire les ressources accessibles sur Internet. L'URC est un ensemble de variables qui peuvent comprendre l'auteur, l'éditeur, le type de données, la date, le droit d'auteur, etc., ainsi qu'un URI de diverses sortes (c.-à-d., son URN et son adresse URL applicable). La norme précise également la structure pour la mémorisation de métadonnées, de même que les opérations pour la conception et l'interrogation de cette structure. Elle encourage l'élaboration de sous-types d'URC afin de définir les éléments de données appropriées pour différents types ou classes de ressources. Pas encore mis en oeuvre.

Dublin Core
L'ensemble d'éléments de métadonnées Dublin Core consiste en 15 éléments de données descriptifs relatifs au contenu, à la propriété intellectuelle et à «l'intanciation». Les éléments sont le titre, le créateur, l'éditeur, le sujet, la description, la source, la langue, la relation, la couverture, la date, le type, le format, l'identificateur, le collaborateur et les droits. Ils doivent être fournis par le producteur de la ressource. Le Warwick Framework établit une approche conceptuelle en vue de mettre en oeuvre le Dublin Core, approche qui intègre les données dans un document HTML utilisant une étiquette MÉTA. Dublin Core fait l'objet de nombreuses discussions et il y a un groupe croissant de projets de mise en oeuvre dans plus de 10 pays. Il existe une mise en correspondance Dublin-Core-USMARC.

GILS : Service de localisation de l'information gouvernementale
Conçu aux États-Unis et maintenant adopté dans d'autres pays, le GILS est une collection décentralisée de systèmes contenant des bases de données de fichiers GILS donnant des renseignements sur l'emplacement et l'accès à des renseignements sur les ressources gouvernementales à la disposition du public. Z39.30 est le mécanisme d'accès qui a été défini pour l'interrogation de ces systèmes. Ceux-ci peuvent également être interrogés par l'entremise du Web. Il existe une mise en correspondance GILS-USMARC et un profil SGML a été conçu pour les fichiers GILS.

TEI Headers : (en-têtes de l'initiative d'encodage de texte)
Les en-têtes des documents TEI (un langage SGML, définition de type de document) habituellement des ressources érudites telles que la prose, les vers, les pièces de théâtre, les dictionnaires, etc., décrivant le fichier (mention du titre, instruction sur la publication, la description de la source), son encodage, les renseignements sur ses mises à jour, etc. Est de plus en plus utilisé.

EAD : Encoded Archival Description (description encodée d'archives)
Un langage SGML, définition de type de document, comme instrument de recherche des fonds d'archives. Pas très utilisé.

ISBD, RCAA2, LC, CDD, LCSH, MARC, etc.
Normes traditionnelles de bibliothèques pour la description de ressources bibliothéconomiques conventionnelles pouvant être utilisées pour les ressources électroniques. L'étiquette 856 du US MARC, nouvellement ajoutée, permet de fournir l'URL dans les notices bibliographiques.

MCF : Meta Content Framework (cadre de méta-contenu)
Un format ouvert de représentation de renseignements sur le contenu. Le contenu visé comprend les pages Web, les fichiers Gopher et FTP, les fichiers d'éditique, le courrier électronique et les bases de données structurées. Le méta-contenu correspondant comprend des index tels que Yahoo!, les structures de répertoire gopher et le protocole FTP, les en-têtes de courrier électronique, les dictionnaires de données, etc. Version actuelle 0.95.

SOIF : Summary Object Interchange Format (format d'échange d'articles récapitulatifs)
Un format d'indexation structuré qui permet l'interrogation structurée (p. ex., jumelage de mots-clés uniquement aux lignes de l'auteur ou du titre des documents). Le soutien que SOIF apporte aux données arbitraires signifie qu'il peut être utilisé pour des applications de recherche plus complexes, comme la recherche d'images ou de sons.

PICS : Platform for Internet Content Selection (plate-forme de sélection du contenu sur Internet)
Un groupe de travail W3C (World Wide Web Consortium) a proposé un ensemble d'étiquettes de métadonnées pour appuyer l'auto-description et la description par une tierce partie, ainsi que l'évaluation du contenu de documents et de ressources électroniques. Le but est de permettre aux utilisateurs d'Internet de choisir des ressources basées efficacement sur cette description de métadonnées, qui sera rattachée aux ressources.

Recherche et repérage de renseignements

Recherche et repérage sur le Web

Navigateurs Web
Les navigateurs Netscape et Internet Explorer de Microsoft sont des navigateurs standard du Web. Ce sont des logiciels qui peuvent agir en tant qu'interface entre l'utilisateur et le World Wide Web. Les navigateurs sont également appelés clients Web parce que dans le modèle client/serveur, le navigateur fonctionne comme le programme du client.

Moteurs de recherche Web
Aucune norme ne régit les moteurs de recherche Web. La plupart consistent en bases de données de mots clés indexés à partir de ressources Web et offrent des possibilités de recherche booléenne, de recherche de phrases ou de mots, et un classement pertinent. Bon nombre fournissent un accès navigable aux répertoires (structurés) en plus de l'indexation de mots clés.

Recherche et repérage de bases de données

Z39.50 : ANSI/NISO Norme de recherche et de repérage de l'information Z39.50-1995
Depuis la fin 1996, également adoptée sous le nom de :

ISO 23950
Précise les règles et les procédures de deux systèmes qui communiquent entre eux pour effectuer la recherche de bases de données et le repérage de renseignements. La norme compte deux parties : la portion «origine», qui soutient l'interrogation de systèmes éloignés, et la portion «cible», qui traduit les demandes d'interrogation selon la logique du système de bases de données cible, et retourne les fichiers ou l'ensemble des résultats. Du point de vue du chercheur, la norme permet d'interroger différents systèmes à l'aide d'une interface-utilisateur familière.

SQL : ISO/CEI 9075:1992 technologie de l'information ... langage de bases de données ... SQL, également ANSI X3.135-1992, langage de bases de données SQL (Structured Query Langage) (langage structuré de requête SQL)
Le langage de requête SQL est un langage normalisé populaire et interactif ainsi qu'un langage de programmation en vue d'obtenir des renseignements d'une base de données et de mettre à jour une base de données relationnelle. Il permet l'interfonctionnement des produits DBMS de différents fournisseurs. Le langage définit les structures de données communes (tableaux, colonnes, visualisation) et offre un langage de manipulation de données afin de mettre à jour et d'interroger ces structures.

Interfaces

Z39.59 : ANSI/NISO Common Command Language Standard (norme de langage de commandes commun)
Prescrit les commandes d'interfaces pour les opérations d'interrogation de bases de données normalisées.

Demande de documents

Protocole de PEB : ISO 10160 et 10161
Protocole OSI qui précise les règles devant permettre l'échange automatisé de messages de PEB entre les divers systèmes de PEB et qui appuie la gestion des transactions de PEB.

Répertoires

Les répertoires gèrent les renseignements qui ont été colligés sur les personnes ou les ressources. Un répertoire est habituellement utilisé pour recevoir des renseignements d'adressage, mais on peut également y retrouver de l'information sur les capacités, la comptabilité ou les autres attributs de l'objet décrit.

X.500 : Norme de répertoire CCITT X.500/ISO 9594
Un protocole OSI pour la gestion de répertoires en ligne d'utilisateurs ou de ressources qui fournit une structure hiérarchique correspondant au système de classification mondial : pays, états, villes, rues, maisons, familles, etc. On vise à créer un répertoire qui peut être utilisé dans le monde entier. Un répertoire X.500 est, de par sa conception, réparti (c.-à-d., l'information sur le répertoire peut être distribuée à plusieurs systèmes ouverts) mais offre une vue unique à ses utilisateurs.

LDAPv3 : Lightweight Directory Access Protocol (protocole d'accès de répertoires légers), version 3
Protocole client/serveur permettant l'accès aux services d'un répertoire, le LDAP est une version simplifiée de la portion du protocole d'accès aux répertoires du protocole X.500 conçu pour fonctionner directement sur la pile TCP/IP. Le LDAPv3 est une mise à jour conçue par le Groupe IETF. Il règle les limites trouvées durant le déploiement de la version précédente de LDAP, RFC 1779. On y trouve également de nouvelles caractéristiques, il améliore la compatibilité avec X.500 (1993) et précise mieux l'utilisation possible du LDAP avec des répertoires autonomes et des répertoires non X.500.

WHOIS++
WHOIS++ est un autre mécanisme léger de recherche de répertoires client/serveur réparti qui, au départ, était très utilisé comme méthode de localisation des utilisateurs Internet, mais qui est graduellement remplacé par les services X.500 ou LDAP.

Mémorisation de l'information

Supports optiques d'archivage

CD-DA : Disque compact audionumérique, ou CD-Audio
Norme de 1980 connue sous le nom de «Red Book» qui définit les disques compacts musicaux en fonction du taux de la fréquence d'échantillonnage (44 100 échantillons par seconde), de l'échelle de valeur (65 536) et du format physique : entrée de poste (contient la table des matières et l'emplacement de chaque plage), la zone de programme (plages) et la sortie de poste (silence).

CD-ROM: Disque compact à mémoire morte
La norme «Yellow Book» de 1983 a conservé le format physique du «Red Book», a ajouté davantage de corrections d'erreurs, et a permis deux structures de données : Mode 1 (ISO 9660), mieux adapté pour les données ne pardonnant pas les erreurs comme les programmes informatiques ou les bases de données; et Mode 2, pour les données qui sont plus tolérantes aux erreurs comme les données audio, vidéo et graphiques.

CD-i : Disque compact interactif
Norme «Green Book», basée sur le Mode 2 «Yellow Book» qui définit le disque, son contenu, les méthodes de compression spéciales pour les données audio et vidéo, une méthode d'entrelacement pour les données audio, vidéo et textuelles, et un système d'équipement et de logiciels conçus pour interagir avec la télévision et les systèmes stéréo et, plus récemment, avec le Web.

CD-R : Disque compact inscriptible
Les spécifications du «Orange Book», Partie II, 1988, soutiennent l'enregistrement en une seule fois sur le disque de diverses données à accès direct au moyen d'une couche de teinture sensible au laser incorporée dans la fabrication du disque.

CD-RW : Disque compact réinscriptible
Les spécifications du «Orange Book», Partie III, 1994, soutiennent l'enregistrement sur les disques effaçables basé sur une technologie de changement de phase d'un film sensible incorporée dans la fabrication du disque. Aucune rétrocompatibilité avec les lecteurs CD ou les lecteurs de cédérom en raison de la différence entre la réflectivité des médias.

Photo CD, Vidéo CD
Le Vidéo-CD est une spécification du «White Book».

DVD Audio, DVD-ROM, DVD-Inscriptible, DVD-Réinscriptible, DVD-Vidéo
Il s'agit de la prochaine génération de formats de disques optiques, dont le capacité de stockage est plus grande (de 8 à 15 fois plus grande) que les CD équivalents. Les lettres «DVD» signifiaient auparavant disque vidéonumérique, puis disque numérique versatile, maintenant, seul l'acronyme DVD est utilisé.

Supports magnétiques d'archivage

Les supports magnétiques d'archivage comme les bandes magnétiques, les disquettes et les cartouches sont très nombreux et en grande partie privées et ont, par conséquent, été exclus du présent document.

Sources choisies

ALSCHULER, Liora. ABCD...SGML : A user's guide to structured information, International Thomson Computer Press, 1995.

CLEVELAND, Gary. Electronic Document Delivery: Converging standards and technologies. Série de l'UDT d'lFLA sur les technologies et les normes relatives à la transmission des données pour les bibliothèques, 1991.

DEMPSEY, Lorcan et al. eLib Standards Guidelines, Version 1.0, le 26 février 1996.
http://ukoln.bath.ac.uk/elib/wk_papers/stand2.html

Dictionary of PC Hardware and Data Communications Terms. http://www.ora.com/reference/dictionary/

EWOS Guide to Open Systems Specifications (GOSS). http://www.ewos.be/dir/gtop.htm

Free On-line Dictionary of Computing. http://wombat.doc.ic.ac.uk/foldoc/index.html

GUENETTE, David R. et Dana J. PARKER. «CD, CD-ROM, CD-R, CD-RW, DVD, DVD-R, DVD-RAM: The Family Album», E-media Professional, vol. 10, no 4, avril 1997, p. 31-52.

HODGES, Jeff, et al. An LDAP Roadmap & FAQ. http://www.kingsmountain.com/ldapRoadmap.shtml

Info2000 Directory Services. http://www2.echo.lu/oii/en/directory.html

Internet Users' Glossary. http://ds.internic.net/rfc/rfc1983.txt

InterNIC. 15-minute series. http://rs.internic.net/nic-support/15min/

National Institute of Standards and Technology. http://www.nist.gov/

NetLingo: A dictionary of the Internet Language. http://www.netlingo.com/

Flash Réseau. Bibliothèque nationale du Canada. 1995- . http://www.collectionscanada.ca/9/1/index-f.html

The Open Information Interchange Initiative. http://www2.echo.lu/oii/en/oiistand.html

PFAFFENBERGER, Bryan. Internet in Plain English, MIS Press, 1994.

TechWeb Tech Encyclopedia.
http://www.techweb.com/encyclopedia/defineterm.cgi

U-Geek Glossary.
http://www.ugeek.com/glossary/glossary_search.htm

UKOLN Directory Services.
http://www.bath.ac.uk/~ccsap/Directory/

WEIBEL, Stuart et Juha HAKALA. «DC-5: The Helsinki Metadata Workshop». D-Lib Magazine, février 1998.
http://www.dlib.org/dlib/february98/02weibel.html

WELZ, Gary. «Multimedia comes of age», Internet World, Vol. 8, no 2, p. 44-49.

W3C. Naming and Addressing: URI's.
http://www.w3.org/pub/WWW/Addressing/Addressing.html

W3C. Resources Description Framework (RDF).
http://www.w3.org/RDF/

Whatis.com, Inc.
http://whatis.com/

Remerciements

J'aimerais remercier mes collègues de l'Analyse de l'information et des normes, de la Bibliothèque nationale du Canada, à savoir Gary Cleveland, Terry Kuny, Chris Robertson, Barbara Shuh, Leigh Swain, Fay Turner et Michael Williamson, pour avoir révisé et suggéré des révisions à certaines sections du présent document.