Site de l'Office québécois de la langue française

Barre de navigation Accueil Plan du site Courrier Coordonnées English section Site officiel du Gouvernement du Québec

 Publications et services linguistiques
 Bibliothèque virtuelle
 Technologies de l'information
 Testez vos connaissances
 Jeux linguistiques
 Données sociolinguistiques
 Liens utiles

Page du GDT et de la BDL

Recherche dans le site
Dossier - Les courriers électroniques - «... le français sans frontières! »
Imprimer

 Accueil | Technologies de l'information

 

Le courrier électronique est l’une des plus vieilles applications d’Internet et, sans doute, une des technologies à l’origine du succès de ce réseau des réseaux. Dès 1973, on trouve des documents descriptifs de la messagerie Internet. Semblables à tout acte de communication par la poste, ces logiciels permettent la composition, l’envoi et la réception de messages par l’intermédiaire d’Internet. Moins spectaculaire que le Web, le courrier n’en demeure pas moins, pour bon nombre, la raison principale d’un abonnement à un serveur Internet. Au cours des deux dernières années, le nombre d’utilisateurs du réseau a augmenté de 700 % et le trafic engendré par le courrier en représente une grande partie.

Comment les messages cheminent-ils?

Les messages parcourent parfois de longs chemins pour parvenir à leur destinataire. Nous vous proposons, dans le cheminement qui suit de suivre un message, de son point de départ à son point d'arrivée (logiciel client et serveurs et ordinateurs-relais). Nous vous convions aussi à vous attarder quelque peu sur ce problème, de moins en moins préoccupant il est vrai, des accents qui ne se rendent parfois pas. Peut-être y trouverez-vous la solution qui vous convient? Afin de vous aider, nous vous proposons aussi certaines configurations qui maximiseront le rendement de votre messagerie d'un point de vue techno-linguistique. Enfin, pour ceux qui désirent entrer dans le détail, nous vous livrons les résultats de chacun des produits évalués par la grille d'évaluation.Haut de page

 

Logiciel client
Serveurs et ordinateurs-relais
Recevoir « L'été » ou ... L'=E9t=E9
... L'iti
... L'*t*
... L't
... Le c?ur de l'été

Logiciel client et SMTP (OU ESMTP)Haut de page

Ce type de logiciel de courrier utilise le protocole SMTP (Simple Mail Transfer Protocol), dont on peut situer l’origine en 1982, afin de diriger les messages sortants vers un serveur (A) qui, lui aussi, doit utiliser le même protocole. L'objectif est de fournir une interface simple pour que deux ordinateurs, peu importe leur système d'exploitation, puissent échanger des messages électroniques dans Internet. Ce protocole SMTP est limité au jeu de caractères US-ASCII (7 bits). En somme, si, dès 1973, on pouvait envoyer des messages, le standard en vigueur ignorait complètement les langues contenant des caractères avec des signes diacritiques qui sont plus que majoritaires dans le monde et qui nécessitent toutes un jeu de caractères codés sur 8 bits ou plus. Ce standard oblige donc à convertir tout caractère utilisant le 8e bit en plusieurs caractères 7 bits. Cette conversion a donné lieu à des méthodes d'encodage dont les plus connues sont QP [Quoted-Printable (7 bits)], UUEncode (7 bits), Base64 (6 bits) etc.

La méthode d'encodage QP est connue, selon divers logiciels utilisés, sous différents noms assez incompréhensibles en français (par calque de l'anglais « quoted printable », un terme lui-même difficilement compréhensible dans cette langue), comme par exemple « guillemets cités imprimables » ou « imprimés cités » ou encore « citations imprimables ». Cette méthode est surtout utilisée pour le texte qu'on trouve dans le corps des messages. Dans cette méthode « é » devient « =E9 », E9 étant une valeur hexadécimale. Cette méthode nécessite un encodage à l’émission et un décodage à la réception. Si le décodage ne se fait pas correctement pour des raisons énumérées plus loin, un texte parsemé de ces codes le rendrait difficilement lisible.

Rappelons-nous que, jusqu’au 128e caractère (valeur décimale 127), aucun encodage n’est nécessaire. L’encodage à l’émission et le décodage à la réception peuvent altérer le texte d’origine quand la méthode QP est mal implantée dans le logiciel.Haut de page

La méthode d'encodage Base64 (codage sur 6 bits) est plus utilisée pour les données autres que textuelles, car elle ne favorise pas la lisibilité. Elle est donc utilisée pour les fichiers joints (textes formatés, images, sons, vidéo, etc.). Elle ne pose généralement pas de problèmes dans l’encodage et le décodage, car elle est bien implantée dans les logiciels.

En 1994, le document RFC 1651 définissait des extensions pour le protocole SMTP. Il devint alors ESMTP pour Extended SMTP. Dès lors, il a été possible d'utiliser des caractères 8 bits sans méthode d'encodage.

L'encodage des textes dans le corps des messages nécessite, entre autres, que le logiciel du destinataire puisse décoder correctement et restituer le texte d'origine composé par l'expéditeur. Nous pouvons aisément comprendre les problèmes potentiels liés à l'encodage s'il y a absence de décodage ou s’il y a mauvais décodage. Il y a aussi augmentation de la taille des messages pour tous ceux qui utilisent des signes diacritiques ou des caractères dont la valeur décimale est plus grande que 128. Cette augmentation peut être pénalisante en espace disque et en temps de connexion.

MIME (Dès 1996, le RFC 2045 remplace les RFC 1521 et 1522) est le protocole de communication utilisé entre deux applications de messagerie électronique; il fut aussi utilisé par d'autres, par la suite, pour communiquer des données de natures diverses contenues dans le message et la méthode d'encodage utilisée. MIME (Multipurpose Internet Mail Extensions) est défini dans le document RFC 2045. Il permet donc la transmission correcte de tous les documents textuels ou non, c’est-à-dire des caractères spéciaux, des illustrations, des photos, des séquences vidéo, du son, etc.Haut de page

C'est la raison pour laquelle nous voyons si souvent des en-têtes de message de la forme :

X-Mailer: Eudora Light F3.1.11
Subject: = ?iso-8859-1 ?Q ?=C9T=C9_G=C2TEAU_=CO_NO=CBL?=
MIME-Version: 1.0
Content-Type: text/plain; charset="iso-8859-1"
Content-Transfer-Encoding: quoted-printable

Dans cet exemple, on voit que MIME indique que le jeu de caractères utilisé est l'alphabet latin no1 ISO/CEI 8859-1 et que la méthode d'encodage est le quoted-printable (QP). Le jeu de caractères ISO/CEI 8859-1 a été défini par des instances de l’ISO (organisme international de normalisation). Ce jeu de caractères est codé sur 8 bits et permet l’utilisation d'au moins 14 langues utilisant l’alphabet latin dans plus de 40 pays. Ce que nous voyons dans la rubrique « Subject » résulte d’un mauvais décodage QP.

Avec l’apparition de ESMTP, il est possible de ne pas utiliser de méthode d'encodage. Ainsi on utilise du MIME 8 bits purs. On aurait alors l'en-tête suivante :

X-Mailer: Windows Eudora Pro Version 3.0.1 (32)[F]
MIME-Version: 1.0
Subject: GÂTEAU À NOËL
Content-Type: text/plain; charset="iso-8859-1"
Content-Transfer-Encoding: 8bit

Avec cette façon de faire, la taille des fichiers n'est pas augmentée, la possibilité d'une erreur dans le décodage est éliminée et la lisibilité est parfaite. Et, nous le verrons plus loin, si l’agent SMTP récepteur permet aussi l’utilisation de ESMTP, il signifiera à l’agent émetteur que le transfert en 8 bits est possible.

La solution actuelle la plus populaire est de configurer en MIME 8 bits. Il n’y a alors pas d’encodage et les caractères sont alors envoyés tels quels, ce qui n’entraîne pas d’augmentation de la taille des fichiers et respecte donc un peu plus les langues de l’alphabet latin. Cette solution prépare l'avenir puisqu’elle permet la transmission de 8 bits par octet, ce qui facilitera éventuellement le passage à une des formes de transmission du jeu universel de caractères (ISO/CEI 10646), qui offre un soutien, complet à terme, de la plupart des langues de communication du monde.

Serveur A / ordinateurs-relais / serveur B Haut de page

Les serveurs ne devraient pas intervenir dans la méthode d'encodage utilisée par le logiciel de courrier client. On voit cependant, encore trop souvent, des messages insérés par les serveurs dans les en-têtes de courrier tels que :

X-MIME-Autoconverted from 8bit to quoted-printable by....

Une fois le message reçu par le serveur, ce dernier l'envoie vers des ordinateurs relais. Ces derniers relaient le message jusqu'au serveur (serveur B dans la figure 1.1) du destinataire final. Avec la méthode MIME-8 bits, il est possible que les relais tronquent le 8e bit. Nous aurions alors dans le corps du message le « é » qui deviendrait un « i » [valeur décimale 233 é moins 128 (pour 7 bits) = 105 (qui est la valeur décimale du caractère i)].

En théorie, donc, lorsque le message part codé en 8 bits, l’agent ESMTP doit négocier avec le serveur de réception afin de vérifier s’il peut lui transmettre en 8 bits. Il est vrai que la réaction d’un agent SMTP de l’ancienne génération qui reçoit un message en 8 bits est imprévisible. Elle va de l’acceptation sans difficultés (si le récepteur permet ESMTP) à la suppression du 8e bit (là où les é deviennent des i) sans oublier le blocage pur et simple de l’agent. Lorsque le serveur-récepteur (B) refuse la négociation ESMTP, il faut alors que l’agent ESMTP émetteur recode en 7 bits, le plus souvent de type quoted-printable. Cette approche évite de transférer un 8e bit vers des agents incapables de les traiter. On comprend donc l’importance des balises MIME.

J’ALTÈRE, TU ALTÈRES, IL ALTÈRE ... NOUS SOMMES ATTERRÉS !

Une synthèse, à l’aide d’un exemple, met mieux en lumière la problématique et les solutions envisageables. Voici donc six cas de figure obtenus à la réception d’un message.

Si on reçoit :Haut de page

L’été Nous sommes en présence d’un message dans les normes, c’est-à-dire soit qu’il a cheminé en 8 bits purs et qu’il n’a subi aucun dommage à l’arrivée, soit qu’il a été encodé et que le logiciel l’a bien décodé.
L’=E9T=E9 (à la Einstein) Le message n’a pas été décodé correctement soit parce que notre logiciel de messagerie ne parle pas MIME (dans ce cas, il faut changer de logiciel ou se procurer une version plus récente), soit que les en-têtes MIME du message sont fausses ou erronées. Dans ce cas, c’est le logiciel émetteur qui est fautif. Enfin, dernière possibilité, le décodage QP pourrait ne pas être implanté dans le logiciel.
L’iti (appellation bien connue d’un certain extra-terrestre) Dans ce cas, le 8e bit a été tronqué et il faut alors recommander, hélas, à l’utilisateur émetteur d’activer l’encodage QP. Toutefois, si un certain Hercule Poirot de l’informatique découvre que le coupable (parmi tous les suspects déjà énumérés) est l’administrateur du serveur SMTP, nous pouvons lui demander de configurer correctement afin de traiter adéquatement le 8e bit.
L’*t* ou L’ t ou l’?t? Cas de figure d’un message transmis par un jeu de caractères autre que l’ISO/CEI 8859-1. La solution est de demander à l’émetteur de convertir du jeu de caractères local vers le jeu de caractères ISO/CEI 8859-1.
L’t Dans ce cas, la police de caractères utilisée ne supporte pas l’ISO/CEI 8859-1. Il faut changer de police.
ou c?ur Si une personne reçoit « c?ur » ou « ?uvre », c’est que l’émetteur a saisi le mot « cœur » avec la ligature œ à l’émission. Pourtant, ce caractère, bien que disponible dans le jeu de caractères ANSI 1252 (Windows) ne l’est pas dans le jeu de caractères ISO/CEI 8859-1. Il est donc remplacé par un ?, ce qui est pour l'instant prévisible mais anormal par rapport au soutien intégral du français.

Soulignons aussi qu’un autre problème peut se poser dans le cas de diffusion en mode regroupé (digest) par des logiciels de groupes de discussion (Majordomo par exemple). Dans ce cas-là, Haut de pagemême si les messages utilisent des codages différents, une seule méthode est indiquée pour l’ensemble de ces messages. Le logiciel client est alors incapable de les décoder correctement.

De ce que l’on vient de dire, on déduit que, s’il y a encore des problèmes, il faut accuser les passerelles. Ce sont elles qui sont trop peu souvent mises à jour par les administrateurs de systèmes. Cette attitude fait que les plus récents logiciels de messagerie qui, eux, traitent correctement les accents, ne sont pas installés et configurés. À nous de faire pression nos administrateurs.

Faut-il pour autant choisir de privilégier le plus petit nombre, incapable de poser les gestes nécessaires pour rendre leurs textes lisibles, au détriment du nombre de plus en plus grand de personnes qui peuvent recevoir correctement tous les textes accentués? Non. Nous verrons tout de suite que les quatre logiciels de courriers évalués permettent tous une configuration facilitant l’accentuation à l’envoi comme à la réception. De plus, tous les ordinateurs fabriqués depuis vingt-cinq ans sont en mesure de traiter sans perte 8 bits par octet. Il s’agit donc simplement d’une question de configuration pour qu’il n’y ait pas altération du 8e bit.

Nous évaluons quatre logiciels de courriers électroniques de type Internet. Ce sont les logiciels Outlook 97 et Outlook Express de Microsoft Explorer 4, Messenger de Netscape Communicator 4 et Eudora Pro (version 3.0.1) de Qualcomm. Nous étudierons plus tard des logiciels comme Lotus CC : Mail en même temps que les collecticiels.

Nous avons configuré ces logiciels en mode SMTP-POP3, ce qui est sans doute la configuration la plus populaire chez la majorité des utilisateurs de courrier électronique dans Internet.Haut de page

Les logiciels de courrier électronique ne sont pas des applications complexes. Lorsque configurés correctement, Ils ont l'avantage d’être utilisables rapidement et ce, même si, dans la plupart des cas, peu de gens utilisent l’ensemble des fonctionnalités fournies dans ce genre de logiciel (gestion de listes, tri, etc.). Ces logiciels s’insèrent facilement dans la vie quotidienne du travail. La terminologie courante du bureau y est utilisée par analogie (entrée, sortie, corbeille, poubelle, etc.). Un des pionniers du courrier électronique, Eudora, fut peut-être le premier logiciel à favoriser une interface vraiment visuelle et le premier, aussi, à être traduit en français grâce à des initiatives individuelles. Au contraire des navigateurs, on ne peut parler de duopole ici. Toutefois, il est évident que l’intégration de cette fonction aux deux logiciels majeurs de navigation a diminué la part de marché des courriers autonomes. D’ailleurs, comme pour les navigateurs, leur gratuité (téléchargement) ou leur intégration à l’intérieur de diverses suites d’applications générales, entre autres, rendent leur diversification probable. Cela est à l’avantage des utilisateurs et exige de tous les concepteurs touchés une approche de plus en plus commune.

Les logiciels de courrier ont une forte incidence d’un point de vue techno-linguistique. La problématique des accents et des signes diacritiques est extrêmement importante.

Qu’en est-il donc de la place du français dans ces logiciels en 1998? On peut dire que tous les logiciels d’importance sont offerts en français ce qui, en soi, indique que l’encodage comme le décodage sont en bonne voie de trouver une solution. Le multilinguisme, qui nous semble à la base même de ce que devrait être la philosophie du courrier électronique, est maintenant une réalité à laquelle seuls quelques uns n’ont pas pu encore s’adapter. Les messages peuvent provenir de partout dans toutes les langues.

PROFIL LINGUISTIQUEHaut de page

Les produits qui s’affirment le plus sur le plan de la francisation sont les deux produits de Microsoft. Outlook 97 est l’évolution récente du logiciel client Exchange alors que Outlook Express a pour origine le logiciel Internet mail qui accompagnait Internet Explorer version 3.x. En ce qui a trait aux deux autres produits, toujours dans le cadre du profil linguistique, Messenger s’avère supérieur à Eudora. Un simple regard sur la boîte d'emballage de ce dernier produit nous fait voir des fautes facilement évitables.

Dans un autre ordre d’idées, nous remarquons (est-ce à cause, dans certains cas, des fonctions de raccourcis de clavier?), que les majuscules dans les menus ne sont jamais accentuées, peu importe le logiciel considéré. Les logiciels de courrier ne font pas exception.

À l’exception de Outlook 97 et de Outlook Express, les dossiers virtuels des messages créés par les autres logiciels sont en anglais. Si l’on considère le fonctionnement du logiciel, on peut apprécier les efforts que font Microsoft et Netscape pour traduire en français les en-têtes du courrier (To, From, etc.). Ces deux fabricants font la preuve que la traduction, ou l'adaptation locale de l’en-tête est faisable, et ce sans aucun risque d'incompatibilité! Nous donnons ici un exemple tiré de Netscape.Haut de page

On aurait apprécié que Qualcomm, concepteur de Eudora,   fasse de même puisque les en-têtes sont, en effet, très visibles.Haut de page

CRITÈRES TECHNOLINGUISTIQUESHaut de page

On ne remarque aucun problème de saisie du jeu de caractères ISO/CEI 8859-1 pour les quatre logiciels. Par contre, ANSI 1252, jeu de caractères disponible dans l’environnement WINDOWS et qui est une extension de la norme ISO/CEI 8859-1, permet également la saisie des digrammes o dans e. À la réception, la ligature o e peut, dans les environnements non-WINDOWS, ne pas être restituée normalement. Cela est, pour l'instant, prévisible car ce caractère ne fait pas partie de l’ISO/CEI 8859-1 (bien qu'il s'agisse d'une erreur historique reconnue par l'ISO et sur le point d'être corrigée). Elle le sera peut-être dans le prochain jeu 8859-15. Nous en reparlerons bientôt.

Il n'existe pas encore de méthode commercialement répandue permettant la saisie selon UNICODE. Par contre,  nous le soulignons tout de suite, le courrier électronique de Netscape, Messenger, est le seul qui à la réception, est en mesure actuellement de prévoir le décodage en UNICODE.

À l’heure actuelle, tous les en-têtes sont libellés en anglais pendant leur voyage cybernétique. En ce qui a trait à celles des messages, elles sont affichées en anglais dans Eudora Pro. Dans les autres logiciels, il y a affichage d’une portion minimale des en-têtes les plus courants au moyen d’une traduction en français de ces derniers. En conséquence, si tout n’est pas en français, au moins une partie très visible l’est.

La dernière version d’Eudora Pro n’a pas corrigé un problème évident de la version antérieure. Quand le dernier caractère de l'objet comporte un signe diacritique, ce caractère n’est pas affiché. Par contre, à l’affichage du message lui-même, ce caractère est conservé intégralement. Le concepteur en a été avisé.

Nous remarquons également que Outlook 97, contrairement aux trois autres logiciels, ne permet pas d’envoyer en MIME 8 bits. Cela aussi est une faiblesse à corriger. Mentionnons aussi que Messenger, dans la rubrique « objet » du message fait apparaître une abréviation FWD lors du transfert d’un message.Haut de page

Les accusés de réception peuvent aussi poser certains problèmes. Ils relèvent de serveurs, et certains d’entre eux n’en envoient même pas. Les courriers électroniques envoyés par les serveurs de messagerie sont généralement en anglais, mais ils sont de plus en plus configurables.

Fait intéressant, autant Outlook Express que Messenger peuvent maintenant recevoir et transmettre en HTML, ce qui ouvre de nouvelles voies pour la prise en compte du français.

L’impression ne pose aucune difficulté pour aucun des logiciels. Cependant, lorsque nous avons étudié l’ensemble des menus et sous-menus, nous avons remarqué que la fonction de visualisation avant impression de Eudora était demeurée en anglais. Il s’agit là d’un des manques d’attention de l’entreprise dans son effort, par ailleurs visible, de traduire correctement le logiciel.

Les deux logiciels de Microsoft permettent une recherche qui ne tient pas compte de l’accentuation. Ainsi, ils rechercheraient indistinctement « chante » et « chanté ». Nous avons effectué différentes recherches dans le corps et les en-têtes du texte. Messenger et Eudora permettent une recherche précise (ex. : si l'on cherche « élève », la fonction ne permet pas de trouver « élevé » ou « eleve »).

Outlook Express et Outlook 97 utilisent le tri du système d’exploitation Windows, ce qui permet un tri acceptable, par exemple, des entêtes de message. Les deux autres logiciels, Messenger et Eudora, affichent tous deux un tri inacceptable. Le tri se fait selon l'ordre des valeurs numériques des caractères. En conséquence, les caractères accentués se trouvent après la lettre z.Haut de page

Les quatre logiciels répondent correctement aux caractéristiques socioculturelles minimales qu’on attend d’un logiciel de courrier électronique : l’indication correcte des dates et des heures. L’affichage et l’impression correcte des dates et des heures dépendent généralement de la configuration du système d’exploitation (ex. : dans Windows 95, il faut aller vérifier les Paramètres régionaux du Panneau de configuration).

QUALITÉ LINGUISTIQUE GÉNÉRALE

La qualité linguistique des quatre produits est plus qu’acceptable. L’effort fourni par les trois concepteurs est évident. Les produits téléchargés ont des fonctions d’aide fortement développées, qui montrent la volonté réelle de Microsoft et de Netscape de mettre à la disposition des personnes des outils de courrier où le français n’est pas un parent pauvre, victime de mauvaises traductions. La fonction d’aide peut parfois faire référence à la partie anglaise du site de l’entreprise conceptrice. Microsoft utilise toujours le terme EMAIL pour identifier le courrier électronique. Qualcomm a aussi fourni un effort important. Son guide d’utilisation, comme celui des autres concepteurs d’ailleurs, est entièrement en français. On y trouve peu de fautes. Certains problèmes ont été soulignés au cours de cette évaluation, auxquels Qualcomm pourrait remédier aisément.

Les quatre logiciels dont nous venons de rendre compte sont des logiciels de courrier populaires, utilisés par la plus grande partie de la population branchée et consommatrice de ce genre de logiciel. Nous continuerons à évaluer ces courriers régulièrement parce que ce sont des outils importants de communication dans Internet. On se rappelle sans difficulté les multiples problèmes qu’ont eu les francophones qui voulaient envoyer des messages dans Internet. Ces messages parvenaient à l’autre bout de la chaîne de façon illisible. Encore aujourd’hui cela peut arriver quoique de plus en plus rarement. ESMTP, protocole capable de négocier le 8e bit et SMTP, qui ne le peut pas, cohabitent encore et cohabiteront encore un certain temps. Mais plus les entreprises du Québec et d’ailleurs s’ouvriront à la mondialisation et à l’importance de traiter dans la langue du client, plus s’implanteront des protocoles facilitant le respect des langues. L’utilisation du 8e bit, pour imparfaite que soit cette solution intermédiaire, a résolu le problème de tous les francophones et de bien d’autres locuteurs d’autres langues latines utilisant l'alphabet latin.Haut de page

La succession des RFC (Request For Comments) sur les mêmes sujets montre l’évolution constante des protocoles. Les meilleurs logiciels intègrent ces cheminements, traitent correctement les accents et autres signes diacritiques, offrent les meilleures fonctionnalités et sont souvent aussi les plus sûrs et les plus rapides. Il faut les adopter. Depuis toujours, le français fait partie de la solution parce que les francophones de tous les pays sont curieux et aiment accueillir les nouveautés qui font progresser le monde.

 


Évaluation technolinguistique générale

Eudora Pro 3.0.1 Configuration
Grille d'évaluation

Outlook 97 Configuration 
Grille d'évaluation

Outlook Express 4.72.2106.4 Configuration
Grille d'évaluation

Messenger 4.0 Configuration
Grille d'évaluation

Sources : Guylaine Cloutier, Guy Falardeau, Robert Globensky, Azim Mandjee, Jian Yang. Nous désirons aussi souligner la collaboration d'Alain LaBonté du Secrétariat du Conseil du trésor.
16 juillet 1998

 Accueil | Technologies de l'information | Haut de page

PIF - Produits informatiques en français
Imprimer

Portail du Gouvernement du Québec