Gouvernement du CanadaAgence de santé publique du Canada / Public Health Agency of Canada
   
Sauter toute navigation -touch directe z Sauter au menu vertical -touch directe x Sauter au menu principal -touch directe m  
English Contactez-nous Aide Recherche Site du Canada
Accueil - ASPC Centres Publications Lignes directrices Index A-Z
Santé - enfants Santé - adultes Santé - aînés Surveillance Santé Canada
   

Volume 21, No 4 - 2000

  Office de la santé publique du Canada

Rapport de la situation
Logiciel Orius : calcul des taux et des despréparation de la sortie graphique

Long On, Robert M. Semenciw et Yang Mao


Volume 21, No 3 - 2000



Résumé

Le logiciel Orius produit des statistiques de surveillance des maladies, y compris des données pour le site Web de Santé Canada «Statistiques sur le cancer en direct» et des statistiques sur demande pour le site Web de la North American Association of Central Cancer Registries. Il offre une souplesse pour l’accès aux données, pour le stockage, la modification et la personnalisation de demandes, et pour la production de résultats statistiques et de la sortie graphique. Les résultats comprennent les taux standardisés selon l’âge ou selon l’âge et le sexe, les rapports d’incidence/mortalité standardisés (RIS ou rapports entre le nombre observé et prévu) pour lesquels une région est sélectionnée en option comme point de référence, le nombre d’années potentielles de vie perdues, la variation moyenne annuelle en pourcentage, le rapport Mantel-Haenszel, le rapport de taux de vraisemblance maximale et l’indice comparatif d’incidence.

Mots-clés : logiciel; registre du cancer; statistiques de l’état civil; taux standardisé selon l’âge



Introduction

Le logiciel Orius a été mis au point parce qu’on avait besoin de disposer de statistiques épidémiologiques descriptives et d’une sortie graphique pour l’analyse de la surveillance et les demandes des utilisateurs. À l’heure actuelle, le logiciel est utilisé à l’interne par le personnel de Santé Canada dans des projets de surveillance, y compris la sortie au site Web de Santé Canada «Statistiques sur le cancer en direct», <http://dsol-smed.phac-aspc.gc.ca/dsol-smed/cancer/index_f.html>, et pour la production de statistiques d’incidence du cancer sur demande au site Web de la North American Association of Central Cancer Registries (NAACCR), «CiNA+ Online» <http://www.naaccr.org/CINAPlus/index.html>. Les sources de données courantes portent sur la mortalité, l’incidence du cancer et la morbidité hospitalière.

La souplesse d’accès aux données, de stockage, de modification et de personnalisation des demandes ainsi que de production de résultats statistiques et de la sortie graphique varient selon l’environnement informatique. À l’heure actuelle, la version de bureau fonctionne en mode autonome sur Windows 95/NT ou en mode client/serveur, la composante client se trouvant sur Windows 95/NT et la composante serveur, sur HP-UX (système d’exploitation basé sur UNIX). La version Web tourne sur la plate-forme Windows NT et est compatible avec tout serveur Web soutenant l’interface de passerelle commune, Apache par exemple, et Internet Information Server. Cette version est également offerte pour un environnement multi-plates-formes composé de serveurs Windows NT et UNIX (HP-UX ou Sun Solaris).


Méthodes statistiques

Les statistiques suivantes sont actuellement produites à l’aide du logiciel Orius :

  • Taux standardisés selon l’âge ou selon l’âge et le sexe et rapports d’incidence/mortalité standardisés (RIS ou rapports entre le nombre observé et prévu) pour lesquels une région est sélectionnée en option comme point de référence1,2
  • Nombre d’années potentielles de vie perdue3
  • Variation moyenne annuelle en pourcentage (VMAP)
  • Rapport Mantel-Haenszel et rapport de taux (RT) de vraisemblance maximale, et indice comparatif d’incidence (ICI)4

On peut calculer la VMAP d’après la pente du logarithme des taux, à partir de l’approximation suivante, où y représente le taux annuel et x, l’année :

  log y = a + bx
    log y = exp(a + bx) = exp(a) exp(bx)
    log y est égal environ à exp(a)(1 + bx),
     si ax est inférieur, disons, à 5 %.

Étant donné que l’on utilise le taux logarithmique, les taux zéro sont exclus du calcul de la VMAP. Une table présente le nombre de points disponibles. Bien que la régression de Poisson permette des taux zéro, elle exige la création et l’emploi de taux selon l’âge (ou peut-être des groupes d’âge de 10 ans) lorsque de grandes tranches d’âge sont utilisées, comme tous les âges. Le système n’offre, dans le menu actuel, aucune option à ce sujet. Cependant, le code SAS permet de produire le fichier nécessaire d’après la sortie standard obtenue du logiciel Orius.


Sortie graphique

La version Web produit des statistiques sous forme tabulaire ainsi que des diagrammes à bandes et à secteurs, des graphiques linéaires simples et des cartes choroplèthes. ArcView GIS sert à la génération de ces sorties graphiques. La couleur des catégories des cartes dépend du quintile des taux. À l’heure actuelle, la sortie graphique est fournie à l’utilisateur dans le format de fichier JPEG.


Architecture du système

Le logiciel comprend trois composantes principales. L’application gestionnaire crée la définition des données, qui décrit les ensembles de données disponibles. Un groupe de définition de données est créé pour chaque ensemble de données disponibles.

L’application client (version de bureau) consulte les choix offerts dans le groupe de définition de données et présente ceux-ci à l’utilisateur grâce à un menu à onglets et index. L’utilisateur peut créer, modifier, copier, supprimer et enregistrer à sa guise les sélections de demandes dans la base de données locale stockée sur sa machine. L’application client permet également à l’utilisateur de soumettre la demande à la troisième composante, le SAS, directement (en mode autonome) ou par un point de connexion TCP/IP (en mode client/serveur) afin d’obtenir du SAS le fichier de résultats statistiques et le fichier ASCII d’impression en sortie. Il faut recourir à un serveur SAS de couche médiane pour gérer les connexions et demandes multiples des clients. S’ensuivent l’exécution réelle du SAS et le retour en sortie des résultats au client.

La version Web étend l’architecture existante grâce à l’emploi d’ArcView GIS, afin d’assurer la sortie graphique, suivant les besoins. L’application client de bureau est remplacée par une application client Web, qui interagit avec l’utilisateur par une série de pages HTML générées dynamiquement afin de recueillir l’information relative aux demandes. Ici aussi, il faut recourir à un serveur ArcView de couche médiane pour obtenir les services de sortie graphique au nom du client. Une bibliothèque de formats SAS et/ou de formats offerts par le client fournissent l’information relative aux titres de la sortie à l’impression.

Toutes les composantes, à l’exception du SAS et d’ArcView GIS, sont écrites en VisualAge for Smalltalk. Ce produit est un environnement de mise au point de logiciels orientés objets de qualité industrielle pour multi-plates-formes. L’environnement offre une grande hiérarchie de classes et de nombreux objets réutilisables prêts à l’emploi. Il renferme également un environnement de mise au point intégré qui permet la navigation et l’écriture de méthodes et de classes définies par l’utilisateur, la compilation incrémentielle, l’exécution et la mise à l’essai de programmes, et l’inspection d’objets ainsi qu’un débogueur par points d’arrêt. La gestion du code source et de la configuration ainsi que le soutien de mise au point rapide d’applications dans un contexte d’équipes figurent au nombre des autres caractéristiques intégrées à cet environnement. Les routines statistiques sont écrites dans le langage de programmation du SAS par l’emploi de scripts de macro-instructions. Les routines graphiques sont écrites en Avenue, le langage de script d’ArcView GIS.

Voici la liste des menus :

  1. Plages d’âge
  2. Points milieux d’âge
  3. Populations types
  4. Régions géographiques
  5. Causes
  6. Sexe
  7. Plage d’années
  8. Groupe de population standardisé pour l’âge
  9. Définition des données (à l’aide d’une ou de plusieurs listes des points 1 à 8 ci-dessus)
  10. Groupe de définition des données (à l’aide d’une ou de plusieurs définitions des données précisées au point 9 ci-dessus)

Les fichiers d’aide en ligne de l’application gestionnaire et de l’application client, accessibles à l’aide de programmes de navigation standard, fournissent des renseignements supplémentaires sur les listes, les exigences en matière de fichiers, les sorties et les limites du programme actuel.

Les données nécessaires au calcul des taux sont tirées de tables récapitulatives créées par un programme ou de vues d’une base de données avec un index facultatif. Ces tables, décrites plus loin dans le menu d’aide en direct, renferment les données récapitulatives des résultats selon l’âge, la région, l’année, la cause, le sexe et, en option, la race. Dans le cas des tables SAS, une option d’accès de point direct permet d’accroître l’efficacité de l’extraction5. Les données nécessaires sur les cas et la population sont sélectionnées séparément et récapitulées d’après l’information fournie dans la demande. Les deux fichiers résultants sont fusionnés, les taux sont calculés et les listes ainsi que la sortie graphique sont créées.


Discussion

Le logiciel Orius permet la sortie de demandes typiques en quelques secondes (un peu plus de temps pour la version Web en raison d’un traitement supplémentaire). Dans l’environnement client/serveur de la Agence de santé publique du Canada (de Santé Canada), il n’y a habituellement que quelques utilisateurs simultanés. L’expérience supplémentaire au site Web de la NAACCR indiquera comment le programme agira en présence d’un grand nombre d’utilisateurs simultanés dans un environnement Web. L’emploi de VisualAge for Smalltalk a permis la création d’un programme portatif assurant des communications fiables et transparentes pour l’utilisateur en mode client/serveur. Les analystes peuvent accéder au code du SAS pour satisfaire à des exigences supplémentaires. Il est possible d’ajouter, à la version client/serveur actuelle, les sorties graphiques qu’offre la version Web, mais aucun développement n’est prévu en ce sens. Cet ajout serait particulièrement utile si les résultats pouvaient également être versés dans le modèle d’un programme graphique courant afin de permettre aux utilisateurs d’apporter des modifications supplémentaires, suivant les besoins.


Remerciements

Les noms ci-dessous sont les marques déposées des entreprises indiquées.


Apache The Apache Software Foundation
ArcView GIS Environmental Systems Research Institute, Inc.
HP-UX Hewlett-Packard Company
Oracle Oracle Corporation
SAS SAS Institute Inc.
Sun Solaris Sun Microsystems, Inc.
UNIX UNIX Systems Labs Inc.
VisualAge for Smalltalk IBM Corporation
Windows, Windows 95, Windows NT, et Internet Information Server Microsoft Corporation

   

Références

1. Breslow N, Day N. Statistical methods in cancer research. Volume 2: The design and analysis of cohort studies. Lyon: International Agency for Research on Cancer;1987:48S81; IARC Sci Publ No 82.

2. Ury HK, Wiggins AD. Another shortcut method for calculating the confidence interval of a Poisson variable (or of a standardized mortality ratio). Am J Epidemiol 1985;122:197S8.

3. Romeder JM, McWhinnie JR. Potential years of life lost between ages 1 and 70: an indicator of premature mortality for health planning. Int J Epidemiol 1977;6:143S51.

4. Ferlay J, Black RJ, Whelan SL, Parkin DM. CI5VII electronic database of cancer incidence in five continents, volume 7. Lyon: International Agency for Research on Cancer; 1997; IARC CancerBase No 2.

5. Howard N, Pickle LW. Efficient data retrieval: direct access using the point option. In: Proceedings of the Ninth Annual SAS Users Group International Conference; 1984 mars; Tallahassee (Floride). Cary (NC): SAS Institute, 1984:294S8.



Références des auteurs

Long On, Robert M. Semenciw et Yang Mao, Bureau du cancer, Centre de prévention et de contrôle des maladies chroniques, Direction générale de la santé de la population et de la santé publique,  Santé Canada

Correspondance : Robert Semenciw, Bureau du cancer, ASPC, Santé Canada, pré Tunney, Indice de l’adresse : 0602C3, Ottawa (Ontario)   K1A 0L2; Téléc : (613) 941-2057; Courriel : Robert_Semenciw@hc-sc.gc.ca

[Précédente][Table des matières] [Prochaine]

Dernière mise à jour : 2002-10-02 début