Table des matières >

Les statistiques : le pouvoir des données!

Glossaire

Les définitions qui suivent visent à renseigner ceux qui ont des questions concernant les statistiques, mais qui n'ont pas besoin d'une définition hautement technique.

Nos définitions représentent parfois une grande simplification de notions très complexes. Pour obtenir une définition plus technique d'un terme, vous n'avez qu'à cliquer sur la liste de dictionnaires et définitions de Statistique Canada.

A - B - C - D - E - F - G - H - I - J - K - L - M
N - O - P - Q - R - S - T - U - V - W - X - Y - Z

A Haut
Accessibilité

L'accessibilité reflète la disponibilité de l'information détenue par l'organisme. Elle tient compte de la pertinence du format dans lequel est offerte l'information, du support de diffusion, de la disponibilité des métadonnées (texte descriptif) et du fait que l'utilisateur doit savoir que cette information existe et connaître la façon de l'obtenir. Pour les utilisateurs, le coût d'achat de cette information par rapport à la valeur qu'ils y accordent constitue aussi un aspect de cette caractéristique.

Actualité

L'actualité de l'information reflète l'intervalle entre la disponibilité de l'information et l'événement ou le phénomène décrit. Nous devons la considérer dans le contexte d'une période de temps qui confère toute sa valeur à l'information et qui permet d'y intervenir. En général, l'actualité peut influer sur la fiabilité de l'information.

Analyse fonctionnelle
Activité consistant à décomposer un problème de traitement de données en éléments fonctionnels afin de juger de la meilleure méthode de solution. Il s'agit d'un diagramme destiné à représenter la structure par âge d'une population.
Arrondissement aléatoire Méthode par laquelle tous les chiffres d'un tableau, y compris les totaux, sont arrondis de façon aléatoire (vers le haut ou vers le bas) à un multiple de 5 ou parfois à un multiple de 10. Cette technique protège contre la divulgation directe, résiduelle ou négative des données réelles, tout en préservant au maximum l'utilité des données.
Asymétrique Distribution asymétrique des valeurs des données. Les valeurs situées d'un côté de la courbe de distribution ont tendance à s'éloigner davantage du « milieu » que les valeurs situées de l'autre côté.
Axe des X Ligne numérique horizontale dans le plan à coordonnées cartésiennes.
Axe des Y Ligne numérique verticale dans le plan à coordonnées cartésiennes.
B Haut
Baby-boomer De façon générale, il s'agit d'une personne née après la Deuxième Guerre mondiale, entre les années 1946 et 1966.
Balance des paiements La balance des paiements retrace l'ensemble des transactions économiques entre les résidents du Canada et les non-résidents. Elle comprend le compte courant et le compte capital et financier. Source : Le Quotidien-Le vendredi 28 mai 2004

Base de sondage

Liste, carte ou caractérisation théorique des unités de la population visée par une enquête; c'est le moyen par lequel on sélectionnera les répondants. Il peut s'agir par exemple d'un annuaire téléphonique ou d'un répertoire de la ville, de la liste des membres d'une association ou d'un groupement en particulier.
Base de données  Liste structurée et ordonnée de fait ou de renseignements qui est habituellement produite par ordinateur.
Biais

Dans l'estimation de la valeur d'un paramètre d'une répartition de probabilités, c'est la différence entre la valeur prévue et la valeur réelle du paramètre.

C Haut
Caractéristique  Propriété servant à différencier les individus d'une population donnée. La différenciation entre individus peut être soit qualitative, soit quantitative.
Centiles Valeurs qui divisent un ensemble d'observations en 100 parties égales.
Classification Représentation d'une population donnée organisée en catégories homogènes.
Codage Procédé servant à convertir en nombres ou en symboles l'information incluse dans un questionnaire afin de faciliter les opérations subséquentes de traitement des données. Cela demande parfois d'interpréter des réponses et de les classer dans des résultats prédéterminés.

Codage de données

Il peut arriver que des données brutes enregistrées dans un ordinateur doivent être codées. À cette fin, on étiquette chacun des éléments de données à l'aide d'un code abrégé (habituellement numérique) afin de faciliter la manipulation des données.
Coefficient de corrélation Indice montrant dans quelle mesure deux variables fluctuent de façon interdépendante.
Coefficient de détermination Permet de déterminer dans quelle mesure la variabilité d'une variable donnée dépend de sa relation avec une autre variable donnée. Pour calculer le coefficient, on élève au carré la valeur de la corrélation linéaire, r. Dans un modèle linéaire par exemple, une corrélation de 0,80 (r = 0,80) signifierait que r², le coefficient de détermination, équivaudrait à 0,64. En conséquence, il serait possible de prédire 64 % de la variabilité des valeurs Y en se fondant sur la relation avec les valeurs X.
Coefficient de variation Mesure de la dispersion calculée en divisant l'écart-type d'une distribution par sa moyenne. Erreur-type d'une estimation, exprimée sous forme de ratio ou de pourcentage de l'estimation.
Cohérence

Degré selon lequel les données et l'information d'un seul programme statistique sont regroupées avec d'autres données pour former un ensemble logique et complet. Des données entièrement cohérentes présentent une uniformité logique — à l'interne, au fil du temps et d'un produit ou d'un programme à l'autre. Le cas échéant, les concepts et les populations cibles utilisés ou présentés font l'objet d'une distinction logique par rapport aux concepts et aux populations cibles semblables ou aux notions et à la terminologie courantes.

Cold deck

Méthode qui repose sur un jeu fixe de valeurs, qui couvre tous les éléments de données. Ces valeurs peuvent découler de données historiques, de l'expertise de la spécialité, etc. Un questionnaire « parfait » est créé pour répondre aux besoins complets ou partiels de l'imputation.

Compte capital et financier

Le compte capital et financier porte principalement sur les transactions reliées à des instruments financiers. L'actif et le passif financiers découlant des transactions avec les non-résidents sont présentés selon trois catégories fonctionnelles : les investissements directs, les investissements de portefeuille et tous les autres types d'investissement. Ces investissements appartiennent soit à des résidents canadiens (actif du Canada), soit à des étrangers (passif du Canada). Les transactions sont dites positives si elles représentent une entrée de capital et négatives si elles représentent une sortie de capital du Canada.
Source : Le Quotidien-Le vendredi 28 mai 2004

Compte courant Le compte courant couvre les transactions sur les biens, les services, les revenus découlant de placements, et les transferts courants. Les transactions tels les exportations et les revenus d'intérêt correspondent à des recettes alors que les importations et les versements d'intérêt correspondent à des paiements. Le solde de ces transactions détermine si le Canada enregistre un surplus ou un déficit au compte courant.
Source : Le Quotidien-Le vendredi 28 mai 2004
Confidentialité  Dans une enquête confidentielle, le caractère privé des renseignements fournis par les différents répondants est protégé, de sorte qu'il est impossible de déduire ces renseignements personnels des résultats publiés.
Conjoints de fait  Deux personnes de sexe opposé ou de même sexe qui vivent ensemble en tant que couple, sans être légalement mariées l'une à l'autre.
Connaissance des langues officielles  Capacité de converser en français ou en anglais seulement, à la fois en français et en anglais ou dans une langue autre que les langues officielles du Canada.
Contrôle de la qualité Ensemble des opérations visant à garantir que les erreurs introduites au cours de l'enquête n'excéderont pas les niveaux déterminés.
Corrélation directe Dans une corrélation directe, les deux variables ont tendance à suivre la même direction. Quand l'une des variables augmente, l'autre augmente aussi.
Corrélation linéaire Détermine dans quelle mesure des points de données correspondent à une ligne droite. Quand tous les points se trouvent sur la ligne, on parle de corrélation parfaite. Quand les points sont dispersés dans tout le diagramme, il n'y pas de corrélation.
Corrélation négative Dans une corrélation négative, les deux variables tendent à aller dans des directions opposées. À mesure qu'une variable augmente, l'autre diminue. On peut donc aussi parler de relation inverse.

Corrélation positive

Dans une corrélation positive, les deux variables tendent à aller dans la même direction. Lorsqu'une variable augmente, l'autre aussi augmente.

D Haut

Décennal

Qui a lieu tous les 10 ans.
Désaisonnali-sation Technique statistique utilisée pour retirer des données l'effet des fluctuations saisonnières normales, afin de mieux faire ressortir les tendances sous-jacentes. Les statistiques économiques soumises à une influence saisonnière sont parfois présentées sans tenir compte de cette influence. L'effet calculé des saisons est éliminé de ces données.
Diagramme en arborescence Diagramme à ramifications montrant toutes les combinaisons ou tous les résultats possibles.
Dispersion Décrit dans quelle mesure les observations divergent autour de la tendance centrale.
Distribution de fréquences diagramme ou tableau montrant avec quelle fréquence chaque valeur ou chaque série de valeurs d'une variable apparaît dans un ensemble de données.
Distribution de fréquences groupées Relation entre les valeurs d'une caractéristique et leurs fréquences, lorsque ces valeurs sont groupées en intervalles de classe.
Distribution de fréquences non groupées Distribution de fréquences de données numériques où les données brutes ne sont pas groupées.

Distribution normale Souvent appelée simplement « courbe en cloche » ou « courbe en forme de cloche ». La plupart des résultats de ce diagramme sont groupés au centre. La moyenne, la médiane et le mode sont égaux et les résultats situés à chaque extrémité de la distribution sont moins fréquents. Par exemple, dans une courbe représentant les résultats d'un test d'intelligence, la plupart des personnes se trouvent au centre ou autour de l'intervalle d'intelligence « moyen », tandis que le nombre de personnes diminue des deux côtés à mesure que les résultats s'éloignent de la moyenne, d'où la forme et le nom de la courbe.
Dollars constants Dollars d'une année de référence précise, non indexés en fonction de l'inflation ou de la déflation, de façon à montrer les changements du pouvoir d'achat du dollar (voir aussi « Dollars courants »). L'année de référence doit toujours être indiquée.
Dollars courants  Dollars qui expriment le coût d'articles en fonction de l'année où ceux-ci sont achetés. Il est à noter que les « dollars courants » sont aussi nommés « dollars de l'année budgétaire », par opposition aux « dollars constants ».
Données Faits ou chiffres à partir desquelles on tire des conclusions.
Données brutes Information qui n'a pas encore été organisée, mise en forme ou analysée.
Données catégoriques Données qui peuvent être groupées en catégories spécifiques (aussi nommées « variables qualitatives »). Les variables catégoriques peuvent être associées à des catégories qui suivent un ordre naturel (variables ordinales) ou qui ne suivent pas d'ordre naturel (variables nominales). Par exemple, la variable « hauteur » est ordinale parce qu'elle contient les catégories « petit  », « moyen » et « grand » qui suivent naturellement un ordre ascendant. Au contraire, des variables comme « sexe » et « couleur des cheveux », qui ne contiennent pas de catégories naturellement ordonnées, sont des exemples de variables nominales.
Données élémentaires (éléments d'information) Le plus petit élément d'information qu'on puisse obtenir par une enquête ou un recensement.
E Haut
Écart interquartile Voir Intervalle interquartile.
Écart semi-quartile Voir Intervalle semi-quartile.
Écart-type

Racine carrée de la variance, l'écart-type mesure l'étalement ou la dispersion par rapport à la moyenne d'un ensemble de données. C'est la mesure de l'étalement la plus utilisée.

Échantillon non aléatoire Voir Échantillonnage non probabiliste.
Échantillonnage à participation volontaire Échantillons formés de personnes qui ont offert bénévolement leurs services en sachant que le processus serait long ou exigeant, et parfois même désagréable. On a souvent constaté que ces bénévoles ont une attitude favorable ou tout au moins neutre, alors que la population en général a tendance à manifester des attitudes plus diverses au sujet des questions concernées.
Échantillonnage à plusieurs degrés Activité par laquelle on prélève un échantillon en deux ou trois étapes. Il y a dans ce cas une hiérarchie de types d'unités où chaque unité de premier degré pourrait se décomposer en unités de deuxième degré, et ainsi de suite.
Échantillonnage aléatoire

Voir Échantillonnage probabiliste.

Échantillonnage aléatoire simple Échantillonnage probabiliste de base où chaque échantillon a des probabilités égales d'être tirée.
Échantillonnage à l'aveuglette On procède à un tel échantillonnage au hasard par commodité ou disponibilité.
Échantillonnage au jugé
(par choix raisonné)
Activité d'échantillonnage reposant sur l'hypothèse selon laquelle la compétence et le jugement personnels peuvent permettre une sélection d'unités typiques ou représentatives de la population cible.
Échantillonnage non probabiliste Échantillon sélectionné par une méthode non probabiliste. Par exemple, un schéma dans lequel les unités sont choisies dans un but précis, donnerait un échantillon non aléatoire.
Échantillonnage par participation volontaire On forme des échantillons avec des gens qui ont offert leurs services en sachant que l'exercice serait long ou exigeant et deviendrait peut-être même désagréable. On a souvent constaté que ces bénévoles avaient des attitudes sinon favorables, du moins neutres, alors que la population en général avait tendance à varier plus largement dans ses attitudes à l'égard des sujets d'intérêt.
Échantillonnage par quotas Activité où le nombre de répondants appartenant à une catégorie (parmi plusieurs) est établi d'avance et où la sélection finale des répondants est confiée à l'intervieweur qui échantillonne jusqu'à ce que toutes les unités de chaque catégorie soient réunies.
Échantillonnage probabiliste Méthode d'échantillonnage où chaque membre de la population a une chance d'être sélectionné. On le nomme aussi « échantillonnage aléatoire » en raison de la manière aléatoire dont les personnes sont choisies afin de garantir une représentation sans biais de l'ensemble de la population.
Échantillonnage stratifié Procédé d'échantillonnage où la population se répartit en sous-groupes homogènes ou en strates et où le tirage d'échantillons est indépendant dans chaque strate.
Échantillonnage systématique Sélection d'unités dans une liste à l'aide d'un intervalle de sélection (k), de façon à ce que chaque élément de la liste touché par l'intervalle k soit inclus dans l'échantillon, l'origine ayant été choisie au hasard entre 1 et k. Si par exemple k était égal à 6 et si l'origine choisie au hasard était 2, l'échantillon serait 2, 8, 14, 20, etc.
Échelle Ligne graduée divisée en valeurs successives, pouvant être diagramme, descriptive ou numérique, utilisée pour rendre compte d'évaluations. Dans les diagrammes, l'échelle est la subdivision de chaque axe. L'échelle peut être numérique ou catégorique.
Effectif Voir fréquence.
Enquête Collecte de données sur des caractéristiques d'intérêt d'une partie ou de la totalité des unités d'une population à l'aide de concepts, de méthodes et de procédures bien définis. Elle est suivie d'un exercice de rassemblement permettant de présenter les données recueillies sous une forme récapitulative utile.
Enquêtes par sondage Collecte d'information auprès d'une partie seulement de la population.
Enquêtes polyvalentes Enquêtes dont les objectifs prévoient une mesure d'un grand nombre de caractéristiques. Par exemple, une enquête sur les dépenses agricoles pourrait viser à établir plus que les frais totaux d'exploitation agricole et vouloir en particulier découvrir ce qu'il en coûte au total pour les instruments aratoires, les salaires, les emprunts, les semences, l'alimentation des animaux, etc.
Enregistrement magnétique Enregistrement qui permet la lecture et l'écriture. Cette méthode est utilisée lorsqu'il importe de garantir la sécurité des données. L'application la plus répandue de ce type de saisie est la lecture du NIP des cartes bancaires.
Ensemble de données Tout groupe de données ayant un thème commun ou des caractéristiques semblables.
Entrée de données Procédé (numérisation, inscription sur papier, bandes magnétiques, fiches, etc.) utilisé pour relever la saisie des données.
Équation de régression

Équation qui permet de prévoir une variable inconnue en utilisant la valeur donnée d'une ou de plusieurs autres variables. Par exemple, l'équation Y = a + b X donne la valeur estimative de Y, si la valeur de X est connue. (Voir aussi Régression et Modèle de régression).

Erreur aléatoire Erreurs imprévisibles dans une estimation. Ces erreurs ont tendance à s'annuler dans un grand échantillon, contrairement aux erreurs systématiques qui vont toutes dans la même direction.
Erreur d'échantillonnage Erreur qui se produit lorsque les données sont recueillies auprès d'une partie seulement de la population. Elle est habituellement mesurable par les données de l'échantillon en cas d'échantillonnage probabiliste.
Erreur de non-réponse Erreur causée par l'absence d'interview ou de non-réponse à une question d'un questionnaire.
Erreur non due à l'échantillonnage Erreur causée par des facteurs autres que l'échantillonnage (des erreurs de couverture, des erreurs de réponse, des erreurs de non-réponse, des questionnaires erronés, ainsi que des erreurs de consignation par les intervieweurs, de traitement, etc.).
Erreur de réponse  Différence entre la vraie réponse à une question et la réponse donnée par le répondant; elle peut être imputable au répondant, à l'intervieweur, au questionnaire, au procédé d'enquête ou à l'interaction entre le répondant et l'intervieweur.
Erreur de traitement Erreur qui se glisse dans un exercice de transformation des données de questionnaires, de listes de contrôle, etc. en des ensembles de totalisations et d'estimations.
Estimation Fait de tirer des conclusions plus vastes d'un échantillon afin de prédire certaines caractéristiques ou tendances de l'ensemble de la population.
État matrimonial de droit (conjoints de droit) Représente l'état de personnes mariées devant la loi (et non séparées), de personnes séparées (mais toujours mariées devant la loi), de personnes divorcées, de veufs ou de veuves et de célibataires (personnes jamais mariées).
Étendue Voir Fourchette.
Exactitude Mesure dans laquelle les résultats d'un calcul ou de la lecture d'un instrument traduisent les quantités réelles qui font l'objet de ce calcul ou de cette lecture et sont exempts d'erreurs. (Voir aussi Précision)
Exclusif Lorsqu'un événement exclut automatiquement la possibilité qu'un second événement se produise au même moment, les résultats sont exclusifs. Par exemple, rond et carré sont des termes exclusifs, puisqu'un objet ne peut pas avoir ces deux formes au même moment.
Exhaustif Quand un ensemble d'événements inclut toutes les occurrences possibles d'un ensemble de références, les résultats sont exhaustifs. Par exemple, la liste de groupes d'âge 0-19, 20-34, 35-59 et 60 ans et plus est exhaustive, parce qu'elle couvre l'éventail des âges que peuvent avoir les membres de la population.
F Haut
Fluctuation d'échantillonnage Fait qu'une statistique prend des valeurs différentes pour des échantillons différents. Elle indique donc dans quelle mesure la valeur de la statistique fluctue d'un échantillon à l'autre.
Formule Équation ou règle mathématique.
Fourchette Tout l'intervalle de variation numérique des résultats. La fourchette exclusive est la différence entre la valeur la plus élevée et la valeur la moins élevée d'un ensemble de données, et la fourchette inclusive, la différence entre la limite supérieure réelle de l'intervalle le plus long et la limite inférieure réelle de l'intervalle le plus court.
Fréquence Nombre de fois qu'un événement se produit ou qu'un élément se présente dans un ensemble de données.
Fréquence cumulée Détermine le nombre d'observations sous-jacent à une valeur particulière. On la calcule en ajoutant chaque fréquence à la somme de ses prédécesseurs dans un diagramme arborescent et un tableau de distribution de fréquences.
Fréquence en pourcentage Fréquence de chaque valeur ou de chaque intervalle de classe, exprimée sous forme de pourcentage du nombre total d'observations. Obtenue en multipliant chacune des valeurs de la fréquence relative par 100.
Fréquence relative Fréquence d'une valeur ou d'un intervalle de classe, exprimée en tant que proportion d'un tout et observée dans un ensemble de données pour une variable particulière. On la calcule en divisant la fréquence par le nombre d'observations.
Fréquentation scolaire Fréquentation à temps plein ou à temps partiel (de jour ou de soir) d'une école, d'un collège ou d'une université pendant les huit mois compris entre les mois de septembre et de mai (jour du recensement). Cette fréquentation se mesure uniquement par rapport aux études menant à un certificat, à un diplôme ou à un grade.
G Haut

Diagramme

Représentation graphique de données (p.ex. diagramme à barres, diagramme linéaire, diagramme circulaire, histogramme, diagramme figuratif).
Graphique
(diagramme)
arborescent
Voir tracés en arborescence.
Diagramme Il s'agit d'un diagramme à colonnes. Voir diagramme à barres. Exemple
Diagramme (diagramme) à barres Diagramme qui compare des barres de même largeur, mais de hauteur différente, conformément aux statistiques ou aux données qu'elles représentent. Les grahiques à barres sont horizontales. Un diagramme à barres présenté de façon verticale s'appelle « diagramme à colonnes ». Exemple
Diagramme à colonnes Diagramme à barres vertical. Voir diagramme à barres. Example
Diagramme à secteurs Voir diagramme circulaire.
Diagramme par points Diagramme à deux dimensions représentant deux variables sous la forme d'une série de points. Principalement utilisé pour montrer la corrélation entre les deux variables. Exemple
Diagramme figuratif Diagramme de représentation imagée de statistiques (on peut utiliser, par exemple, un billet de 1 dollar en grandeur croissante pour représenter l'augmentation du pouvoir d'achat dans le temps). Exemple
Diagramme circulaire

Diagramme circulaire permettant d'élaborer un concept visuel d'un ensemble donné (100 % = 360 degrés). Le diagramme est divisé en secteurs, chacun correspondant à une catégorie de la variable présentée (p.ex., chaque groupe d'âge). Chaque secteur est proportionnel au pourcentage de la catégorie correspondante. Exemple

Diagramme linéaire

Diagramme où les points successifs représentant les valeurs d'une variable pour certaines valeurs de la variable dépendante sont reliés par des lignes droites (p.ex., le taux de chômage chez les jeunes au cours des 10 dernières années). Exemple

Grappe

Ensemble d'unités d'une population qu'on constitue à l'aide de critères bien définis. Il peut s'agir d'un groupe qui existe dans la population (îlot urbain, hôpital, etc.) ou d'un groupe théorique (aires d'un quadrillage de carte, etc.).

Groupe de discussion

Technique d'interview où l'on interroge les répondants en groupe. Cette technique permet de les amener à parler librement, à exposer leurs idées et à faire spontanément part de leurs attitudes et de leurs sentiments sur une question. On s'en sert souvent pour explorer un éventail de questions avec les réactions des répondants en vue de bien orienter la conception d'un questionnaire.

H Haut

Histogramme

Diagramme formé d'une suite de colonnes avec un intervalle de classe en abscisse et une courbe de fréquences en ordonnée. Exemple

Hot deck

La méthode du hot deck recourt à d'autres enregistrements (donneurs) pour répondre à la question (ou à l'ensemble de questions) qui doit faire l'objet d'une imputation. Le donneur peut être choisi au hasard parmi un groupe de donneurs affichant le même jeu de caractéristiques prédéterminées. Par exemple, dans le cas où un questionnaire serait retourné parce qu'il manquait le revenu dans un enregistrement, nous pourrions regrouper toutes les unités déclarantes de la même province, de la même profession et du même nombre d'années d'expérience. On pourrait ensuite dresser une liste des donneurs qui répondent à ces critères, puis en choisir un au hasard. Le revenu déclaré par cette personne tiendrait lieu de revenu pour la réponse manquante ou invalide.
I Haut

Imputation

Remplacement de données manquantes ou non valides par des données acceptées. Normalement effectuée conformément à des règles de décision préétablies. Elle est souvent combinée à la vérification des données.
Indice Désignation mathématique ou nombre servant à exprimer le niveau de prix, le volume du commerce, le montant relatif, etc. d'une période donnée, comparativement à celui d'une période de base, par exemple, l'indice des prix à la consommation.
Industrie

Groupe de fabricants ou de fournisseurs de services qui ont été rassemblés en fonction de l'homogénéité de leurs produits ou services.

Information

Données qui ont été enregistrées, classées, organisées, raccordées ou interprétées dans un cadre quelconque pour que la signification s'en dégage.

Internet

Réseau informatique mondial reliant des ordinateurs par satellite et par téléphone qui permet aux utilisateurs de se connecter à des réseaux comme le courriel et le W3 (World Wide Web).

Intervalle Ensemble de chiffres se situant entre deux chiffres limites et pouvant comprendre l'un ou l'autre de ces chiffres; ainsi, l'intervalle [1,5;3] comprend tous les chiffres supérieurs ou égaux à 1,5 et inférieurs à 3. Il convient de noter que le chiffre 3 se trouve exclu de cet intervalle.
Intervalle de confiance Estimation utilisant une série de valeurs (un intervalle) pour prédire la valeur probable d'un paramètre inconnu, accompagnée d'un niveau de confiance spécifique, ou probabilité que l'estimation sera exacte (c.-à-d. que l'intervalle contiendra effectivement la valeur vraie du paramètre).
Intervalles de classe Si une variable comporte un grand nombre de valeurs, il est plus facile, pour présenter les données, en groupant les valeurs en intervalles de classe (par exemple, groupes d'âge tels que 0-4, 5-9, 10-14, 15-19, etc. pour rendre compte de l'âge de la population), que de présenter toutes les valeurs séparément. Cela permet de distinguer plus facilement les tendances des données.
Intervalle interquartile Différence entre les quartiles supérieur et inférieur (Q3-Q1) d'un ensemble de données. Cet intervalle sert à mesurer l'étalement des données : il s'étend sur 50 % d'un ensemble de données et élimine l'influence des valeurs aberrantes (suppression des quarts supérieur et inférieur d'un ensemble de données).
Intervalle semi-quartile

Estimé à la moitié de la différence entre le 75e (Q3) et le 25e centile (Q1). La formule est : (Q3-Q1)÷2. Comme la moitié des valeurs se situent entre Q3 et Q1, l'intervalle semi-quartile équivaut à la moitié de la distance nécessaire pour couvrir la moitié des valeurs.

Intranet

Réseau informatique interne privé, l'intranet allie la commodité d'Internet au rendement et à la sécurité d'un système maison. Un intranet peut être relié à Internet au moyen d'une passerelle protégée, munie de pare-feux pour empêcher tout accès extérieur non autorisé aux systèmes internes.

L Haut

Langue maternelle 

Première langue apprise à la maison durant l'enfance et encore comprise par la personne au moment du recensement.
Langue parlée à la maison Langue parlée le plus souvent à la maison par le répondant au moment du recensement.
Lecteur de reconnaissance Connu aussi sous le nom « lecteur de code à barres », cet appareil peut reconnaître des lettres et des chiffres. Ces lecteurs balaient chaque ligne et les convertissent dans le programme.
Logiciel Il y a deux catégories de logiciels : les logiciels de base (qui contrôlent le fonctionnement d'un ordinateur en Windows, DOS, etc.) et les logiciels d'application (Word, EXCEL, MS ACCESS).
M Haut

Manipulation des données

Activité par laquelle on met les données en forme définitive (diagramme, moyennes arithmétiques, données agrégées, etc.).

Marge d'erreur  Nombre relatif qui peut être exprimé sous forme de pourcentage et qui est calculé à l'aide de l'erreur d'échantillonnage d'une estimation. On l'utilise pour établir l'intervalle de confiance de cette estimation.

Médiane

Valeur de l'élément central lorsque les données sont ordonnées de la plus basse à la plus haute; mesure de la tendance centrale. Si le nombre d'observations est pair, la médiane est la moyenne des deux observations centrales. Dans le cas des données brutes, la médiane correspond au point par rapport auquel la moitié exacte des données lui est supérieure et l'autre, inférieure.

Méthode de l'estimateur

Méthode qui recourt à une information tirée d'une autre question ou d'une autre réponse d'un enregistrement qui fera l'objet d'une imputation (du cycle actuel ou d'un cycle antérieur) et, au moyen d'opérations mathématiques, produit une valeur plausible destinée au champ vierge ou erroné.

Méthode de la substitution

Méthode qui repose sur la disponibilité de données comparables. Les données imputées peuvent être extraites de l'enregistrement du répondant obtenu lors d'un cycle antérieur de l'enquête ou d'un autre fichier source (p.ex., fichiers administratifs ou autres fichiers d'enquête du même répondant). Cette méthode est souvent difficile à réaliser parce que, dans de nombreux cas, il n'existe aucune autre information au sujet de ce répondant, à part l'information de l'enquête en cours.
Méthodologie Ensemble de méthodes et de techniques de recherche appliquées à un domaine d'études particulier. À Statistique Canada, le terme « méthodologie » signifie « techniques d'enquête ».
Mode Observation la plus fréquente dans un ensemble de données; il s'agit d'une mesure de la tendance centrale.
Modèle de régression Modèle statistique utilisé pour décrire la relation entre une variable dépendante et une ou plusieurs variables indépendantes. Ces modèles présentent des formes et des degrés de complexité très divers. (Voir aussi Régression et Équation de régression).
Moyenne Mesure la plus courante de la tendance centrale, la moyenne est la moyenne arithmétique d'un ensemble de nombres.
Municipalité dissoute Il est possible que les limites et les noms des subdivisions de recensement fassent l'objet de modifications d'un recensement à l'autre par suite d'annexions, de dissolutions et d'incorporations. Ces changements peuvent résulter en la « dissolution » de différentes subdivisions de recensement. Une subdivision de recensement dissoute est une communauté qui existait le 1er janvier 1996, mais qui n'existait plus le 1er janvier 2001, soit la date de référence géographique du recensement de 2001. Le concept de « Subdivision de recensement - Recensement précédent » a été créé pour permettre la totalisation des données du recensement actuel selon les subdivisions de recensement du recensement précédent (1996). On procède au couplage des îlots du recensement de 2001 avec les subdivisions de recensement du recensement de 1996 selon un « ajustement optimal », afin d'être en mesure de totaliser les données du recensement actuel selon les communautés du recensement précédent.
N Haut

Non-réponse

Situation dans laquelle on ne dispose pas de données sur certaines unités de l'échantillon pour une raison quelconque. Il se peut, par exemple, que le répondant ne soit pas disponible ou qu'il refuse de répondre ou de prendre part à l'interview.
O Haut

Observations

Données recueillies pour une variable quelconque.
Ogive Courbe d'un diagramme de distribution de fréquences. Il est à noter que les courbes de distribution n'ont pas toutes la forme d'une ogive. Il est donc préférable de limiter ce terme à la distribution normale ou quasi normale.
Ordinateur central  Ordinateur offrant des possibilités et des ressources étendues et auquel d'autres ordinateurs peuvent être connectés de manière à partager les ressources.

Ordinateur de milieu de gamme 

Éventail très vaste d'ordinateurs allant des ordinateurs personnels haut de gamme aux ordinateurs centraux. Antérieurement appelés « mini-ordinateurs » et pourvus de terminaux non intelligents connectés à des systèmes centralisés, la plupart des ordinateurs de milieu de gamme sont utilisés aujourd'hui comme serveurs dans un environnement client-serveur.
Ordinateur personnel Micro-ordinateur monoposte à usages multiples, conçu pour être utilisé par une seule personne à la fois.
Origine ethnique Groupes ethniques ou culturels auxquels appartient l'ascendance d'un répondant; par origine ethnique ou culturelle, on entend les « racines » ethniques ou l'ascendance d'une population, terme à ne pas confondre avec les termes citoyenneté et nationalité.
P Haut

Paramètre

Il s'agit de valeurs inconnues quantitatives (p.ex., recettes totales, recettes moyennes, rendement total, nombre de chômeurs) qui concernent toute la population ou certains domaines d'intérêt pour le chercheur.

Pertinence

La pertinence des données ou de l'information statistique constitue une évaluation quantitative de leur valeur inhérente. Cette valeur dépend du degré selon lequel les données et l'information conviennent aux buts de leur production et à l'intérêt qu'y portent les utilisateurs. La valeur dépend aussi du mandat de l'organisme, des exigences imposées par la loi et du coût de substitution de la production de ces données ou de cette information.

Peuples autoch-tones Indiens, Métis ou Inuit (Esquimaux) d'Amérique du Nord.
Plan d'échantillonnage Ensemble de spécifications qui détaillent la population, la base de sondage, les unités d'enquête, la taille de l'échantillon et les méthodes d'échantillonnage et d'estimation.
Polygone de fréquences Diagramme que l'on forme en joignant en leurs points milieux les courbes en colonnes d'un histogramme (Voir aussi Histogramme)
Population Ensemble des unités visées par les résultats de l'enquête (les unités en question sont des personnes, des animaux, des objets, des entreprises, des voyages, etc...)
Population active  Population de 15 ans et plus — à l'exception des pensionnaires d'établissement — qui est présente sur le marché du travail la semaine où tombe le 15e du mois précédant le jour du recensement. On classe les répondants en tant que personnes occupées (ayant un emploi) ou chômeurs. Le reste de la population en âge de travailler est alors considéré comme inactif.
Possibilité d'interprétation  La possibilité d'interprétation reflète la facilité avec laquelle l'utilisateur peut comprendre, utiliser et analyser les données ou l'information. La justesse des définitions des concepts, des populations cibles, des variables et de la terminologie sous-jacente aux données, ainsi que l'information sur toute limitation des données, détermine en grande partie la possibilité d'interprétation.
Pourcentage cumulé Permet de calculer la fréquence cumulée en divisant ce pourcentage par le nombre d'observations et en le multipliant par 100. La dernière valeur est toujours égale à 100 %. Cela facilite la comparaison des données.
Précision La précision est une mesure de la similarité. Le même sondage exécuté plus d'une fois devrait donner les mêmes résultats ou des résultats similaires. Plus les résultats de chaque répétition du sondage se ressemblent, plus ils sont précis.
Programmation  Production d'un jeu d'instructions pour qu'un ordinateur exécute une tâche en particulier.
Pyramide des âges Diagramme qui vise à représenter la structure par selon l'âge et le sexe d'une population. Il est formé de deux histogrammes horizontaux qui sont joints. Exemple
Q Haut
Qualité des données Niveau ou degré de confiance que les données et l'information statistique sont « prêtes à l'emploi ». Les aspects auxquels Statistique Canada doit prêter attention sur le plan de la qualité ou de la capacité d'utilisation sont la pertinence, l'exactitude, l'actualité, l'accessibilité, la possibilité d'interprétation et la cohérence.

Quartiles

Pour déterminer l'intervalle interquartile, on divise l'ensemble de données en quatre parties égales. Chaque valeur marquant un palier est appelée quartile (premier, deuxième, etc.). Le deuxième quartile est aussi appelé la médiane.
Questionnaire Série de questions conçues pour l'obtention de renseignements sur un ou plusieurs sujets auprès d'un répondant.
R Haut
Rang-centile Dans une distribution, proportion de valeurs à laquelle une valeur spécifique est supérieure ou égale. Par exemple, si une personne obtient une note de 95 % à un test de mathématiques et que cette note est supérieure ou égale aux notes obtenues par 88 % des élèves, la personne se trouve dans le 88e centile.
Ratio Rapport proportionnel entre deux quantités ou deux nombres différents ou, en mathématique, quotient de deux nombres ou de deux expressions obtenu en divisant l'un des éléments par l'autre.

Recensement

Collecte de données sur toutes les unités d'une population, ce que l'on appelle parfois « enquête sur échantillon ». (Le terme « Recensement » [avec la majuscule initiale] désigne habituellement le Recensement de la population [à l'échelle nationale].)
Recensement décennal (Canada) Les recensements ont lieu au début de chaque décennie, lors les années se terminant par le chiffre 1. Statistique Canada, par exemple, a effectué des recensements à tous les dix ans, de 1871 à 2001. (Voir aussi Recensement quinquennal)
Recensement quinquennal (Canada) Recensement qui se tient à la mi-décennie dans les années se terminant par le chiffre 6. Par exemple, Statistique Canada a tenu des recensements quinquennaux en 1976, 1986 et 1996. (Voir aussi Recensement décennal)
Région métropolitaine

Statistique Canada a créé des groupements de municipalités, ou subdivisions de recensement, qui englobent le secteur placé sous l'influence d'un grand centre urbain. Le regroupement de ces municipalités étroitement interreliées parce que les habitants travaillent dans une municipalité et résident dans une autre, est régi par des lignes directrices précises. Les unités géographiques qui en résultent sont appelées « régions métropolitaines de recensement ».

Régression Méthode statistique par laquelle on essaie de prévoir la valeur d'une caractéristique en étudiant sa relation avec une ou plusieurs autres caractéristiques. Cette relation s'exprime au moyen d'une équation de régression. (Voir aussi Modèle de régression)
Réseau étendu (RE)

Réseau de communication couvrant un vaste secteur géographique tel qu'une province ou un pays. Il diffère du réseau local (RL) qui se limite à un bâtiment ou à un ensemble de bâtiments, ainsi que du réseau de la région métropolitaine, qui couvre généralement une ville ou une banlieue.

Réseau local (RL)  Réseau de communication desservant les utilisateurs d'un secteur géographique limité. Il se compose de serveurs, de postes de travail, d'un système d'exploitation de réseau et d'un lien de télécommunication.
Révision

Voir révision de données. (Voir aussi imputation)

Révision de données Procédé destiné à garantir que les données d'enquête sont exactes, complètes et uniformes.
S Haut

S

Symbole mathématique de l'écart-type.
Symbole mathématique de la variance.
Saisie des données Procédé consistant à enregistrer des réponses sur un support lisible par machine.
Saisie interactive Procédé souvent désignée saisie intelligente. En général, les données saisies font l'objet d'une vérification avant leur imputation. Toutefois, cette méthode combine la saisie et la vérification en une seule fonction. Bien que la saisie interactive soit plus lente, elle est très efficace lorsqu'il y a une étroite interdépendance entre les questions. Ce processus nécessite une connaissance des procédures de vérification, car il importe de corriger les erreurs sur le champ. La saisie interactive réduit aussi le nombre de documents traités, car les vérifications sont faites directement par ordinateur.
Saisie par lots Procédé qui constitue l'une des plus anciennes méthodes de saisie. Elle recourt à un clavier pour entrer les données. Ce processus convient parfaitement à l'entrée d'une grande quantité de données lorsque la rapidité est une nécessité. Aucune procédure de vérification n'a lieu, mais nous devons placer une bonne part de la confiance dans le programme de vérification. En outre, nous devons mettre en oeuvre des vérifications de la validité et des étendues pour veiller à la qualité de la saisie. Cela ne signifie pas que nous modifions les données, mais si un champ numérique contient plutôt des lettres, l'erreur sera détectée. Cette approche peut être avantageuse dans le cadre de grandes enquêtes comportant de nombreuses questions et vérifications.
Secteur de dénombrement (SD) Région parcourue par un intervieweur dans le cadre du Recensement de la population du Canada. Les SD sont des unités bien définies et facilement reconnaissables sur les cartes et sur le terrain, mais qui sont propres à un recensement.
Lettre sigma du l'alphabétique grec (sigma) Symbole mathématique de sommation de valeurs.
Sous-produit administratif Données disponibles à partir de l'information enregistrée dans les dossiers administratifs, les demandes, les rapports, etc.
Statistique Fonction produisant un résultat numérique dont la valeur peut varier selon les résultats d'une expérience (p.ex., avec des échantillons différents). Exemple : la moyenne ou la médiane d'un échantillon, etc.
Statistiques Type d'information obtenue en soumettant les valeurs numériques à des opérations mathématiques.
Statistiques, études des Domaine d'investigation ayant pour objet la collecte et l'agencement de données, de faits ou de valeurs numériques se rapportant aux affaires humaines ou aux phénomènes naturels.
Statistiques de l'état civil Statistiques sur les naissances, les décès, les mariages, la santé et la maladie.
Statistique inférentielle Méthodes statistiques utilisées pour inférer les valeurs d'une population à partir des valeurs obtenues pour l'échantillon.
Les statistiques : le pouvoir des données! Une ressource de Statistique Canada qui a été élaborée de façon à pouvoir tirer pleinement parti des statistiques.
Stockage de données 1) Capacité d'un ordinateur à emmagasiner de l'information.
2) Il s'agit également d'une fonction informatique de mise en mémoire de l'information sur un support (p.ex., bande magnétique, disquette, CD-ROM, etc.).
T Haut
Tableau de pointage Sert à enregistrer les données d'une expérience, à compter les occurrences d'un événement et à élaborer les tableaux de distribution de fréquences.
Tableau statistique Présentation de données statistiques regroupant les valeurs d'une caractéristique ainsi que le nombre de fois que chaque valeur apparaît dans l'ensemble de données.

Taux d'activité 

Pourcentage de la population âgée de 15 ans et plus.qui fait partie de la population active. Le taux d'activité d'un groupe en particulier (p.ex., celui des femmes de 25 ans et plus) s'exprime en pourcentage de la population totale du groupe en question.
Tendance centrale Mesure de l'emplacement où se trouve le milieu ou le centre d'une distribution. La tendance centrale peut se rapporter à des mesures très diverses comme la moyenne, la médiane et le mode. La moyenne est la mesure de la tendance centrale la plus fréquemment utilisée.
Tracés en arborescence Méthode semi-graphique utilisée pour représenter des données numériques, où le premier chiffre (le plus à gauche) de chaque valeur correspond à la tige, tandis que le reste des chiffres qui composent le nombre sont les feuilles. Un diagramme arborescent montre toutes les valeurs des données d'un ensemble-échantillon.

Traitement des données

Procédé consistant à convertir des données brutes sous une forme lisible par machine, puis à les trier, à les vérifier, à les manipuler et à les présenter de manière à créer de l'information.

U Haut
Unité centrale de traitement L'unité centrale de traitement (UCT) est le cœur d'un système informatique. Elle est assez petite pour tenir dans une main, mais peut contenir des millions de circuits logiques.
Unité d'entrée Organe ou dispositif (bande, carte, clavier, disquette, CD-ROM, photostyle, lecteur optique, caméra numérique, etc.) à partir duquel des données peuvent être introduites dans un ordinateur.
Unités d'enquête

Aux fins du tirage d'un échantillon, la population devrait être divisible sans recoupement en un nombre fini d'unités distinctes et identifiables de sorte que chaque membre de la population ne corresponde qu'à une unité d'échantillonnage.

V Haut
Valeurs aberrantes
Dans un ensemble de données, ce sont les valeurs si éloignées des autres valeurs d'une distribution que leur présence ne saurait être attribuée aux seules probabilités.

Variable

Caractéristique susceptible de prendre plusieurs des valeurs d'un ensemble auquel une mesure numérique peut être appliquée (p.ex., revenu, âge, poids).
Variable continue  Variable numérique qui peut prendre un nombre infini de valeurs réelles. L'âge, la distance et la température par exemple sont considérés comme des variables continues, parce qu'une personne peut parcourir 3 642 531 km à pied.
Variable discrète  Variable numérique qui prend uniquement un nombre limité de valeurs réelles (par ex., X peut seulement être égal à 1, 3, 5 et 1000).

Variable groupée 

Ensemble de données qui a été groupé ou classé en fonction de caractéristiques qualitatives ou quantitatives communes. Exemple

Variable nominale 

Type de variable catégorique qui décrit un nom, une étiquette ou une catégorie sans ordre naturel. Par exemple, la liste des différents types de matières scolaires ne présente pas d'ordre naturel : l' « histoire » ne suit pas nécessairement la « biologie ». Ces matières peuvent être placées dans n'importe quel ordre.
Variable non groupée Ensemble de données qui n'ont pas été groupées, ni classées; il s'agit plutôt d'une liste de valeurs individuelles observées (p.ex., années d'âge).
Variable numérique Variable quantitative qui décrit une valeur mesurée de façon numérique (par ex., âge ou nombre de personnes dans un ménage). Ces variables peuvent être continues ou discrètes.

Variable ordinale 

Type de variable catégorique : une variable ordinale présente un ordre naturel de ses valeurs possibles, mais les distances entre les valeurs ne sont pas définies. Habituellement, les variables ordinales ont des échelles catégoriques. Par exemple, lorsqu'on demande à des personnes de choisir entre « excellent », « bon », « moyen » et « médiocre » pour évaluer quelque chose, la réponse indique seulement une catégorie, mais il existe un ordre naturel de ces catégories.

Variance

Mesure de l'étalement équivalant au carré moyen de l'écart de chaque nombre par rapport à la moyenne d'un ensemble de données. Le terme variance est aussi lié à la variation d'échantillonnage.

Variation d'échantillonnage

Variation qu'accusent des échantillons d'une même population qui sont différents, mais d'une même taille.

Vérification

Activité par laquelle on vérifie les valeurs d'une variable dans tous les enregistrements ou des combinaisons préétablies de zones de tous les enregistrements pour ainsi s'assurer que les valeurs indiquées sont valables (Voir aussi Imputation)
Vérification de la cohérence Activité par laquelle on compare les diverses réponses d'un enregistrement pour en assurer la cohérence l'une par rapport à l'autre. Par exemple, si une personne déclare faire partie du groupe d'âge de 0 à 14 ans et est à la retraite, il existe alors un problème de cohérence entre les deux réponses. La vérification inter-champ constitue une autre forme de vérification de la cohérence. Elle vise à vérifier que, si un chiffre est déclaré dans une section, un chiffre équivalent sera déclaré dans une autre section.
Vérification de la validité

Vérification qui porte sur un champ ou une cellule à la fois. Elle fait en sorte que nous tenions compte des descripteurs d'enregistrement, des caractères et des valeurs invalides; que les champs obligatoires aient été remplis (p.ex., aucun champ de quantité ne demeure vierge si un nombre est requis); que nous ayons bien utilisé les unités de mesure précisées et que le temps de déclaration respecte les limites précisées.

Vérification de l'étendue

Activité qui ressemble à la vérification de la validité, car elle porte aussi sur un champ à la fois. Ce type de vérification a pour but d'assurer que les valeurs, les rapports et les calculs respectent les limites prédéterminées.

Vérification des dédoublements

Activité par laquelle on examine un enregistrement complet à la fois. Elle recherche les dédoublements (c.-à-d. veille à ce que l'enregistrement d'une personne ou d'une chose apparaît une seule fois). Cette vérification recherche aussi si le répondant apparaît plus d'une fois dans l'univers de l'enquête, surtout après la modification du nom. Enfin, elle vérifie aussi si les données ont été entrées une seule fois dans le système.

Vérification des données

Activité par laquelle on s'assure que les données d'enquête sont exactes, exhaustives et cohérentes. (Voir aussi Imputation)
Vérifications diverses

Par vérifications diverses, on entend les dispositions spéciales de déclaration, les vérifications dynamiques propres à l'enquête, les vérifications de la classification appropriée, les modifications apportées aux adresses physiques, aux lieux et aux contacts ainsi que la vérification de la lisibilité, qui permet de s'assurer que les chiffres et les symboles sont reconnaissables.

Vérification historique

Activité par laquelle on compare les réponses des enquêtes régulières à celles des enquêtes précédentes. Par exemple, toute modification importante par rapport à la dernière enquête sera signalée. On compare aussi les rapports et les calculs. Ainsi, tout écart qui ne respecte pas les limites établies est noté et fait l'objet d'une analyse.

Vérification statistique

Vérification qui permet de comparer un ensemble complet de données. Ce type de vérification a lieu seulement après l'exécution de toutes les autres vérifications et la correction subséquente des données. Les données sont compilées et toute valeur extrême, toute donnée suspecte et toute valeur aberrante est rejetée.

X Haut
x avec une barre au-dessous Symbole mathématique de la Moyenne.

Navigation et recherche

Note: Cette page contient plusieurs menus de navigation. Afin d'améliorer leur accessibilité, la plupart sont regroupés dans cette section. Cette section offre aussi l'accès au moteur de recherche.

Pour de plus amples renseignements sur les éléments accessibles de notre site, veuillez consulter notre page sur l'accessibilité.

Menu de navigation de la page

  1. Contenu de la page
  2. Menu de navigation du site
  3. Menus de fonctions utilitaires du site
  4. Recherche du site
  5. Avis importants
  6. Haut de la page
  7. Date de modification