Le vocabulaire statistique
Enregistrer ce coursStatistique descriptive : Ensemble des techniques du statisticien pour décrire, numériquement, les populations.
Population et individus : La population est l’ensemble des individus (ou unités statistiques) auxquels on décide de sintériser. Sa taille, habituellement désignée par N, est grande, ou même infinie. Le choix de la population étudiée dépend du problème qui est à l’origine de la démarche statistique, et de la façon dont on décide de le traiter.
Variable (ou caractère) statistique, valeurs : Une variable est une information dont on recueille (ou observe ou mesure) la valeur sur chaque individu. On parle de variable parce que la valeur de l’information n’est pas la même d’un individu à l’autre. C’est à partir des valeurs observées que le statisticien construit ses classements d’individus.
Effectif : Nombre d’individus, d’une population ou d’une partie quelconque de cette population.
Fréquence (ou proportion) : Rapport d’un effectif particulier d’individus à la taille de la population. (Excel confond parfois fréquence et effectif).
Recensement : Recueil des valeurs de la totalité des individus de la population. Les valeurs recueillies sont les données.
Sondage, n-échantillon, base de sondage, taux de sondage : Un sondage est le recueil des valeurs d’une partie (l’échantillon) d’effectif n (d’où l’expression n-échantillon) de la population (dite base de sondage). Le taux de sondage est le rapport n/N.
Variable, (ou caractère) qualitatif (ou nominal) : Variable dont les valeurs (ou modalités) observées sont telles qu’il est impossible d’attribuer une valeur unique à la réunion de deux (ou plusieurs) individus par une opération mathématique sur leurs valeurs. Exemple du "statut matrimonial". Les valeurs observées peuvent néanmoins être numériques.
Variable, ou caractère ordinal : Variable qualitative dont on peut tout de même comparer les modalités entre elles, et, par conséquent, ranger par "valeurs croissantes" ou "décroissantes". Exemple de l’appréciation d’un produit par des consommateurs.
Variable, ou caractère quantitatif : Variable numérique telle qu’on peut calculer, par une opération mathématique quelconque, comme l’addition, pour deux (ou plusieurs) individus, une valeur appelée total, à partir des valeurs de ces individus. Pour l’addition il s’agit de la somme. Exemple des ventes annuelles = somme des ventes de l’ensemble de tous les jours ouvrés de l’année. Contre exemple de l’étage, pour des logements. Les valeurs observées forment un ensemble continu ou non, infini ou non.
Médiane, quartiles,déciles, centiles : (Seulement pour une variable ordinale ou quantitative). Ce sont les valeurs de la variable qui correspondent respectivement à 50%, 25% 50% et 75%, 10% à 90%, 1% à 99% de l’effectif des individus rangés par valeurs croissantes.
Moyenne : Seulement pour une variable quantitative. Valeur uniforme que devrait présenter chaque individu d’un ensemble (population ou échantillon) pour que le total de l’ensemble soit inchangé. C’est, dans le cas de la moyenne arithmétique, le quotient de la somme par l’effectif. Contre exemple de condensateurs en série : La capacité moyenne est la moyenne harmonique des capacités. La moyenne est une statistique dite de tendance centrale.
Variance, et sa racine carrée, l’écart-type : Seulement pour une variable quantitative. Indicateurs de la dispersion des valeurs des individus autour de la moyenne. La variance est la moyenne des carrés des écarts à la moyenne. L’écart-type est sa racine carrée. Ce sont des statistiques de dispersion.
Statistique (ou paramètre statistique) : Tout nombre, calculé à propos d’une population, et qui contribue à décrire un aspect de cette population, est une statistique. Fréquences, médianes, quartiles, déciles, moyennes, variances, etc. sont des statistiques.
Distribution (ou répartition) des individus selon une ou deux variables : Tableau (croisé s'il y a deux variables) des valeurs d’une (ou deux) variables avec les effectifs correspondants.
Représentations géométriques des distributions :
- Pour une variable qualitative : diagramme circulaire ("camembert").
- Pour une variable ordinale ou quantitative discrète : diagramme ou graphique en bâtons.
- Pour une variable ordinale ou quantitative continue : histogramme et courbe des fréquences cumulées.
- Pour deux variables quantitatives ou ordinales : nuage de points.
Variable d’intérêt, variable explicative : Une variable est dite explicative si elle influence une autre variable, dite d’intérêt c’est-à-dire qui fait l’objet de l’étude statistique. Une variable explicative peut servir à stratifier la population.