le logo du site

2. Descriptions numériques.

2.1. Caractéristiques de position.

Une caractéristique de position est un nombre autour duquel se répartissent les valeurs observées.

Définition 1. La moyenne observée ou empirique d’un \(n\)−échantillon \(x_{\bullet}\) ou respectivement d’une distribution statistique \(Dist(x_{\bullet})\) d’une variable quantitative est la caractéristique de position, noté \(\overline{x}\) ou \(M_1(x_{\bullet})\), qui est définie par les expressions :

\[ \overline{x} = M_1(x_{\bullet}) = \frac{1}{n}\sum_{i=1}^n x_i,\qquad {\rm {\it ou\ bien}} \qquad \overline{x} = M_1(x_{\bullet}) = \frac{1}{n}\sum_{j=1}^r n_jc_j. \]

Interprétation. La moyenne est la valeur que nous observerions constamment s’il n’y avait pas de variations individuelles des unités, d’erreurs de mesure et de diverses autres fluctuations aléatoires au cours de l’expérience.

Remarque 1. La caractéristique \(\overline{x}\) est une estimation de la moyenne de la variable, lorsqu’elle existe, sur toute la population de référence ; celle-ci est appelée moyenne théorique. L’étude précise des propriétés de cette estimation est donnée à la page concernant l’estimation d’une moyenne théorique. Cette dernière est notée \({\mathbb E}\lbrack X\rbrack=\mu\) et, en général, elle est inconnue. De plus, sous certaines conditions, nous avons \(\displaystyle\lim_{n\rightarrow +\infty} \overline{x}=\mu\). Cette propriété est connue sous le nom de loi des grands nombres.

Définition 2. Nous désignons par mode ou classe modale d’une distribution statistique \(Dist(x_{\bullet})\) la caractéristique de position, notée \(Mo(x_{\bullet})\), qui est égale à la modalité ou à la classe la plus fréquente.

Interprétation. Le mode est la valeur que nous observons le plus fréquemment, la valeur qui est à « la mode ».

Remarque 2. La caractéristique \(Mo(x_{\bullet})\) est une estimation du mode théorique de la variable observée noté \(Mo\lbrack X\rbrack\). L’étude précise des propriétés de cette estimation est donnée à la page concernant l’estimation d’un mode théorique.

Nous présentons la médiane qui est la troisième caractéristique le plus utilisée.

Définition 3. Soit un \(n\)−échantillon \(x_{\bullet}\) et \(x_{(\bullet)}=(x_{(1)},\ x_{(2)},\ \cdots,\ x_{(n)})\) l’échantillon ordonné associé. Nous appelons médiane de celui-ci, notée \(Q_{x_{\bullet}}(0,5)=Me(x_{\bullet})={\widetilde x}\), le plus petit nombre \(x_{(i)}\) tel que : \(0,5 \leq\displaystyle \frac{i}{n}.\) Une manière équivalente de définir la médiane est :

\[ Q_{x_{\bullet}}(0,5)=Me(x_{\bullet})={\widetilde x}=\cases{ x_{(m)} \quad {\it si} \ n=2m\ {\it est\ pair}, \cr x_{(m+1)} \quad {\it si}\ n=2m+1\ {\it est\ impair},\cr } \]

Interprétation. La médiane se trouve au milieu de l’échantillon, elle sépare celui-ci en deux parties, chacune d’elles contenant à peu près la moitié des observations. De ce fait elle est insensible aux observations extrêmes. C’est une caractèristique de position à utiliser en présence de telles observations. Le calcul dans le cas discret nous donne une médiane qui est une des valeurs observées, ce qui n’est pas le cas de la moyenne. En fait ce calcul n’est rien d’autre que l’inversion de la fonction de répartition empirique.

Remarque 3. Certains auteurs préconisent de définir la médiane de la manière suivante.

\[ Q^{(2)}_{x_{\bullet}}(0,5)=Me(x_{\bullet})={\widetilde x}=\cases{ 0,5(x_{(m)}+x_{(m+1)}) \quad {\it si} \ n=2m\ {\it est\ pair}, \cr x_{(m+1)} \quad {\it si}\ n=2m+1\ {\it est\ impair},\cr } \] Nous constatons que les deux définitions sont proches.

Remarque 4. Pour une distribution d’une variable continue, la médiane est estimée, par convention, à l’aide d’une interpolation linéaire sur les extrémités de la classe qui la contient.

Remarque 5. La caractéristique \(Me(x_{\bullet})\) est une estimation de la médiane théorique de la variable observée noté \(Me\lbrack X\rbrack\). L’étude précise des propriétés de cette estimation est donnée à la page concernant l’estimation d’une médiane théorique.

Remarque 6. Il est possible, comme nous le verrons, de remplacer le coefficient \(0,5\) par tout nombre \(p\in \rbrack 0\ ;\ 1\lbrack\) pour obtenir le quantile d’ordre \(p\).

Il existe d’autres caractéristiques de position, par exemple la moyenne harmonique, qui est l’inverse de la moyenne des inverses des observations, la moyenne géométrique, qui est la racine énième du produit des observations, ou encore les moyennes tronquées : un pourcentage fixé des plus grandes et plus petites valeurs de l’échantillon est omis, puis la moyenne des valeurs restantes est calculée. Un autre exemple sont les moyennes pondérées de valeurs « pivots » qui sont en général des quantiles.

Haut de la page.