Les caractéristiques de forme donnent l’allure de la répartition d’un échantillon ou d’une distribution. Pour décrire cette allure nous ferons appel au diagramme des fréquences ou à l’histogramme. Les caractéristiques de forme sont définies à partir de la notion de moment.
Définition 1. Les expressions suivantes définissent le moment et le moment centré d’ordre \(k\) observé ou empirique d’un échantillon \(x_{\bullet}\) d’une variable quantitative :
\[ M_k(x_{\bullet}) = \frac{1}{n}\sum_{i=1}^n x_i^k,\qquad {\rm {\it et}} \qquad M_k(x_{\bullet}-\overline{x}) = \frac{1}{n}\sum_{i=1}^n (x_i-\overline{x})^k. \]Interprétation. Ces nombres peuvent s’interpréter en termes de moment mécanique.
Remarques 1. La définition est analogue pour une distribution. Bien évidemment le moment d’ordre \(k=1\) est la moyenne \(\overline{x}\) et le moment centré d’ordre \(k=2\) est la variance \(s^2(x_{\bullet})\).
Si la variable étudiée admet, sur la population de référence, un moment (resp. moment centré), d’ordre \(k\), inconnu en général, noté \(M_k\) (resp. \(\mu_k\)), appelés moments théoriques, les caractéristiques précédentes en sont des estimations. Sous certaines conditions, \(\displaystyle\lim_{n\rightarrow +\infty} M_k(x_{\bullet})=M_k\) (resp. \(\displaystyle\lim_{n\rightarrow +\infty} M_k(x_{\bullet}-\overline{x})=\mu_k\)). C’est encore une propriété du type loi des grands nombres.
Il existe plusieurs caractéristiques de forme fondées sur les moments ou encore sur les quantiles. Nous présentons les caractéristiques les plus utilisées, introduites par Fisher.
Définition 2. Nous appelons coefficient d’asymétrie d’un échantillon \(x_{\bullet}\) le rapport, noté \(G_1(x_{\bullet})\), entre le moment centré d’ordre 3 et le cube de l’écart type, c’est-à-dire :
\[ G_1(x_{\bullet}) = \frac{M_3(x_{\bullet}-\overline{x})}{s^3(x_{\bullet})}. \]Interprétation. Si la répartition de l’échantillon ou de la distribution est symétrique autour de la moyenne, le coefficient d’asymétrie est nul. Dans le cas où il est positif, nous avons une asymétrie gauche, le graphique des fréquences est plus élevé à gauche ; l’asymétrie droite correspond au cas où il est négatif.
Remarques 2. Dans la pratique nous utilisons un coefficient d’asymétrie corrigé :
\[ G_{1,c}(x_{\bullet}) = \frac{n^2 M_3(x_{\bullet}-\overline{x})}{(n-1)(n-2)s_c^3(x_{\bullet})}. \]L’étude précise des propriétés de ces estimations est donnée à la page concernant l’estimation de l’asymétrie théorique.
Définition 3. Nous appelons coefficient d’aplatissement d’un échantillon \(x_{\bullet}\) le rapport, noté \(G_2(x)\), entre le moment centré d’ordre 4 et la puissance 4 de l’écart type, rapport diminué de 3, c’est-à-dire :
\[ G_2(x_{\bullet}) = \frac{M_4(x_{\bullet}-\overline{x})}{s^4(x_{\bullet})}-3. \]Interprétation. Ce coefficient est très utile quand nous avons à faire à des échantillons ou répartitions symétriques. Dans ce cas, lorsque le coefficient d’aplatissement est nul nous disons que la répartition des observations est mésokurtique ou encore de type gaussien ou normal, c’est-à-dire que la courbe des fréquences a la forme d’une cloche comme la densité d’une loi Normale. Lorsqu’il est positif, nous avons une répartition leptokurtique ou surgaussienne ou encore surnormale, c’est-à-dire moins aplatie qu’une densité normale. Lorsqu’il est négatif nous disons que la répartition est platykurtique ou sous-gaussienne ou encore sous-normale, c’est-à-dire plus aplatie qu’une densité normale.
Remarques 3. Dans la pratique nous utilisons un coefficient d’aplatissement corrigé :
\[ G_{2,c}(x_{\bullet}) = \frac{n^2(n+1)M_4(x_{\bullet}-\overline{x})}{(n-1)(n-2)(n-3)s_c^4(x_{\bullet})}-\frac{3(n-1)^2}{(n-2)(n-3)}. \]L’étude précise des propriétés de ces estimations est donnée à la page concernant l’estimation de l’aplatissement théorique.
Haut de la page.