le logo du site

6. Estimation.

6.0. Généralités sur l’Estimation.

L’Estimation est, avec les tests, l’un des deux chapitres les plus importants de la Statistique. Elle consiste en des procédures d’évaluation à partir d’observations d’un ou plusieurs paramètres inconnus. Considérons une v.a. \(X\) dont la loi dépend d’un paramètre \(\theta \in \Theta\). Nous pouvons avoir soit \(\Theta \subseteq {\mathbb R}\) (cas univarié), soit \(\Theta \subseteq {\mathbb R}^p\) (cas multivarié). Cette loi est déterminée soit par \(p(x\ ;\ \theta)= P_{\theta}(X=x)\) (cas discret) soit par la densité \(f(x\ ;\ \theta)\) (cas continu), \(\theta\) étant la «vraie» valeur du paramètre inconnu. Considérons \(X_{\bullet}=(X_1,\ \cdots,\ X_n)\) un \(n-\)échantillon de \(X\), c’est-à-dire la donnée de \(n\) v.a. indépendantes de même loi que \(X\). Ainsi une réalisation de cet échantillon, \(x_{\bullet}=(x_1,\ \cdots,\ x_n)\), correspond à l’observation de \(X\) sur \(n\) unités extraites au hasard de la population étudiée.

Définition 1. Nous appelons statistique toute application :

\[ T : {\mathbb R}^n \longrightarrow {\mathbb R}\ ({\rm ou}\ {\mathbb R}^p),\quad x_{\bullet}=(x_1,\ \cdots,\ x_n) \longmapsto T(x_{\bullet})=T(x_1,\ \cdots,\ x_n)=t, \]

telle que \(T(X_1,\ \cdots,\ X_n)\) soit bien définie pour toute taille d’échantillon \(n\) et soit une v.a.. Si cette application est utilisée pour évaluer un ou plusieurs paramètres inconnus de la loi de \(X\), alors elle est appelée estimateur et ses réalisations sont des estimations.

Remarque. Un estimateur \(T=T_n(X_{\bullet})\) dépend, en général, explicitement de \(n\), mais, sauf confusion possible, nous omettrons dans la plupart des expressions de mentionner l’indice \(n\).

Exemples 1. Voici quelques applications qui sont des statistiques et qui sont utilisées dans certains cas comme estimateurs :

\[ T(X_{\bullet})=\overline{X}=\frac{1}{n}\sum_{i=1}^nX_i,\quad T(X_{\bullet})=\min_{1\leq i\leq n}X_i,\quad T(X_{\bullet})=\sqrt{\frac{1}{n}\sum_{i=1}^n(X_i-\overline{X})^2}. \]

Nous avons deux manières différentes de faire de l’estimation.

Définition 2. Lorsque nous donnons la seule valeur \(T(x_{\bullet})=t=\widehat{\theta}\) pour évaluer le paramètre inconnu \(\theta\), nous appelons cette procédure une estimation ponctuelle de celui-ci.

Remarque 1. Cette estimation peut être très proche ou très éloignée de la «vraie» valeur du paramètre. Nous n’avons aucun moyen de le savoir. Nous considérerons, jusqu’à nouvel ordre, que la «vraie» valeur du paramètre inconnu est \(T(x_{\bullet})=t=\widehat{\theta}\). Les seules «garanties» que nous ayons sont les propriétés de l’estimateur que nous avons utilisé et la représentativité de notre échantillon vis-à-vis de la population.

Définition 3. Lorsque nous donnons un intervalle \(\left\lbrack {\underline \theta}(x_{\bullet})\ ;\ {\overline \theta}(x_{\bullet})\right\rbrack\) susceptible de contenir le paramètre inconnu \(\theta\), nous appelons cette procédure une estimation par intervalle de celui-ci. Cet intervalle est la réalisation d’un intervalle aléatoire \(\left\lbrack {\underline \theta}(X_{\bullet})\ ;\ {\overline \theta}(X_{\bullet})\right\rbrack\)tel que, \(\theta\) étant la «vraie» valeur du paramètre inconnu, nous ayons :

\[ P_{\theta}\left({\underline \theta}(X_{\bullet})\leq \theta \leq {\overline \theta}(X_{\bullet})\right)=1-\alpha. \]

Cet intervalle est noté \(I_{conf}(\theta\ ;\ \alpha\ ;\ x_{\bullet})=\left\lbrack {\underline \theta}(x_{\bullet})\ ;\ {\overline \theta}(x_{\bullet})\right\rbrack\) et nous l’appelons intervalle de confiance à \(100(1-\alpha)\) % ou avec un coefficient de confiance de \(100(1-\alpha)\) %.

Remarque 2. En général les v.a. \({\underline \theta}(X_{\bullet})\) et \({\overline \theta}(X_{\bullet})\) sont définies à partir d’un estimateur \(T(X_{\bullet})\) et le seuil est fixé à \(\alpha=0,05\). Ce dernier choix est interprété de la manière suivante : l’événement «notre intervalle aléatoire contient le paramètre inconnu» a une probabilité de \(0,95\). C’est-à-dire que si nous avions disons \(1000\) échantillons, qui nous donneraient \(1000\) intervalles, en théorie \(950\) d’entre eux contiendraient le paramètre inconnu et \(50\) ne le contiendraient pas. Nous avons un seul échantillon, donc un seul intervalle. Nous faisons le pari que notre intervalle est parmi les \(95\) % de ceux qui contiennent \(\theta\) ; c’est en ce sens que c’est un intervalle de «confiance». Nous considérerons, jusqu’à nouvel ordre, que la «vraie» valeur du paramètre inconnu est contenue dans cet intervalle. Bien entendu, pour une probabilité fixée \(1-\alpha\), l’intervalle de confiance est construit le plus petit possible.

Haut de la page.