le logo du site

6. Estimation.

6.3.4. Intervalle asymptotique.

Une des propriétés recherchées pour les estimateurs est la normalité asymptotique :

\[ \lim_{n\rightarrow +\infty} {\cal L}\left(\frac{T(X_{\bullet})-\theta}{b}\right)={\cal N}(0\ ;\ 1). \]

Propriété 1. Si l’écart type \(b\) d’un estimateur asymptotiquement normal de \(\theta\) est entièrement déterminé et ne dépend pas du paramètre \(\theta\), alors \(\dfrac{T-\theta}{b}\) est une statistique pivotale et nous pouvons construire l’intervalle asymptotique de confiance de \(\theta\) :

\[ I^{\infty}_{conf}(\theta\ ;\ \alpha\ ;\ x_{\bullet})=\lbrack T(x_{\bullet})-cb\ ;\ T(x_{\bullet})+ cb\rbrack, \]

où \(c\) est le quantile d’ordre \(\displaystyle 1-\frac{\alpha}{2}\) de la loi Normale standard \({\cal N}(0\ ;\ 1)\).

Remarques. La loi Normale \({\cal N}(0\ ;\ 1)\) étant symétrique, le quantile précédent nous permet d’avoir un intervalle de prédiction. Il se peut que l’écart type \(b=b(\theta\ ;\ n)\) dépende du paramètre ; mais si nous pouvons résoudre en \(\theta\) les inéquations \(-cb(\theta\ ;\ n) \leq T(X_{\bullet})-\theta \leq cb(\theta\ ;\ n)\), alors il est encore possible d’obtenir un intervalle asymptotique de confiance \(\theta\). C’est aussi le cas lorsque nous pouvons appliquer la méthode de Stabilisation de la variance.

Exemple 1. Soit \(X\) une v.a. de densité :

\[ f(t)=\cases{ t-(\theta-1) & \({\rm si}\ \theta-1\leq t\leq \theta\),\cr 1-t+\theta &\( {\rm si}\ \theta\leq t\leq \theta+1\),\cr 0 &\( {\rm sinon}.\) } \]

Cette densité définit une loi Triangulaire de paramètre \(\theta\in{\mathbb R}\) ; nous la notons \({\cal TR}(\theta)\). Un calcul classique nous donne :

\[ {\mathbb E}\lbrack X\rbrack=\theta \quad {\rm et}\quad \sigma^2\lbrack X\rbrack=\frac{1}{6}. \]

Soit \(X_{\bullet}\) un \(n-\)échantillon de \(X\) Nous appliquons le T.L.C. :

\[ \lim_{n\rightarrow +\infty} {\cal L}\left(\sqrt{6n}(\overline{X}-\theta)\right)={\cal N}(0\ ;\ 1). \]

Si \(c\) est le quantile d’ordre \(\displaystyle 1-\frac{\alpha}{2}\) de la loi Normale standard \({\cal N}(0\ ;\ 1)\), nous avons l’intervalle asymptotique de confiance de \(\theta\) :

\[ I^{\infty}_{conf}(\theta\ ;\ \alpha\ ;\ x_{\bullet})=\Big\lbrack \overline{x}-\frac{c}{\sqrt{6n}}\ ;\ \overline{x}+\frac{c}{\sqrt{6n}}\Big\rbrack. \]

Exemple 2. Soit \(X\) une v.a. suivant une loi de Poisson \({\cal P}(\lambda)\). Elle satisfait au T.L.C.. Nous avons :

\[ \lim_{n\rightarrow +\infty} {\cal L}\left(\sqrt{\frac{n}{\lambda}}(\overline{X}-\lambda)\right)={\cal N}(0\ ;\ 1). \]

Soit \(c\) le quantile d’ordre \(\displaystyle 1-\frac{\alpha}{2}\) de la loi Normale standard \({\cal N}(0\ ;\ 1)\). Nous résolvons l’inéquation : \(n(\overline{x}-\lambda)^2\leq\lambda c^2\) et nous en déduisons l’intervalle asymptotique de confiance :

\[ I^{\infty}_{conf}(\lambda\ ;\ \alpha\ ;\ x_{\bullet})=\Big\lbrack \overline{x}+\frac{c^2}{2n}-\frac{c}{2n}\sqrt{4n\overline{x}+c^2}\ ;\ \overline{x}+ \frac{c^2}{2n}+\frac{c}{2n}\sqrt{4n\overline{x}+c^2}\Big\rbrack. \]

Application numérique. Considérons les données des arrêts d’une chaîne de production qui sont présentées dans l’Exemple 3. Nous posons \(\alpha=0,05\), alors nous avons déjà calculé \(c=1,96\). Avec les commandes suivantes dans R nous déduisons :

mean (Donnees) ; réponse : 0.698
b=(1.96/2000)*sqrt(4000 * mean (Donnees)+1.96^2) ; réponse : 0.0518182
mean (Donnees)+(1.96^2/2000)-b ; réponse : 0.6481026
mean (Donnees)+(1.96^2/2000)+b ; réponse : 0.751739

D’où l’intervalle asymptotique de confiance \(I^{\infty}_{conf}(\lambda\ ;\ 0,05\ ;\ x_{\bullet})=\lbrack 0,6481026\ ;\ 0,751739\rbrack\). Ici nous pouvons également appliquer les résultats de l’Exemple 2 de la stabilisation de la variance. Nous avons obtenu :

\[ \lim_{n\rightarrow +\infty} {\cal L}\left(\sqrt{n}(\sqrt{\overline{X}}-\sqrt{\lambda)}\right)={\cal N}(0\ ;\ \frac{1}{4}). \]

Nous en déduisons l’intervalle asymptotique de confiance :

\[ I^{\infty}_{conf}(\lambda\ ;\ \alpha\ ;\ x_{\bullet})=\Big\lbrack (\sqrt{\overline{x}}-\frac{c}{2\sqrt{n}})^2\ ;\ (\sqrt{\overline{x}}+\frac{c}{2\sqrt{n}})^2\Big\rbrack. \]

Appliquées sur les données des arrêts, les commandes suivantes dans R nous donnent :

(sqrt( mean (Donnees))-1.96/(2*sqrt(1000)))^2 ; réponse : 0.6471778 ;
(sqrt( mean (Donnees))+1.96/(2*sqrt(1000)))^2 ; réponse : 0.750743.

Nous obtenons ainsi un autre intervalle asymptotique de confiance du paramètre \(I^{\infty}_{conf}(\lambda\ ;\ 0,05\ ;\ x_{\bullet})=\lbrack 0,6471778\ ;\ 0,750743\rbrack\). Nous remarquons un léger décalage pour le deuxième intervalle ; mais ce dernier est moins précis du fait des deux approximations de la loi de \(\overline{X}\) que nous avons faites. \(\quad\square\)

Dans le cas d’un paramètre multidimensionnel \(\theta \in {\mathbb R}^s\), pour obtenir une région de confiance, nous appliquons la Propriété 1 de la méthode du maximum de vraisemblance qui nous donne, sous certaines conditions, un estimateur asymptotiquement sans biais, efficace et normal du paramètre.

Propriété 2. Nous supposons que les conditions (CR 0), (CR 1), (CR 2), (CR 3) et (CR 5) sont satisfaites. Soit \(T(X_{\bullet})\) l’estimateur du maximum de vraisemblance. Alors une région asymptotique de confiance de \(\theta\) est donnée par

\[ I^{\infty}_{conf}(\theta\ ;\ \alpha\ ;\ x_{\bullet})=\Big\lbrace \theta : n\sideset{^t}{}(T(x_{\bullet})-\theta)I(T(x_{\bullet}))(T(x_{\bullet})-\theta)\leq c\Big\rbrace. \]

où \(I(\zeta)\) est la matrice d’information de Fisher pour la valeur des paramètres au point \(\zeta\) et \(c\) est le quantile d’ordre \(\displaystyle 1-\alpha\) de la loi Khi-deux \(\chi^2_s\).

Bien entendu il ne s’agit pas d’un intervalle de confiance, mais d’une région de confiance qui ici a la forme d’un ellipsoïde.

Haut de la page.