Tests sur deux moyennes appariées

7.5.3.c. Tests sur la différence des moyennes théoriques de deux v.a. appariées - Contre-hypothèses intervalles finis.

Nous présentons des tests asymptotiques, dont les contre-hypothèses sont des intervalles finis, tests sur la différence des moyennes théoriques de deux v.a., notées \(X^{(1)}\) et \(X^{(2)}\) appariées et de lois inconnues. Comme pour l’estimation nous utilisons des méthodes asymptotiques générales, forcément approximatives. Nous admettons avoir suffisamment d’observations, au moins 50 en général. Nous interprètons les résultats avec réserve.

La situation expérimentale typique est le cas où chaque unité est observée «avant» un traitement, résultat \(X^{(1)}\), et «après» ce traitement, résultat \(X^{(2)}\). Nous notons \(D=X^{(1)}-X^{(2)}\) et nous supposons que \({\mathbb V}ar\lbrack D\rbrack=\sigma^2_D <\infty\). Ce qui implique \({\mathbb E}\lbrack D\rbrack=\delta_D < \infty\).

Propriété 1. Soit \(D_{\bullet}=(D_1,\cdots,D_n)=(X^{(1)}_1-X^{(2)}_1,\cdots,X^{(1)}_n-X^{(2)}_n)\) un \(n\)-échantillon de \(D\). Nous considérons les statistiques :

\(\displaystyle\overline{D} =\frac{1}{n}\sum_{j=1}^nD_j\quad\) et \(\quad \displaystyle S_c^2(D_{\bullet}) = \frac{1}{n-1}\sum_{j=1}^n(D_j-\overline{D})^2,\)

moyenne et variance corrigée empiriques de l’échantillon de \(D\). Nous avons les résultats suivants :

\(\displaystyle\lim_{n\rightarrow +\infty} {\cal L_{\delta_D,\sigma_D}}\left(\sqrt{n}\frac{\overline{D}-\delta_D}{\sigma_D}\right)={\cal N}(0\ ;\ 1),\ \) c’est-à-dire \(\displaystyle \lim_{n\rightarrow +\infty}P_{\delta_D, \sigma_D}\left(\sqrt{n}\frac{\overline{D}-\delta_D}{\sigma_D}\leq t\right)=\Phi(t),\ \forall t\in {\mathbb R}\).
\(S_c(D_{\bullet})\overset{P}{\underset{n\rightarrow+\infty}\longrightarrow}\sigma_D\).
\(\displaystyle\lim_{n\rightarrow +\infty} {\cal L_{\delta_D}}\left(\sqrt{n}\frac{\overline{D}-\delta_D}{S_c(D_{\bullet})}\right)={\cal N}(0\ ;\ 1),\ \) c’est-à-dire \(\displaystyle \lim_{n\rightarrow +\infty}P_{\delta_D}\left(\sqrt{n}\frac{\overline{D}-\delta_D}{S_c(D_{\bullet})}\leq t\right)=\Phi(t),\ \forall t\in {\mathbb R}\).

Nous désignons par \({\cal N}(0\ ;\ 1)\) la loi Normale Standard et par \(\Phi\) sa f.r..

Comme \({\mathbb V}ar\lbrack D\rbrack\) est finie, nous montrons que la f.c. de \(\overline{D}\) se comporte asymptotiquement comme celle de la loi Normale Standard, c’est le T.L.C.. Nous avons la première normalité asymptotique. Pour la convergence en probabilité, nous constatons que nous sommes en présence de v.a. qui sont i.i.d. et nous appliquons la Propriété 2 de la loi Faible des Grands Nombres. En posant \(h(t)=\sqrt{t}\), la Propriété 4 de la convergence en loi nous permet de conclure. \(\square\)

Alternative 4.

Soit \(\delta_1, \delta_2\in{\mathbb R}\) donnés avec \(\delta_1 < \delta_2\) et \(\alpha\in \rbrack 0\ ;\ 1\lbrack\) un seuil fixé. Pour tester l’alternative :

\({\cal H}_0^{(4)}=\lbrace\delta\notin\rbrack\delta_1\ ;\ \delta_2\lbrack\rbrace\quad\) contre \(\quad{\cal H}_1^{(4)}=\lbrace \delta\in\rbrack\delta_1\ ;\ \delta_2\lbrack\rbrace\),

et les autres Alternatives 4 associées, nous considérons le test asymptotique \(\psi^{(4)}_{\infty}(d_{\bullet})=I_{\rbrack c_1\ ;\ c_2\lbrack}(\overline{d})\), où \(c_1=\dfrac{\delta_1+\delta_2}{2}-t_{\alpha,n}\dfrac{\sigma_D}{\sqrt{n}}\) et \(c_2=\dfrac{\delta_1+\delta_2}{2}+t_{\alpha,n}\dfrac{\sigma_D}{\sqrt{n}}\), avec \(t_{\alpha,n}\) solution de l’équation critique en \(t\) :

\(g(t)=\Phi\left(\sqrt{n}\dfrac{\delta_2-\delta_1}{2\sigma_D}+t\right)-\Phi\left(\sqrt{n}\dfrac{\delta_2-\delta_1}{2\sigma_D}-t\right)=\alpha.\)

Ainsi en théorie :

si \(\overline{d} \in \rbrack c_1 ;\ c_2\lbrack\), alors nous décidons «\({\cal H}_1^{(4)}\) est vraie» ;
si \(\overline{d} \notin \rbrack c_1 ;\ c_2\lbrack\), alors nous décidons «\({\cal H}_0^{(4)}\) est vraie».

L’écart type \(\sigma_D\) étant en général inconnu, nous l’estimons par \(S_c(D_{\bullet})\), qui est convergent. Donc \(c_1\) est estimé par \(\widehat{c}_1=\dfrac{\delta_1+\delta_2}{2}-\widehat{t}_{\alpha,n}(d_{\bullet})\dfrac{S_c(d_{\bullet})}{\sqrt{n}}\) et \(c_2\) est estimé par \(\widehat{c}_2=\dfrac{\delta_1+\delta_2}{2}+\widehat{t}_{\alpha,n}(d_{\bullet})\dfrac{S_c(d_{\bullet})}{\sqrt{n}}\) respectivement, \(\widehat{t}_{\alpha,n}\) solution de l’équation critique en \(t\) :

\(\widehat{g}(t)=\Phi\left(\sqrt{n}\dfrac{\delta_2-\delta_1}{2S_c(d_{\bullet})}+t\right)-\Phi\left(\sqrt{n}\dfrac{\delta_2-\delta_1}{2S_c(d_{\bullet})}-t\right)=\alpha.\)

si \(\overline{d} \in \rbrack \widehat{c}_1 ;\ \widehat{c}_2\lbrack\), alors nous décidons «\({\cal H}_1^{(4)}\) est vraie» ;
si \(\overline{d} \notin \rbrack \widehat{c}_1 ;\ \widehat{c}_2\lbrack\), alors nous décidons «\({\cal H}_0^{(4)}\) est vraie».

Remarque 1. Si pour l’utilisateur décider à tort que la différence des moyennes théoriques de deux v.a. de lois inconnues, appariées, est dans un intervalle fixé a les conséquences les plus défavorables, c’est sur ce test \(\psi^{(4)}_{\infty}(D_{\bullet})\) qu’il doit fonder sa démarche. Ce test \(\psi^{(4)}_{\infty}\), au seuil \(\alpha\), est identique au test \(1-\psi^{(3)}_{\infty}\), au seuil \(1-\alpha\), défini pour les Alternatives 3. Le choix de l’alternative est fondamental.

Remarque 2. L’étude de la fonction \(g(t)\) montre que la solution \(t_{\alpha}\) existe et qu’elle est unique. Il en est de même pour \(\widehat{t}_{\alpha}\).

Propriété 2. Le test \(\psi^{(4)}_{\infty}\) satisfait à :

Pour tout \(\delta_D\notin\rbrack\delta_1\ ;\ \delta_2\lbrack\), nous avons \(\displaystyle\lim_{n\rightarrow +\infty}{\mathbb E}_{\delta_D}\lbrack\psi^{(4)}_{\infty}(D_{\bullet})\rbrack \leq \displaystyle\lim_{n\rightarrow +\infty}{\mathbb E}_{\delta_1}\lbrack\psi^{(4)}_{\infty}(D_{\bullet})\rbrack= \displaystyle\lim_{n\rightarrow +\infty}{\mathbb E}_{\delta_2}\lbrack\psi^{(4)}_{\infty}(D_{\bullet})\rbrack=\alpha\) ; le test est asymptotiquement de seuil \(\alpha\).
Pour tout \(\delta\in\rbrack\delta_1\ ;\ \delta_2\lbrack\), nous avons \(\alpha \leq\displaystyle\lim_{n\rightarrow +\infty}{\mathbb E}_{\delta_D}\lbrack\psi^{(4)}_{\infty}(D_{\bullet})\rbrack\) ; le test est asymptotiquement sans biais.
Pour tout \(\delta_D\in\mathbb{R}\), une approximation de la fonction puissance asymptotique est donnée par :
\(pu_{\psi^{(4)}_{\infty}}(\delta_D)\approx \Phi\left(\sqrt{n}\dfrac{\delta_1+\delta_2-2\delta_D}{2\sigma_D}+t_{\alpha,n}\right)- \Phi\left(\sqrt{n}\dfrac{\delta_1+\delta_2-2\delta_D}{2\sigma_D}-t_{\alpha,n}\right)\).
Une estimation de cette approximation est donnée par :
\(\widehat{pu}_{\psi^{(4)}_{\infty}}(\delta_D)\approx \Phi\left(\sqrt{n}\dfrac{\delta_1+\delta_2-2\delta_D}{2S_c(d_{\bullet})}+\widehat{t}_{\alpha,n}\right)- \Phi\left(\sqrt{n}\dfrac{\delta_1+\delta_2-2\delta_D}{2S_c(d_{\bullet})}-\widehat{t}_{\alpha,n}\right)\).

La symétrie de la f.r. de la loi Normale Standard, l’appliquation du T.L.C. et les propriétés de la convergence en probabilité pour \(S_c(D_{\bullet})\) et en loi pour \(\overline {D}\) nous donnent ces résultats.\(\ \square\)

Remarque 3. Si nous avons observé \(\overline{D}=\overline{d}\), alors une approximation de la puissance asymptotique a posteriori est :

\(pu_{\psi^{(4)}_{\infty}}(\overline{d})\approx \Phi\left(\sqrt{n}\dfrac{{\delta_1+\delta_2}-2\overline{d}}{2\sigma_D}+t_{\alpha,n}\right)- \Phi\left(\sqrt{n}\dfrac{{\delta_1+\delta_2}-2\overline{d}}{2\sigma_D}-t_{\alpha,n}\right).\)

Elle peut être estimée par :

\(\widehat{pu}_{\psi^{(4)}_{\infty}}(\overline{d})\approx \Phi\left(\sqrt{n}\dfrac{{\delta_1+\delta_2}-2\overline{d}}{2S_c(d_{\bullet})}+\widehat{t}_{\alpha,n}\right)- \Phi\left(\sqrt{n}\dfrac{{\delta_1+\delta_2}-2\overline{d}}{2S_c(d_{\bullet})}-\widehat{t}_{\alpha,n}\right).\)

Propriété 3. Si nous avons observé \(\overline{D}=\overline{d}\), alors la \(p-\)valeur du test est :

\(p_{val}=\Phi\left(\sqrt{n}\dfrac{\delta_2-\delta_1}{2\sigma_D}+t_{\alpha,n}\right)- \min\left\lbrace\Phi\left(\sqrt{n}\dfrac{\overline{d}-\delta_1}{\sigma_D}\right) ; \Phi\left(\sqrt{n}\dfrac{\delta_2-\overline{d}}{\sigma_D}\right)\right\rbrace.\)

Ainsi en théorie :

si \(p_{val} < \alpha\), nous décidons «\({\cal H}_1^{(4)}\) est vraie» ;
si \(\alpha \leq p_{val}\), nous décidons «\({\cal H}_0^{(4)}\) est vraie».

Cette \(p-\)valeur peut être estimée par :

\(\widehat{p}_{val}=\Phi\left(\sqrt{n}\dfrac{\delta_2-\delta_1}{2S_c(d_{\bullet})})+\widehat{t}_{\alpha,n}\right)- \min\left\lbrace\Phi\left(\sqrt{n}\dfrac{\overline{d}-\delta_1}{S_c(d_{\bullet})}\right) ;\ \Phi\left(\sqrt{n}\dfrac{\delta_2-\overline{d}}{S_c(d_{\bullet})}\right)\right\rbrace.\)

Ainsi en pratique :

si \(\widehat{p}_{val} < \alpha\), nous décidons «\({\cal H}_1^{(4)}\) est vraie» ;
si \(\alpha \leq \widehat{p}_{val}\), nous décidons «\({\cal H}_0^{(4)}\) est vraie».

Pour le voir, il suffit de faire apparaître \(\alpha=g_4(t_{\alpha})\) dans les inégalités ci-dessus et d’effectuer un calcul direct. \(\ \square\)

Remarque 4. Nous avons créé dans R deux procédures. La première Test4Asym2MoyeAppa qui permet la réalisation du test \(\psi^{(4)}_{\infty}\). La seconde Puis4Asym2MoyeAppa qui donne une estimation de sa puissance asymptotique.

Exemple. Nous considérons les données de Sinistres. Nous notons \(X^{(1)}\) la v.a. «AGE du titulaire au moment du sinistre» et \(X^{(2)}\) la v.a. «PERM anciéneté du permis au moment du sinistre» ; ainsi la v.a. \(D\) correspond à l’âge d’acquisition du permis. Nous supposons que cette v.a. admet une variance théorique. Nous nous proposons de tester l’alternative :

\({\cal H}_0^{(4)}=\lbrace\delta_D\notin \rbrack 20\ ;\ 25\lbrack\rbrace\quad\) contre \(\quad{\cal H}_1^{(4)}=\lbrace \delta_D\in \rbrack 20\ ;\ 25\lbrack\rbrace\).

Nous utilisons la procédure Test4Asym2MoyeAppa de la Remarque 4 ci-dessus. Après l’avoir compilée («sourcée» dans R), nous l’exécutons en indiquant les données à traiter Donnees[,1] et Donnees[,2], \(\delta_1=20,\ \delta_2=25\) et le seuil \(\alpha=0,01\) à utiliser, parce que \(n=356\).

Test4Asym2MoyeAppa (Donnees[,1],Donnees[,2],20,25,0.01), réponse :
Test asymptotique de l'alternative : H^{(4)}_0={Delta_D ⩽ 20 ou 25 ⩽ Delta_D} contre H^{(4)}_1={ 20 < Delta_D < 25 }.

Premier échantillon, taille : 356 ; moyenne : 42.25 ; écart type : 11.77 .
Deuxième échantillon, taille : 356 ; moyenne : 18.52 ; écart type : 8.623 .
Moyenne observée des différences : 23.73 ; écart type observé des différences: 7.472 .

Seuil asymptotique du test : 0.01 ; solution de l'équation critique : 3.987 .
Estimation des valeurs critiques : 20.92 et 24.08 .

Décision : «H^{(4)}_1 est vraie».

Estimation de la p-valeur : 0.0006724 .

Le test est significatif ; le risque est inférieur à \(0,01\), nous faisons confiance à notre décision : la moyenne théorique de l’âge d’acquisition du permis est comprise entre \(20\) ans et \(25\) ans. A noter que l’estimation de la puissance a posteriori ne s’affiche que si la moyenne observée est dans \({\cal H}_1^{(4)}\) et si la décision est «\({\cal H}^{(4)}_0\) est vraie». Nous pouvons estimer une approximation de la puissance de ce test aux points \(\delta_D=23,73\) et \(\delta_D=20,5\) par exemple. Après avoir compilé («sourcée» dans R) la procédure correspondante de la Remarque 4 ci-dessus, nous l’exécutons en indiquant les données à traiter, \(\delta_1=20,\ \delta_2=25\), le seuil, \(\alpha=0,01\), à utiliser et \(\delta_D=23,73\), \(\delta_D=20,5\) :

Puis4Asym2MoyeAppa(Donnees[,1],Donnees[,2],20,25,0.01,23.73), réponse : 0.8108 .
Puis4Asym2MoyeAppa(Donnees[,1],Donnees[,2],20,25,0.01,20.5), réponse : 0.1437 .

Nous traçons une estimation du graphique d’une estimation de la fonction puissance. Voici les commandes que nous exécutons :

plot( function(Delta_D) Puis4Asym2MoyeAppa (Donnees[,1],Donnees[,2],20,25,0.01,Delta_D),19,26, xlab="Delta_D",
ylab="pu", ylim= c(0,1), main="Fig. Approximation de la puissance\n asymptotique du test 4.", col="green4");
segments( x0=c(20,20,25,25,23.73,23.73,20.5,20.5), y0=c(0,0.01,0,0.01,0,0.8108,0,0.1437), x1=c(20,0,25,0,23.73,0,20.5,0),
y1=c(0.01,0.01,0.01,0.01,0.8108,0.8108,0.1437,0.1437), col="blue");
points( x=c(20,25,23.73,20.5), y=c(0.01,0.01,0.8108,0.1437), col="red", pch=".", cex=4); réponse :

Estimation de la fonction puissance de l’Exemple.

Il est aisé de constater que le test est bien de seuil \(0,01\) et sans biais. Nous avons marqué en rouge les points de coordonnées \((\delta_1\ ;\ \alpha)=(20\ ;\ 0,01)\), \( (\delta_2\ ;\ \alpha)=(25\ ;\ 0,01),\ (\overline{d}\ ;\ \widehat{pu}_{\psi^{(4)}_{\infty}}(\overline{d}))\approx(23,73\ ;\ 0,8107)\) et \((\delta_D\ ;\ \widehat{pu}_{\psi^{(4)}_{\infty}}(\delta_D))\approx(20,5\ ;\ 0,1437)\).\(\ \square\)

Haut de la page.

7. Tests classiques d’hypothèses.

7. Tests classiques d’hypothèses.

7.5.3.c. Tests sur la différence des moyennes théoriques de deux v.a. appariées - Contre-hypothèses intervalles finis.