le logo du site

7. Tests classiques d’hypothèses.

7.5.3.b. Tests sur la différence des moyennes théoriques de deux v.a. appariées - Contre-hypothèses bilatérales.

Nous présentons les tests bilatéraux sur la différence des moyennes théoriques de deux v.a., notées \(X^{(1)}\) et \(X^{(2)}\) appariées et de lois inconnues. Comme pour l’estimation nous utilisons des méthodes asymptotiques générales, forcément approximatives. Nous admettons avoir suffisamment d’observations, au moins 50 en général. Nous interprètons les résultats avec réserve.

La situation expérimentale typique est le cas où chaque unité est observée «avant» un traitement, résultat \(X^{(1)}\), et «après» ce traitement, résultat \(X^{(2)}\). Nous notons \(D=X^{(1)}-X^{(2)}\) et nous supposons que \({\mathbb V}ar\lbrack D\rbrack=\sigma^2_D <\infty\). Ce qui implique \({\mathbb E}\lbrack D\rbrack=\delta_D < \infty\).

Propriété 1. Soit \(D_{\bullet}=(D_1,\cdots,D_n)=(X^{(1)}_1-X^{(2)}_1,\cdots,X^{(1)}_n-X^{(2)}_n)\) un \(n\)-échantillon de \(D\). Nous considérons les statistiques :

moyenne et variance corrigée empiriques de l’échantillon de \(D\). Nous avons les résultats suivants :

Nous désignons par \({\cal N}(0\ ;\ 1)\) la loi Normale Standard et par \(\Phi\) sa f.r..

Comme \({\mathbb V}ar\lbrack D\rbrack\) est finie, nous montrons que la f.c. de \(\overline{D}\) se comporte asymptotiquement comme celle de la loi Normale Standard, c’est le T.L.C.. Nous avons la première normalité asymptotique. Pour la convergence en probabilité, nous constatons que nous sommes en présence de v.a. qui sont i.i.d. et nous appliquons la Propriété 2 de la loi Faible des Grands Nombres. En posant \(h(t)=\sqrt{t}\), la Propriété 4 de la convergence en loi nous permet de conclure. \(\square\)

Alternative 2.

Soit \(\delta_0\in{\mathbb R}\) donné et \(\alpha\in \rbrack 0\ ;\ 1\lbrack\) un seuil fixé. Pour tester l’alternative :

ainsi que les autres Alternatives 2 associées, nous considérons le test \(\psi^{(2)}_{\infty}(d_{\bullet})=1-I_{\lbrack c_1\ ;\ c_2\rbrack}(\overline{d})\), où \(c_1=\delta_0-q_{1-\frac{\alpha}{2}}\dfrac{\sigma_D}{\sqrt{n}}\) et \(c_2=\delta_0+q_{1-\frac{\alpha}{2}}\dfrac{\sigma_D}{\sqrt{n}}\) avec \(q_{1-\frac{\alpha}{2}}\) le quantile d’ordre \(1-\dfrac{\alpha}{2}\) de la loi \({\cal N}(0\ ;\ 1)\). Ainsi en théorie :

L’écart type \(\sigma_D\) étant en général inconnu, nous l’estimons par \(S_c(D_{\bullet})\), qui est convergent. Donc \(c_1\) est estimé par \(\widehat{c}_1=\delta_0-q_{1-\frac{\alpha}{2}}\dfrac{S_c(d_{\bullet})}{\sqrt{n}}\) et \(c_2\) est estimé par \(\widehat{c}_2=\delta_0+q_{1-\frac{\alpha}{2}}\dfrac{S_c(d_{\bullet})}{\sqrt{n}}\). Ainsi en pratique :

Remarque 1. Si pour l’utilisateur décider à tort que la différence des moyennes théoriques de deux v.a. de lois inconnues, appariées, est différente d’une valeur donnée a les conséquences les plus graves, c’est sur ce test \(\psi^{(2)}_{\infty}(D_{\bullet})\) qu’il doit fonder sa démarche. Ce test \(\psi^{(2)}_{\infty}\) est la limite, lorsque \(\delta_1=\delta_2=\delta_0\) du test \(\psi^{(3)}_{\infty}\), présenté ci-après. Le choix de l’atternative est donc fondamental.

Propriété 2. Le test \(\psi^{(2)}_{\infty}\) satisfait à :

Des calculs simples sur la f.r. de la loi Normale Standard et la Propriété 1, nous donnent ces résultats.\(\ \square\)

Remarque 2. Si nous avons observé \(\overline{D}=\overline{d}\), alors une approximation de la puissance asymptotique a posteriori du test est donnée par :

et son estimation par :

Propriété 3. Si nous avons observé \(\overline{D}=\overline{d}\), alors la \(p-\)valeur du test et son estimation sont données respectivement par :

Ainsi en théorie :

et en pratique :

Pour le voir il suffit de montrer qu’en utilisant les propriétés de \(\Phi\), les inégalités sur la \(p-\)valeur conduisent aux décisions données dans la définition du test. \(\ \square\)

Remarque 3. Nous avons créé dans R deux procédures. La première Test2Asym2MoyeAppa qui permet de réaliser le test. La seconde Puis2Asym2MoyeAppa qui permet de calculer une estimation de sa puissance asymptotique.

Exemple 1. Nous considérons les données de Sinistres. Nous notons \(X^{(1)}\) la v.a. «AGE du titulaire au moment du sinistre» et \(X^{(2)}\) la v.a. «PERM anciéneté du permis au moment du sinistre» ; ainsi la v.a. \(D\) correspond à l’âge d’acquisition du permis. Nous supposons que cette v.a. admet une variance théorique. Nous nous proposons de tester l’alternative :

Nous utilisons la procédure Test2Asym2MoyeAppa de la Remarque 3 ci-dessus. Après l’avoir compilée («sourcée» dans R), nous l’exécutons en indiquant les données à traiter Donnees[,1] et Donnees[,2], \(\delta_0=24\) et le seuil \(\alpha=0,01\) à utiliser, parce que \(n=356\).

Test2Asym2MoyeAppa (Donnees[,1],Donnees[,2],24,0.01), réponse :
Test asymptotique de l'alternative : H^{(2)}_0={ Delta_D = 24 } contre H^{(2)}_1={ Delta_D non = 24 }.

Premier échantillon, taille : 356 ; moyenne : 42.25 ; écart type : 11.77 .
Deuxième échantillon, taille : 356 ; moyenne : 18.52 ; écart type : 8.623 .
Moyenne observée des différences : 23.73 ; écart type observé des différences: 7.472 .

Seuil asymptotique du test : 0.01 .
Estimation des valeurs critiques : 22.98 et 25.02 .

Décision : «H^{(2)}_0 est vraie».

Estimation de la p-valeur du test : 0.4959 .

Estimation d'une approximation de la puissance a posteriori du test : 0.02962 .

Le test n’est pas significatif ; la puissance a posteriori est très faible, cependant la taille des échantillons est telle que nous pouvons faire confiance à notre décision. Remarquons que les estimations de l’écart type de chaque échantillon nous donnent des coefficients de variation sont respectivement \( 28 \%\) et \(47 \%\), ce qui indique qu’il est raisonnable de comparer ces deux v.a.. La même conclusion s’obtient en comparant la \(p-\)valeur à \(0,01\). Comme la moyenne observée est, en général, différente de \(\delta_0\), une estimation de l’approximation de la puissance a posteriori s’affiche. Nous pouvons estimer une approximation de la puissance asymptotique de ce test aux points \(\delta_D=\overline{d}\) et \(\delta_D=25,5\) par exemple. Après avoir compilé («sourcée» dans R) la procédure correspondante de la Remarque 3 ci-dessus, nous l’exécutons en indiquant les données à traiter, \(\delta_0=24,\ \alpha=0,01\), \(\delta_D=\overline{d}\) une première fois et \(\delta_D=25,5\) une seconde fois.

Puis2Asym2MoyeAppa(Donnees[,1],Donnees[,2],24,0.01,23.73), réponse : 0.02967
Puis2Asym2MoyeAppa(Donnees[,1],Donnees[,2],24,0.01,25.5)
, réponse : 0.8873.

Enfin nous traçons une estimation de l’approximation du graphique de la fonction puissance asymptotique avec les commandes suivantes :

plot( function(Delta_D) Puis2Asym2MoyeAppa (Donnees[,1],Donnees[,2],24,0.01,Delta_D), xlab="Delta_D",
ylab="pu", ylim= c(0,1), main="Fig. 1. Approximation de la puissance\n asymptotique du test 2.", col="green4");
x0=c(24,24,23.73,23.73,25.5,25.5); y0=c(0,0.01,0,0.02967,0,0.8873);
x1=c(24,0,23.73,0,25.5,0); y1=c((0.01,0.01,0.02967,0.02967,0.8873,0.8873);
segments(x0,y0,x1,y1, col="blue");
points( x=c(24,23.73,25.5), y=c(0.01,0.02967,0.8873), col="red", pch=".", cex=5);
réponse :

Fonction puissance de l’Exemple.

Le test est bien asymptotiquement de seuil \(0,01\) et sans biais. Nous avons marqué en rouge les points de coordonnées \((\delta_0\ ;\ \alpha)=(24\ ;\ 0,01)\), \((23,73\ ;\ \widehat{pu}_{\psi^{(2)}_{\infty}}(23,73))\approx(23,73\ ;\ 0.02967)\) et \((25,5\ ;\ \widehat{pu}_{\psi^{(2)}_{\infty}}(25,5))\approx(25,5\ ;\ 0,8873\).\(\ \square\)

Alternative 3.

Soit \(\delta_1, \delta_2\in{\mathbb R}\) donnés tels que \(\delta_1 < \delta_2\) et \(\alpha\in \rbrack 0\ ;\ 1\lbrack\) un seuil fixé. Pour tester l’alternative :

et les autres Alternatives 3 associées, nous considérons le test asymptotique \(\psi^{(3)}_{\infty}(d_{\bullet})=1-I_{\lbrack c_1\ ;\ c_2\rbrack}(\overline{d})\), où \(c_1=\dfrac{\delta_1+\delta_2}{2}-t_{\alpha,n}\dfrac{\sigma_D}{\sqrt{n}}\) et \(c_2=\dfrac{\delta_1+\delta_2}{2}+t_{\alpha,n}\dfrac{\sigma_D}{\sqrt{n}}\) avec \(t_{\alpha,n}\) solution de l’équation critique en t :

Ainsi en théorie :

En général l’écart type \(\sigma_D\) est inconnu. Nous l’estimons par l’estimateur convergent \(S_c(D_{\bullet})\) et les nombres \(c_1\) et \(c_2\) peuvent alors être estimés par \(\widehat{c}_1=\dfrac{\delta_1+\delta_2}{2}-\widehat{t}_{\alpha,n}\dfrac{S_c(d_{\bullet})}{\sqrt{n}}\) et \(\widehat{c}_2=\dfrac{\delta_1+\delta_2}{2}+\widehat{t}_{\alpha,n}\dfrac{S_c(d_{\bullet})}{\sqrt{n}}\) respectivement, avec \(\widehat{t}_{\alpha,n}\) solution de l’équation :

Ainsi en pratique :

Remarque 4. Si pour l’utilisateur décider à tort que la différence des moyennes théoriques de deux v.a. de lois inconnues, appariées, n’est pas dans un intervalle fixé a les conséquences les plus défavorables, c’est sur ce test \(\psi^{(3)}_{\infty}(D_{\bullet})\) qu’il doit fonder sa démarche. Ce test est la limite du test \(\psi^{(2)}_{\infty}\) décrit ci-avant lorsque \(\delta_1=\delta_2=\delta_0\). De plus le test \(\psi^{(3)}_{\infty}\) au seuil \(\alpha\) est identique au test \(1-\psi^{(4)}_{\infty}\) au seuil \(1-\alpha\) défini pour les Alternatives 4. Le choix de l’alternative est fondamental.

Remarque 5. L’étude de la fonction \(g_3(t)\) montre que la solution \(t_{\alpha,n}\) existe et elle est unique. Il en est de même pour son estimation qui, \(\widehat{g}_3\) étant continue, est convergente.

Propriété 4. Le test \(\psi^{(3)}_{\infty}\) satisfait à :

Pour le voir il suffit d’étudier les variations de la fonction :

et d’appliquer la Propriété 1.\(\quad \square\)

Remarque 6. Si nous avons observé \(\overline{D}=\overline{d}\), alors une approximation de la puissance asymptotique a posteriori est :

Elle peut être estimée par :

Propriété 5. Si nous avons observé \(\overline{D}=\overline{d}\), alors la \(p-\)valeur du test est :

Elle peut être estimée par :

Ainsi en théorie :

Ainsi en pratique :

Pour le voir, il suffit de faire apparaître \(\alpha=g_3(t_{\alpha})\) dans les inégalités ci-dessus et d’effectuer un calcul direct. \(\ \square\)

Remarque 7. Pour réaliser le test \(\psi^{(3)}_{\infty}\) nous avons créé dans R deux procédures. La première Test3Asym2MoyeAppa qui permet de réaliser le test. La seconde Puis3Asym2MoyeAppa qui permet de calculer une estimation de la puissance asymptotique du test.

Exemple 2. Nous considérons les données de Sinistres. Nous notons \(X^{(1)}\) la v.a. «AGE du titulaire au moment du sinistre» et \(X^{(2)}\) la v.a. «PERM anciéneté du permis au moment du sinistre» ; ainsi la v.a. \(D\) correspond à l’âge d’acquisition du permis. Nous supposons que cette v.a. admet une variance théorique. Nous nous proposons de tester l’alternative :

Nous utilisons la procédure Test3Asym2MoyeAppa de la Remarque 7 ci-dessus. Après l’avoir compilée («sourcée» dans R), nous l’exécutons en indiquant les données à traiter Donnees[,1] et Donnees[,2], \(\delta_1=20,\ \delta_2=22\) et le seuil \(\alpha=0,01\) à utiliser, parce que \(n=356\).

Test3Asym2MoyeAppa (Donnees[,1],Donnees[,2],20,22,0.01), réponse :
Test asymptotique de l'alternative : H^{(3)}_0={ 20 ⩽ Delta_D ⩽ 22 } contre H^{(3)}_1={ Delta_D < 20 ou 22 < Delta_D}.

Premier échantillon, taille : 356 ; moyenne : 42.25 ; écart type : 11.77 .
Deuxième échantillon, taille : 356 ; moyenne : 18.52 ; écart type : 8.623 .
Moyenne observée des différences : 23.73 ; écart type observé des différences: 7.472 .

Seuil asymptotique du test : 0.01 ; solution de l'équation critique : 4.852 .
Estimation des valeurs critiques : 19.08 et 22.92 .

Décision : «H_1^{(3)} est vraie».

Estimation de la p-valeur : 6.225e-06 .

Le test est significatif ; le risque est inférieur à \(0,01\), nous faisons confiance à notre décision : la moyenne théorique de l’âge d’acquisition du permis n’est pas comprise entre \(20\) ans et \(22\) ans. A noter que l’estimation de la de l’approximation de la puissance asymptotique a posteriori ne s’affiche que si la moyenne observée est dans \({\cal H}_1^{(3)}\) et si la décision est «\({\cal H}^{(3)}_0\) est vraie». Nous pouvons estimer une approximation de la puissance asymptotique de ce test aux points \(\delta_D=23,73\) et \(\delta_D=19\) par exemple. Après avoir compilé («sourcée» dans R) la procédure correspondante de la Remarque 7 ci-dessus, nous l’exécutons en indiquant les données à traiter, \(\delta_1=20,\ \delta_2=22\), le seuil, \(\alpha=0,01\), à utiliser et \(\delta_D=23,73\) et \(\delta_D=19\) :

Puis3Asym2MoyeAppa(Donnees[,1],Donnees[,2],20,22,0.01,23.73), réponse : 0.9794 .
Puis3Asym2MoyeAppa(Donnees[,1],Donnees[,2],20,22,0.01,19), réponse : 0.5788 .

Nous traçons une estimation de l’approximation du graphique de la fonction puissance asymptotique. Voici les commandes que nous exécutons :

plot( function(Delta_D) Puis3Asym2MoyeAppa (Donnees[,1],Donnees[,2],20,22,0.01,Delta_D),18,24, xlab="Delta_D",
ylab="pu", ylim= c(0,1), main="Fig. 2. Approximation de la puissance\n asymptotique du test 3.", col="green4");
segments( x0=c(20,20,22,22,23.73,23.73,19,19), y0=c(0,0.01,0,0.01,0,0.9794,0,0.5788), x1=c(20,0,22,0,23.73,0,19,0),
y1=c(0.01,0.01,0.01,0.01,0.9794,0.9794,0.5788,0.5788), col="blue");
points( x=c(20,22,23.73,19), y=c(0.01,0.01,0.9794,0.5788), col="red", pch=".", cex=4);
réponse :

Estimation de la fonction puissance de l’Exemple 3.

Il est aisé de constater que le test est bien de seuil \(0,01\) et sans biais. Nous avons marqué en rouge les points de coordonnées \((\delta_1\ ;\ \alpha)=(20\ ;\ 0,01)\), \( (\delta_2\ ;\ \alpha)=(22\ ;\ 0,01),\ (\overline{d}\ ;\ \widehat{pu}_{\psi^{(3)}_{\infty}}(\overline{d})\approx(23.73\ ;\ 0,9794)\) et \((\delta_D\ ;\ \widehat{pu}_{\psi^{(3)}_{\infty}}(\delta_D))\approx(19\ ;\ 0,5788)\).\(\ \square\)

Haut de la page.