le logo du site

7. Tests classiques d’hypothèses.

7.5.2.b. Tests asymptotiques sur la différence des moyennes de deux v.a. indépendantes - Contre-hypothèses bilatérales.

Nous présentons des tests asymptotiques sur la différence des moyennes théoriques de deux v.a., notées \(X^{(1)}\) et \(X^{(2)}\), indépendantes et de lois inconnues. Ces tests ont des contre-hypothèses bilatérales. Comme pour l’estimation de la différence de deux moyennes théoriques, nous utilisons des méthodes asymptotiques générales, forcément approximatives. C’est pourquoi nous considérons des échantillons de taille au moins \(50\) et nous interprétons les résultats avec réserve.

Nous supposons que \(X^{(1)}\) et \(X^{(2)}\) admettent des variances théoriques inconnues, \({\mathbb V}ar\lbrack X^{(i)}\rbrack=\sigma^2_i<\infty\), et donc des moyennes théoriques \({\mathbb E}\lbrack X^{(i)}\rbrack=\mu_i<\infty\), pour \(i=1,\ 2\). Soit \(X_{\bullet}^{(i)}=(X_1^{(i)},\ \cdots,\ X_{n_i}^{(i)})\) un \(n_i\)-échantillon de \(X^{(i)},\ i=1,\ 2\). Les deux échantillons sont indépendants. Nous considèrons les statistiques :

la différence des moyennes et la variance de cette différence, empiriques. Nous notons :

Propriété 1. Sous l’hypothèse d’existence des variances \(\sigma_i^2,\ i=1,\ 2,\) nous avons les résultats suivants :

Nous avons noté \({\cal N}(0\ ;\ 1)\) la loi Normale Standard et \(\Phi\) sa f.r..

Le premier résultat a déjà été vu lors de la Propriété 3 de l’estimation de la différence de deux moyennes théoriques ; il est issu d’un calcul direct. Les trois suivants sont fondés sur la condition d’existence de \(\sigma^2_m\), la Propriété 1 de l’estimation de la différence de deux moyennes théoriques, le T.L.C. et la loi Faible des Grands Nombres. \(\ \square\)

Alternative 2.

Soit \(\delta_0\in{\mathbb R}\) donné et \(\alpha\in \rbrack 0\ ;\ 1\lbrack\) un seuil fixé. Pour tester l’alternative :

et les autres Alternatives 2, nous considérons le test asymptotique \(\psi^{(2)}_{\infty}(d_m)=1-I_{\lbrack c_1\ ;\ c_2\rbrack}(d_m)\), où \(c_1=\delta_0-q_{1-\frac{\alpha}{2}}\sigma_m\) et \(c_2=\delta_0+q_{1-\frac{\alpha}{2}}\sigma_m\) avec \(q_{1-\frac{\alpha}{2}}\) le quantile d’ordre \(1-\frac{\alpha}{2}\) de la loi \({\cal N}(0\ ;\ 1)\). Ainsi en théorie :

En estimant \(\sigma_m\) par \(S_m\), nous obtenons des estimations \(\widehat{c}_1=\delta_0-q_{1-\frac{\alpha}{2}}s_m\) et \(\widehat{c}_2=\delta_0+q_{1-\frac{\alpha}{2}}s_m\) de \(c_1\) et \(c_2\) respectivement. Ainsi en pratique :

Remarque 1. Si pour l’utilisateur décider à tort que la différence des moyennes théoriques de deux v.a. indépendantes et de lois inconnues n’est pas égale à une valeur donnée a les conséquences les plus défavorabes, c’est sur ce test \(\psi^{(2)}_{\infty}\) qu’il doit fonder sa démarche. Ce test est la limite du test \(\psi^{(3)}_{\infty}\), décrit ci-après, lorsque \(\delta_1=\delta_2=\delta_0\).

Propriété 2. Le test \(\psi^{(2)}_{\infty}\) possède les propriétés suivantes :

Des calculs simples sur la f.r. de la loi Normale Standard, l’appliquation de la Propriété 1 nous donnent ces résultats.\( \square\)

Remarque 2. Si nous avons observé \(D_m=d_m\), alors une approximation de la puissance a posteriori asymptotique est donnée par :

Son estimation est donnée par :

Remarque 3. La puissance est maximale lorsque la variance de la différence des moyennes est minimale. D’après la Propriété 1, i., en estimant \(\sigma_1\) et \(\sigma_2\) nous pouvons juger a posteriori ce qu’il en est pour la taille des échantillons observés.

Propriété 3. Si nous avons observé \(D_m=d_m\), la \(p-\)valeur du test est doonée par :

Ainsi en théorie :

Une estimation convergente de cette \(p-\)valeur est donnée par :

Ainsi en pratique :

Pour le voir, il suffit, dans les deux inégalités ci-dessus, de faire apparaître \(1-\dfrac{\alpha}{2}\) et d’utiliser les propriétés de \(\Phi\).\(\ \square\)

Remarque 4. Nous avons créé dans R deux procédures. La première Test2Asym2MoyeInde permet de réaliser le test \(\psi^{(2)}_{\infty}\). La seconde Puis2Asym2MoyeInde permet de calculer une estimation de l’approximation de la puissance de ce test.

Exemple 1. Nous considérons les données de Sinistres. Nous extrayons les objets RespNon0Mont contenant les observations «Coût du sinistre avec une part de responsabilité» et Resp0Mont contenant les observations «Coût du sinistre sans responsabilité». Nous supposons que les v.a. observées admettent une moyenne et une variance théorique et que leurs réalisations sont obtenues de manières indépendantes. Nous nous proposons de tester l’alternative :

Nous utilisons la procédure Test2Asym2MoyeInde de la Remarque 4 ci-dessus. Après l’avoir compilée («sourcée» dans R), nous l’exécutons en indiquant les données à traiter, \(\delta_0=500\) et le seuil \(\alpha=0,05\) à utiliser, parce que \(n_1=67\) et \(n_2=289\).

Test2Asym2MoyeInde (RespNon0Mont[,2],Resp0Mont[,2],500,0.05), réponse :
Test asymptotique de l'alternative : H^{(2)}_0={ Delta_m = 500 } contre H^{(2)}_1={ Delta_m non = 500 }.
Premier échantillon, taille : 67 ; moyenne : 764.1 ; écart type : 596.1 .
Deuxième échantillon, taille : 289 ; moyenne : 275.1 ; écart type : 517.5 .

Différence observée : 489 ; écart type observé de la différence : 78.93 .

Estimation des valeurs critiques : 345.3 et 654.7 .

La p-valeur du test est : 0.8892 .
Décision : «H^{(2)}_0 est vraie».

La puissance a posteriori du test est : 0.05223 .

Estimation des effectifs a posteriori donnant la puissance maximale :
Premier échantillon : 191 ; second échantillon : 165 .

Le test n’est pas significatif ; la puissance a posteriori est très faible, nous ne pouvons pas faire confiance à notre décision. La même conclusion s’obtient en comparant la \(p-\)valeur à \(0,05\). Remarquons que les estimations de l’écart type de chaque échantillon sont très élevées ; les coefficients de variation sont respectivement \( 78 \%\) et \(188 \%\). De plus les estimations des effectifs impliquant une puissance asymptotique maximale sont très différentes de celles observées dans la réalité. Comme la moyenne observée est, en général, différente de \(500\), l’approximation de l’estimation de la puissance a posteriori s’affiche ; elle très faible. Nous pouvons estimer l’approximation de l’estimation de la puissance de ce test aux points \(\delta_m=489\) et \(\delta_m=800\) par exemple. Après avoir compilé («sourcée» dans R) la procédure correspondante de la Remarque 4 ci-dessus, nous l’exécutons une première fois en indiquant les données à traiter, \(\delta_0=500,\ \alpha=0,05\) et \(\delta_m=489\) et une deuxième fois avec \(\delta_m=800\).

Puis2Asym2MoyeInde(RespNon0Mont[,2],Resp0Mont[,2],500,0.05,489), réponse : 0.05223
Puis2Asym2MoyeInde(RespNon0Mont[,2],Resp0Mont[,2],500,0.05,750)
, réponse : 0.9672.

Nous pouvons tracer une approximation du graphique de la fonction puissance avec la commande suivante :

plot( function(Delta) Puis2Asym2MoyeInde (RespNon0Mont[,2],Resp0Mont[,2],500,0.05,Delta),100,1000, xlab="Delta",
ylab="pu", ylim=c(0,1), main="Fig. 1. Approximation de la puissance\n asymptotique du test 2.", col="green4"),
segments( x0=c(500,500,489,489,800,800), y0=c(0,0.05,0,0.05223,0,0.9672), x1=c(500,0,489,0,800,0), y1=c(0.05,0.05,0.05223,0.05223,0.9672,0.9672), col="blue"))
points( x=c(500,489,800), y=c(0.05,0.05223,0.9672), col="red", pch=".", cex=7)
, réponse :

Fonction puissance de l’Exemple.

Le test est bien asymptotiquement de seuil \(0,05\) et sans biais. Nous avons marqué en rouge les points de coordonnées \((\delta_0\ ;\ \alpha)=(500\ ;\ 0,05)\), \((489\ ;\ \widehat{pu}_{\psi^{(2)}_{\infty}}(489))\approx(489\ ;\ 0,05223)\) et \((800\ ;\ \widehat{pu}_{\psi^{(2)}_{\infty}}(800))\approx(800\ ;\ 0,9672)\). \(\ \square\)

Alternative 3.

Soit \(\delta_1,\ \delta_2\in{\mathbb R}\), donnés tels que \(\delta_1 < \delta_2\) et \(\alpha\in \rbrack 0\ ;\ 1\lbrack\) un seuil fixé. Pour tester l’alternative :

ainsi que les Alternatives 3 associées, nous considérons le test asymptotique \(\psi^{(3)}_{\infty}(d_m)=1-I_{\lbrack c_1\ ;\ c_2\rbrack}(d_m)\) où \(c_1=\dfrac{\delta_1+\delta_2}{2}-t_{\alpha,n}\sigma_m\) et \(c_2=\dfrac{\delta_1+\delta_2}{2}+t_{\alpha,n}\sigma_m\) avec \(t_{\alpha,n}\) solution de l’équation critique en t :

Donc, en théorie :

En estimant \(\sigma_m\) par \(S_m\), nous obtenons des estimations \(\widehat{t}_{\alpha,n}\), solution de :

et \(\widehat{c}_1=\dfrac{\delta_1+\delta_2}{2}-\widehat{t}_{\alpha}s_m\) et \(\widehat{c}_2=\dfrac{\delta_1+\delta_2}{2}+\widehat{t}_{\alpha}s_m\). Ainsi en pratique :

Remarque 5. Si pour l’utilisateur décider à tort que la différence des moyennes théoriques de deux v.a. indépendantes et de lois inconnues n’est pas dans un intervalle donné a les conséquences les plus défavorabes, c’est sur ce test \(\psi^{(3)}_{\infty}\) qu’il doit fonder sa démarche. Ce test est la limite du test \(\psi^{(2)}_{\infty}\), décrit ci-avant, lorsque \(\delta_1=\delta_2=\delta_0\). De plus le test \(\psi^{(3)}_{\infty}\) au seuil \(\alpha\) est identique au test \(1-\psi^{(4)}_{\infty}\) au seuil \(1-\alpha\) défini pour les Alternatives 4. Le choix du test est fondamental.

Remarque 6. Pour tout \(\alpha\in \rbrack 0\ ;\ 1\lbrack\), la solution \(t_{\alpha,n}\) de l’équation \(g_3(t)=\alpha\) (resp. \(\widehat{t}_{\alpha,n}\) de l’équation \(\widehat{g}_3(t)=\alpha\)) existe et elle est unique. Pour le voir il suffit d’étudier les variations de la fonction \(g_3(t)\) (resp. \(\widehat{g}_3(t)\)) et d’utiliser les propriétés de \(\Phi\).

Propriété 4. Le test \(\psi^{(3)}_{\infty}\) possède les propriétés suivantes :

Une étude des variations de la fonction \(h_3(\delta_m)\), un calcul simple sur la f.r. de la loi Normale Standard, l’appliquation de la Propriété 1, ii. et iii. nous donnent ces résultats. \(\ \square\)

La Remarque 3. ci-avant concernant les effectifs impliquant une puissance maximale est encore valable pour le test \(\psi^{(3)}_{\infty}\).

Remarque 7. Si nous avons observé \(D_m=d_m\), alors une approximation de la puissance a posteriori et son estimation sont données, respectivement, par :

Propriété 5. Si nous avons observé \(D_m=d_m\), la \(p-\)valeur du test est donnée par :

Ainsi en théorie :

Une estimation de cette \(p-\)valeur est donnée par :

Ainsi en pratique :

Pour le voir, il suffit, dans les inégalités précédentes, de remplacer \(\alpha\) par \(g_3(t_{\alpha})\) et d’utiliser les propriétés de \(\Phi\). \(\ \square\)

Remarque 8. Nous avons créé deux procédures dans R. La première Test3Asym2MoyeInde qui permet de réaliser le test \(\psi^{(3)}_{\infty}\). La seconde Puis3Asym2MoyeInde, qui permet le calul d’une estimation de la puissance de ce test.

Exemple 2. Nous considérons les données de Sinistres. Nous extrayons les objets RespNon0Mont contenant les observations «Coût du sinistre avec une part de responsabilité» et Resp0Mont contenant les observations «Coût du sinistre sans responsabilité». Nous supposons que les v.a. observées admettent une moyenne et une variance théorique et que leurs réalisations sont obtenues de manières indépendantes. Nous nous proposons de tester l’alternative :

Nous utilisons la procédure Test3Asym2MoyeInde de la Remarque 8 ci-dessus. Après l’avoir compilée («sourcée» dans R), nous l’exécutons en indiquant les données à traiter, \(\delta_1=480,\ \delta_2=520\) et le seuil \(\alpha=0,05\) à utiliser, parce que \(n_1=67\) et \(n_2=289\).

Test3Asym2MoyeInde (RespNon0Mont[,2],Resp0Mont[,2],480,520,0.05), réponse :
Test asymptotique de l'alternative : H^{(3)}_0={ 480 ⩽ Delta_m ⩽520 } contre H^{(3)}_1={ Delta_m< 480 ou 520 < Delta_m}.
Premier échantillon, taille : 67 ; moyenne : 764.1 ; écart type : 596.1 .
Deuxième échantillon, taille : 289 ; moyenne : 275.1 ; écart type : 517.5 .

Différence observée : 489 ; écart type observé de la différence : 78.93 .

Seuil asymptotique du test : 0.05 ; solution de l'équation critique : 2.021 .
Estimation des valeurs critiques : 340.5 et 659.5 .

Estimation de la p-valeur : 0.6504

Décision : «H^{(3)}_0 est vraie».

Estimation des effectifs a posteriori donnant la puissance maximale :
Premier échantillon : 191 ; second échantillon : 165 .

Le test n’est pas significatif. La même conclusion s’obtient en comparant la \(p-\)valeur à \(0,05\). Les estimations des effectifs impliquant une puissance asymptotique maximale sont très différentes de celles observées dans la réalité. Nous pouvons estimer l’approximation de la puissance asymptotique de ce test aux points \(\delta_m=450\) et \(\delta_m=850\) par exemple. Après avoir compilé («sourcée» dans R) la procédure correspondante de la Remarque 8 ci-dessus, nous l’exécutons une première fois en indiquant les données à traiter, \(\delta_1=480,\ \delta_2=520,\ \alpha=0,05\) et \(\delta_m=450\) et une deuxième fois avec \(\delta_m=850\).

Puis3Asym2MoyeInde(RespNon0Mont[,2],Resp0Mont[,2],480,520,0.05,450), réponse : 0.08656;
Puis3Asym2MoyeInde(RespNon0Mont[,2],Resp0Mont[,2],480,520,0.05,850)
, réponse : 0.9921.

Nous pouvons tracer une estimation de l’approximation du graphique de la fonction puissance avec la commande suivante :

plot( function(Delta) Puis3Asym2MoyeInde (RespNon0Mont[,2],Resp0Mont[,2],480,520,0.05,Delta),200,900, xlab="Delta",
ylab="pu", ylim=c(0,1), main="Fig. 1. Approximation de la puissance\n asymptotique du test 3.", col="green4"),
segments( x0=c(480,480,520,520,450,450,850,850), y0=c(0,0.05,0,0.05,0,0.08656,0,0.9921), x1=c(480,0,520,0,450,0,850,0),
y1=c(0.05,0.05,0.05,0.05,0.08656,0.08656,0.9921,0.9921), col="blue"))
points( x=c(480,520,450,850), y=c(0.05,0.05,0.09431,0.993), col="red", pch=".", cex=7)
, réponse :

Fonction puissance de l’Exemple.

Le test est bien asymptotiquement de seuil \(0,05\) et sans biais. Nous avons marqué en rouge les points de coordonnées \((\delta_1\ ;\ \alpha)=(480\ ;\ 0,05)\), \((\delta_2\ ;\ \alpha)=(520\ ;\ 0,05)\), \((450\ ;\ \widehat{pu}_{\psi^{(3)}_{\infty}}(450))\approx(450\ ;\ 0,09431)\) et \((850\ ;\ \widehat{pu}_{\psi^{(3)}_{\infty}}(850))\approx(850\ ;\ 0,993)\).\(\ \square\)

Haut de la page.