Nous présentons des tests asymptotiques sur la différence des moyennes théoriques de deux v.a., notées
Nous supposons que
la différence des moyennes et la variance de cette différence, empiriques. Nous notons :
Propriété 1. Sous l’hypothèse d’existence des variances
Nous avons noté
Le premier résultat a déjà été vu lors de la
Propriété 3 de l’estimation de la différence de
deux moyennes théoriques ; il est issu d’un calcul direct. Les trois suivants sont fondés sur la condition d’existence de
Alternative 4.
Soit
ainsi que les Alternatives 4 associées, nous
considérons le test asymptotique
Donc, en théorie :
En général l’écart type
Ainsi en pratique :
Remarque 1. Si pour l’utilisateur décider à tort que la différence des moyennes théoriques de deux
v.a. indépendantes et de lois inconnues est dans un intervalle donné a les conséquences les plus
défavorabes, c’est sur ce test
Remarque 2. Pour tout
Propriété 2. Le test
Une estimation convergente de cette approximation est donnée par :
Une étude des variations de la fonction
Remarque 3. Si nous avons observé
Remarque 4. La puissance est maximale lorsque la variance de la différence des moyennes est minimale. D’après la
Propriété 1, i., en estimant
Propriété 3. Si nous avons observé
Ainsi en pratique :
Pour le voir, il suffit, dans les deux inégalités précédentes avant estimation, de remplacer
Remarque 5. Nous avons créé deux procédures dans R, la première
Test4Asym2MoyeInde qui permet de
réaliser le test
Exemple. Nous considérons les données de Sinistres. Nous extrayons les objets PermInf15Mont contenant les observations «Coût du sinistre avec une anciéneté de permis de moins de 15 ans» et PermSup15Mont contenant les observations «Coût du sinistre avec une anciéneté de permis de plus de 15 ans». Nous supposons que les v.a. observées admettent une moyenne et une variance théorique et que leurs réalisations sont obtenues de manières indépendantes. Nous nous proposons de tester l’alternative :
Nous utilisons la procédure Test4Asym2MoyeInde
de la Remarque 5 ci-dessus. Après l’avoir compilée («sourcée» dans R), nous l’exécutons en
indiquant les données à traiter,
Test4Asym2MoyeInde
(PermInf15Mont[,2],PermSup15Mont[,2],0,500,0.01), réponse :
Test asymptotique de l'alternative : H^{(4)}_0={ Delta_m ⩽ 0 ou 500 ⩽ Delta_m} contre H^{(4)}_1={ 0 < Delta_m < 500 }.
Premier échantillon, taille : 142 ; moyenne : 473.4 ; écart type : 667.8 .
Deuxième échantillon, taille : 214 ; moyenne : 296.6 ; écart type : 474.9 .
Différence observée : 176.8 ; écart type observé de la différence : 64.76 .
Seuil asymptotique du test : 0.01 ; solution de l'équation critique : 1.534 .
Estimation des valeurs critiques : 150.7 et 349.3 .
Décision : «H^{(4)}_1 est vraie».
Estimation de la p-valeur : 0.003168 .
Estimation des effectifs a posteriori donnant la puissance maximale :
Premier échantillon : 208 ; second échantillon : 148 .
Le test est significatif. La même conclusion s’obtient en comparant la
Puis4Asym2MoyeInde(PermInf15Mont[,2],PermSup15Mont[,2],0,500,0.01,176.8), réponse : 0.6529 ;
Puis4Asym2MoyeInde(PermInf15Mont[,2],PermSup15Mont[,2],0,500,0.01,275), réponse : 0.847.
Nous pouvons tracer une estimation du graphique de la fonction puissance avec la commande suivante :
plot(
function(Delta_m)
Puis4Asym2MoyeInde
(PermInf15Mont[,2],PermSup15Mont[,2],0,500,0.01,Delta_m),-20,520,
xlab="Delta",
ylab="pu",
xlim=c(-2,502),
ylim=c(0,1),
main="Fig. 1. Approximation de la puissance\n asymptotique
du test 4..",
col="green4"),
segments(
x0=c(0,0,500,500,275,275,176.8,176.8),
y0=c(0,0.01,0,0.01,0,0.847,0,0.6529),
x1=c(0,-20,500,-20,275,-20,176.8,-20),
y1=c(0.01,0.01,0.01,0.01,0.847,0.847,0.6529,0.6529),
col="blue"))
points(
x=c(0,500,275,176.8)
y=c(0.01,0.01,0.847,0.6529),
col="red",
pch=".",
cex=5), réponse :
Le test est bien asymptotiquement de seuil