Nous présentons des tests asymptotiques des Alternatives 1a et Alternatives 1b pour une proportion théorique. Les tests exacts sont décrits dans l’étude des paramètres d’une loi de Bernoulli. Comme pour l’estimation d’une proportion théorique, nous utilisons des méthodes asymptotiques générales, forcément approximatimatives. Les risques et valeurs critiques sont établis pour \(n\rightarrow+\infty\), il est donc souhaitable d’avoir au moins \(50\) observations. Les résultats devront être interprétés avec réserve. Dans chaque cas nous donnons un exemple.
Dans une population, nous considérons la proportion \(p\in \rbrack 0\ ;\ 1\lbrack\), inconnue, d’unités qui possèdent un caractère donné \({\cal C}\). Pour l’étude de la présence de \({\cal C}\), nous savons que le modèle le plus adapté est celui de Bernoulli \({\cal B}(1\ ;\ p)\). Si \(X\) est la v.a. indicatrice de la présence de \({\cal C}\) alors \(P(X=0)=1-p\), \(P(X=1)=p\), \({\mathbb E}\lbrack X\rbrack=p\) et \({\mathbb V}ar\lbrack X\rbrack=p(1-p)\). Soit \(X_{\bullet}=(X_1,\ \cdots,\ X_n)\) un \(n-\)échantillon de \(X\). Alors la somme \(\sum_{j=1}^nX_j\) correspond à l’effectif des unités de l’échantillon possédant le caractère \({\cal C}\) (nombre de «un») et la statistique moyenne empirique \(\overline{X}\) est la proportion ou encore la fréquence de \({\cal C}\) dans l’échantillon. C’est pour quoi nous notons \(\overline{X}=F_{\cal C}(X_{\bullet})=F_{\cal C}\) et une réalisation \(F_{\cal C}=f_{\cal C}\). Nous savons que \({\mathbb E}\lbrack F_{\cal C}\rbrack=p\) et que \({\mathbb V}ar\lbrack F_{\cal C}\rbrack=\dfrac{p(1-p)}{n}\).
Propriété 1. Nous avons les résultats suivants :
Nous avons noté \({\cal N}(0\ ;\ 1)\) la loi Normale Standard et \(\Phi\) sa f.r..
Ces résultats sont fondés sur la loi Faible des Grands Nombres et le T.L.C..\(\ \square\)
Alternative 1a.
Soit \(p_0\in\rbrack 0\ ;\ 1\lbrack\) donné et \(\alpha\in \rbrack 0\ ;\ 1\lbrack\) un seuil fixé. Pour tester l’alternative :
ainsi que les autres Alternatives 1a associées, nous considérons le test asymptotique \(\psi^{(1a)}_{\infty}(x_{\bullet})=I_{\rbrack c\ ;\ 1\lbrack}(f_{\cal C})\), avec \( c=c_{1a}=p_0+q_{1-\alpha}\sqrt{\dfrac{p_0(1-p_0)}{n}}\) ; le nombre \(q_{1-\alpha}\) est le quantile d’ordre \(1-\alpha\) de la loi \({\cal N}(0\ ;\ 1)\). Ainsi :
Condition 1a. Pour avoir une cohérence sur la valeur critique, nous admettons que la taille de l’échantillon a été fixée telle que :
La première condition \(50 \leq n\) nous permet d’envisager l’approximation de le loi de la fréquence \(F_{\cal C}\) par une loi Normale. La deuxième condition \(q_{1-\alpha}\sqrt{\dfrac{p_0}{1-p_0}} <\sqrt{n}\) implique pour la valeur critique, \(c < 1\). Enfin la troisième condition \(q_{\alpha}\sqrt{\dfrac{1-p_0}{p_0}} <\sqrt{n}\) nous donne \(0 < c\). Nous avons ainsi une cohérence pour le test.
Remarque 1. Si pour l’utilisateur décider à tort que la proportion de la population qui possède le caractère \({\cal C}\) est supérieure à une valeur fixée \(p_0\) a les conséquences les plus défavorables, c’est sur ce test \(\psi^{(1a)}_{\infty}(F_{\cal C})\) qu’il doit fonder sa démarche.
Remarque 2. Nous avons l’équivalence entre les alternatives :
Le test \(\psi^{(1b)}_{\infty}\) correspondant à la deuxième alternative précédente sera étudié ci-après. Pour les tests nous avons :
Le nombre \(1-p\) est la proportion d’unités dans la population qui ne possèdent pas \({\cal C}\) et \(1-F_{\cal C}\) leur fréquence dans l’échantillon. Notons enfin que pour les alternatives :
le test \(\psi^{(1a)}_{\infty}\), au seuil \(\alpha\), et le test \(1-\psi^{(1b)}_{\infty}\), au seuil \(1-\alpha\), sont identiques.
Propriété 2. Le test \(\psi^{(1a)}_{\infty}\) satisfait à :
La Propriété 1. et des calculs simples sur la f.r. de la loi Normale Standard, nous donnent ces résultats.\(\ \square\)
Remarque 3. Si nous avons observé \(F_{\cal C}=f_{\cal C}\), une approximation de la puissance a posteriori du test est : \(pu_{\psi^{(1a)}_{\infty}}(f_{\cal C})\approx 1-\Phi\left(\sqrt{n}\dfrac{p_0-f_{\cal C}}{\sqrt{f_{\cal C}(1-f_{\cal C})}}+q_{1-\alpha}\sqrt{\dfrac{p_0(1-p_0)}{f_{\cal C}(1-f_{\cal C})}}\right).\)
Propriété 3. Si nous avons observé \(F_{\cal C}=f_{\cal C}\), la \(p-\)valeur du test \(\psi^{(1a)}_{\infty}\) est \(p_{val}=1-\Phi\left(\sqrt{n}\dfrac{f_{\cal C}-p_0}{\sqrt{p_0(1-p_0)}}\right)\). Ainsi :
Pour le voir il suffit, en remplaçant \(1-\alpha\) par \(\Phi(q_{1-\alpha})\), de montrer que les inégalités sur la \(p_{val}\) conduisent aux mêmes décisions que celles de la définition de \(\psi^{(1a)}_{\infty}.\ \square\)
Remarque 4. Pour réaliser le test \(\psi^{(1a)}_{\infty}\) nous avons créé dans R quatre procédures. Les deux premières Test1aAsym1Prop et Test1aAsym1Prop_Int qui permettent la réalisation du test 1a avec exécution non interactive et interactive, respectivement. Les deux dernières Puis1aAsym1Prop et Puis1aAsym1Prop_Int permettent le calcul d’une approximation de la fonction puissance asymptotique du test 1a avec exécution non interactive et interactive, respectivement.
Exemple 1. Nous reprenons le même exemple que celui du test exact correspondant. Une entreprise doit livrer un lot de pièces. Un contrôle statistique de conformité est mis en place. Le lot est conforme si moins de \(4 \%\) des pièces sont défectueuses. Nous admettons que la situation la plus défavorable pour le livreur est celle de décider à tort que le lot n’est pas conforme. Donc nous nous proposons de tester l’alternative :
Nous dénombrons, sur \(70\) pièces choisies au hasard dans le lot, \(3\) pièces non conformes. Nous fixons un seuil à \(0,05\) et nous exécutons, après les avoir compilées («sourcée» dans R), les procédures de la Remarque 4 ci-dessus.
Test1aAsym1Prop(3,70,.04,.05), réponse :
Test asymptotique de l’alternative : H0(1a)={ p ⩽ 0.04 } contre H1(1a)={ 0.04 < p }.
Condition de cohérence du test : 64 .
Taille de l’échantillon : 70 ; nombre de «un» : 3 ; proportion observée : 0.04286 .
Seuil asymptotique du test : 0.05 ; approximation de la valeur critique : 0.07853 .
P-valeur du test 1a : 0.4515 .
Décision : «H0(1a)={ p ⩽ 0.04 } est vraie».
Une approximation de la puissance asymptotique a posteriori est : 0.07032 .
La procédure interactive donne quant à elle :
Test1aAsym1Prop_Int(), réponse :
Saisir le nombre de «un» : 3, réponse :
Saisir la taille de l’échantillon : 70, réponse :
Saisir la proportion P0 : .04, réponse :
Saisir seuil du test : .05, réponse :
les mêmes résultats que ceux de la procédure non interactive sont alors affichés.
Nous constatons que le nombre d’observations implique une valeur critique cohérente. La décision est «\({\cal H}_0^{(1a)}\) est vraie». Le test n’est pas significatif. Nous avons les mêmes conclusions que le test exact. La puissance asymptotique a posteriori est très faible : 0,07032. Il n’y a aucune raison objective de ne pas livrer le lot ; mais la décision est risquée. Pour être plus sûrs il faudrait refaire un échantillonnage. Nous pouvons calculer une approximation de la puissance asymptotique pour les points \(p=0,04286\) et \(p=0.1\) par exemple. Nous exécutons, après les avoir compilées («sourcée» dans R), les procédures de la Remarque 4 ci-dessus.
Puis1aAsym1Prop(70,0.04,0.05,0.04286), réponse : 0.07034 .
Puis1aAsym1Prop(70,0.04,0.05,0.1), réponse : 0.7254 .
La procédure interactive donne quant à elle :
Puis1aAsym1Prop_Int(), réponse :
Saisir la taille de l’échantillon : 70, réponse :
Saisir la proportion P0 : .04, réponse :
Saisir seuil du test : .05, réponse :
Saisir le point P où calculer une approximation de la puissance asymptotique : 0.1, réponse : 0.7254 .
La puissance obtenue est approximative même si elle est supérieure à celle du test exact ; c’est cette dernière qui est prépondérante. Nous pouvons également tracer le graphique d’une approximation de la fonction puissance asymptotique du test avec les commandes suivantes :
plot(
function(p)
Puis1aAsym1Prop(70,0.04,0.05,P), 0, 0.13,
xlab="p",
ylab="pu",
ylim=
c(0,1),
main=Approximation de la puissance\n asymptotique du test 1a.",
col="green4");
x0=c(0.04,0.04,0.04286,0.04286,0.1,0.1);
y0=c(0,0.05,0,0.07034,0,.7254);
x1=c(0.04,0,0.04286,0,0.1,0);
y1=c(0.05,0.05,0.07034,0.07034,0.7254,0.7254);
segments(x0,y0,x1,y1,
col="blue");
points(
x=c(0.04,0.04286,0.1),
y=c(0.05,0.07034,0.7254),
col="red",
pch='.',
cex=8), réponse :
Le graphique a l’allure générale de la puissance des tests 1a. Nous avons marqué en rouge les points de coordonnées \((p_0\ ;\ \alpha)=(0,04\ ;\ 0,05)\), \((0,04286\ ;\ pu_{\psi^{(1b)}_{\infty}}(0,04286))\approx(0,04286\ ;\ 0,07034)\) et \((0,1\ ;\ pu_{\psi^{(1b)}_{\infty}}(0,1))\approx(0,1\ ;\ 0,7254)\). Nous constatons, entre autres, que le test est asymptotiquement de seuil \(0,05\) et sans biais. \(\ \square\)
Alternative 1b.
Soit \(p_0\in\rbrack 0\ ;\ 1\lbrack\) donné et \(\alpha\in \rbrack 0\ ;\ 1\lbrack\) un seuil fixé. Pour tester l’alternative :
ainsi que les autres Alternatives 1b associées, nous considérons le test asymptotique \(\psi^{(1b)}_{\infty}(x_{\bullet})=I_{\rbrack 0\ ;\ c\lbrack}(f_{\cal C})\), avec \(c=c_{1b}=p_0+q_{\alpha}\sqrt{\dfrac{p_0(1-p_0)}{n}}\) ; le nombre \(q_{\alpha}\) est le quantile d’ordre \(\alpha\) de la loi \({\cal N}(0\ ;\ 1)\). Ainsi :
Condition 1b. Pour avoir une cohérence sur la valeur critique, nous admettons que la taille de l’échantillon a été fixée telle que :
La première condition \(50 \leq n\) nous permet d’envisager l’approximation de le loi de la fréquence \(F_{\cal C}\) par une loi Normale. La deuxième condition \(q_{\alpha}\sqrt{\dfrac{p_0}{1-p_0}} <\sqrt{n}\) implique pour la valeur critique, \(c < 1\). Enfin la troisième condition \(q_{1-\alpha}\sqrt{\dfrac{1-p_0}{p_0}} <\sqrt{n}\) nous donne \(0 < c\). Nous avons ainsi une cohérence pour le test.
Remarque 5. Si pour l’utilisateur décider à tort que la proportion de la population qui possède le caractère \({\cal C}\) est inférieure à une valeur fixée \(p_0\) a les conséquences les plus défavorables, c’est sur ce test \(\psi^{(1b)}_{\infty}(F_{\cal C})\) qu’il doit fonder sa démarche.
Remarque 6. Nous avons l’équivalence entre les alternatives :
Le test \(\psi^{(1a)}_{\infty}\) correspondant à la deuxième alternative précédente a été étudié ci-avant. Pour les tests nous avons :
Le nombre \(1-p\) est la proportion d’unités dans la population qui ne possèdent pas \({\cal C}\) et \(1-F_{\cal C}\) leur fréquence dans l’échantillon. Notons que pour les alternatives :
e test \(\psi^{(1b)}_{\infty}\), au seuil \(\alpha\), et le test \(1-\psi^{(1a)}_{\infty}\), au seuil \(1-\alpha\), sont identiques.
Propriété 4. Le test \(\psi^{(1b)}_{\infty}\) satisfait à :
La Propriété 1. et des calculs simples sur la f.r. de la loi Normale Standard, nous donnent ces résultats.\(\ \square\)
Remarque 7. Si nous avons observé \(F_{\cal C}=f_{\cal C},\) une approximation de la puissance asymptotique a posteriori du test est
\(pu_{\psi^{(1b)}_{\infty}}(f_{\cal C})\approx \Phi\left(\sqrt{n}\dfrac{p_0-f_{\cal C}}{\sqrt{f_{\cal C}(1-f_{\cal C})}}+q_{\alpha}\sqrt{\dfrac{p_0(1-p_0)}{f_{\cal C}(1-f_{\cal C})}}\right)\)
Propriété 5. Si nous avons observé \(F_{\cal C}=f_{\cal C}\), la \(p-\)valeur du test \(\psi^{(1b)}_{\infty}\) est \(p_{val}=\Phi\left(\sqrt{n}\dfrac{f_{\cal C}-p_0}{\sqrt{p_0(1-p_0)}}\right)\). Ainsi :
Pour le voir il suffit, en remplaçant \(\alpha\) par \(\Phi(q_{\alpha})\), de montrer que les inégalités sur la \(p_{val}\) conduisent aux mêmes décisions que celles de la définition de \(\psi^{(1b)}_{\infty}.\ \square\)
Remarque 8. Nous avons créé dans R les procédures. Les deux premières Test1bAsym1Prop_Int et Test1bAsym1Prop permettent la réalisation du test \(\psi^{(1b)}_{\infty}\), avec exécution interactive et non interactive respectivement. Les deux autres Puis1bAsym1Prop_Int et Puis1bAsym1Prop permettent le calcul d’une approximation de la puissance asymptotique du test, avec exécution interactive et non interactive respectivement.
Exemple 2. Une entreprise doit recevoir un lot de pièces. Un contrôle statistique de conformité est mis en place. Le lot est conforme si moins de \(4 \%\) des pièces sont défectueuses. Nous admettons que la situation la plus défavorable pour le receveur est celle de décider à tort que le lot est conforme. Donc nous nous proposons de tester l’alternative :
Nous constatons que, sur \(70\) pièces choisies au hasard dans le lot, il y a \(3\) pièces non conformes. Nous fixons un seuil à \(0,05\) et nous exécutons, après les avoir compilées («sourcée» dans R), les procédures de la Remarque 8 ci-dessus.
Test1bAsym1Prop(3,70,0.04,0.05), réponse :
Test asymptotique de l'alternative : H0(1b)={ 0.04 ⩽ p } contre H1(1b)={ p < 0.04 }.
Condition de cohérence du test : 81 .
Taille de l'échantillon : 70 ; nombre de «un» : 3 ; proportion observée : 0.04286 .
Seuil asymptotique du test : 0.05 ; approximation de la valeur critique : 0.001475 .
P-valeur : 0.5485 .
Décision : «H0(1b)={ p ⩾ 0.04 } est vraie».
La procédure interactive, quant à elle, nous donne :
Test1bAsym1Prop_Int(), réponse :
Saisir le nombre de «un» : 3, réponse :
Saisir la taille de l'échantillon : 70, réponse :
Saisir la proportion P0 : .04, réponse :
Saisir le seuil du test : .05, réponse :
Les mêmes résultats que ceux de la procédure non interactive sont alors affichés.
Notons qu’il manque 11 observations pour une cohérence de la valeur critque. Le test n’est pas significatif. Il n’y a aucune raison objective pour refuser le lot. Mais, comme nous le consterons ci-après, la puissance asymptotique a posteriori est très faible ; nous ne pouvons pas avoir confiance en cette décision. Il faidrait refaire un échantillonnage. Remarquons que la puissance a posteriori ne s’affiche que si la proportion observée est dans \({\cal H}_1^{(1b)}\) et si la décision est \({\cal H}_0^{(1b)}\) est vraie ; ici \(f_{\cal C}=0,04286\) est très légérement supérieure à \(p_0=0,04\). Nous pouvons calculer une approximation de la puissance asymptotique du test aux points \(p=0,04286\) et \(p=0,02\) par exemple. Après avoir compilé («sourcée» dans R), les procédures correspondantes de la Remarque 8 ci-dessus, nous les exécutons en indiquant les données \(N=70,\ p_0=0,04,\ Seuil=0,05,\ p=0,04286\) une première fois \(p=0,02\) une seconde fois. La procédure non interactive donne :
Puis1bAsym1Prop
(70,0.04,0.05,0.04286), réponse :0.04368 .
Puis1bAsym1Prop
(70,0.04,0.05,0.02), réponse : 0.1341 .
La puissance obtenue est approximative même si elle est supérieure à celle du test exact ; c’est cette dernière qui est prépondérante. Nous pouvons également tracer le graphique d’une approximation de la fonction puissance asymptotique du test avec les commandes suivantes :
La procédure interactive, quant à elle, nous donne :
Puis1bAsym1Prop_Int
(), réponse :
Saisir la taille de l'échantillon : 70, réponse :
Saisir la proportion P0 : .04, réponse :
Saisir Saisir seuil du test : .05, réponse :
Saisir le point P où calculer une estimation de la puissance : .02, réponse : 0.1341 .
Les commandes suivantes permettent de créer le graphique d’approximation de la puissance asymptotique du test.
plot(
function(P)
Puis1bAsym1Prop(70,0.04,0.05,P),0.0,0.1,
xlab="p",
ylab="pu",
ylim=c(0,0.2),
main="Fig. 2. Approximation de la puissance\n asymptotique du test 1b.",
col="green4");
x0=c(0.04,0.04,0.04286,0.04286,0.02,0.02);
y0=c(0,0.05,0,0.04368,0,.1341);
x1=c(0.04,0,0.04286,0,0.02,0);
y1=c(0.05,0.05,0.04368,0.04368,0.1341,0.1341);
segments(x0,y0,x1,y1,
col="blue");
points(
x=c(0.04,0.04286,0.02),
y=c,(0.05,0.04368,0.1341)
col="red",
pch=".",
cex=8);, réponse :
Nous avons marqué en rouge les points dont les coordonnées sont \((p_0\ ;\ \alpha)=(0,04\ ;\ 0,05)\), \((0,02\ ;\ pu_{\psi^{(1b)}_{\infty}}(0,02))\approx(0,02\ ;\ 0,0.1341)\) et \((0,04286\ ;\ pu_{\psi^{(1b)}_{\infty}}(0,04286))\approx(0,04286\ ;\ 0,0.4368)\). Nous constatons, entre autres, que le test est asymptotiquement de seuil \(0,05\) et sans biais. \(\ \square\)
Haut de la page.