Tests sur une proprtion théorique - alternatives intervalles finis.

7.5.4.c. Tests asymptotiques sur une proportion théorique - Contre-hypothèses intervalles finis.

Nous présentons des tests asymptotiques des Alternatives 4 pour une proportion théorique. Les tests exacts sont décrits dans l’étude des paramètres d’une loi de Bernoulli. Comme pour l’estimation d’une proportion théorique, nous utilisons des méthodes asymptotiques générales, forcément approximatimatives. Les risques et valeurs critiques sont établis pour \(n\rightarrow+\infty\), il est donc souhaitable d’avoir au moins \(50\) observations. Les résultats devront être interprétés avec réserve. Nous donnons un exemple.

Dans une population, nous considérons la proportion \(p\in \rbrack 0\ ;\ 1\lbrack\), inconnue, d’unités qui possèdent un caractère donné \({\cal C}\). Pour l’étude de la présence de \({\cal C}\), nous savons que le modèle le plus adapté est celui de Bernoulli \({\cal B}(1\ ;\ p)\). Si \(X\) est la v.a. indicatrice de la présence de \({\cal C}\) alors \(P(X=0)=1-p\), \(P(X=1)=p\), \({\mathbb E}\lbrack X\rbrack=p\) et \({\mathbb V}ar\lbrack X\rbrack=p(1-p)\). Soit \(X_{\bullet}=(X_1,\ \cdots,\ X_n)\) un \(n-\)échantillon de \(X\). Alors la somme \(\sum_{j=1}^nX_j\) correspond à l’effectif des unités de l’échantillon possédant le caractère \({\cal C}\) (nombre de «un») et la statistique moyenne empirique \(\overline{X}\) est la proportion ou encore la fréquence de \({\cal C}\) dans l’échantillon. C’est pour quoi nous notons \(\overline{X}=F_{\cal C}(X_{\bullet})=F_{\cal C}\) et une réalisation \(F_{\cal C}=f_{\cal C}\). Nous savons que \({\mathbb E}\lbrack F_{\cal C}\rbrack=p\) et que \({\mathbb V}ar\lbrack F_{\cal C}\rbrack=\dfrac{p(1-p)}{n}\).

Propriété 1. Nous avons les résultats suivants :

\(F_{\cal C}\overset{P}{\underset{n\rightarrow+\infty}\longrightarrow}p\).
\(\displaystyle\lim_{n\rightarrow +\infty} {\cal L}_p\left(\sqrt{n}\frac{F_{\cal C}-p}{\sqrt{p(1-p)}}\right)={\cal N}(0\ ;\ 1)\), c’est-à-dire \(\displaystyle \lim_{n\rightarrow +\infty}P_p\left(\sqrt{n}\frac{F_{\cal C}-p}{\sqrt{p(1-p)}}\leq t\right)=\Phi(t),\ \forall t\in {\mathbb R}\).

Nous avons noté \({\cal N}(0\ ;\ 1)\) la loi Normale Standard et \(\Phi\) sa f.r..

Ces résultats sont fondés sur la loi Faible des Grands Nombres et le T.L.C..\(\ \square\)

Alternative 4.

Soit \(p_1, p_2\in\rbrack 0\ ;\ 1\lbrack,\ p_1 < p_2\), donnés et \(\alpha\in \rbrack 0\ ;\ 1\lbrack\) un seuil fixé. Pour tester l’alternative :

\({\cal H}_0^{(4)}=\lbrace p\notin\rbrack p_1\ ;\ p_2\lbrack\rbrace\ \) contre \(\ {\cal H}_1^{(4)}=\lbrace p\in\rbrack p_1\ ;\ p_2\lbrack\rbrace\),

ainsi que toutes les Alternatives 4 associées, nous considérons le test asymptotique \(\psi^{(4)}_{\infty}(x_{\bullet})=I_{\rbrack c_1\ ;\ c_2\lbrack}(f_{\cal C})\) avec :

\(c_1=p_1+q_{1-\alpha}\sqrt{\dfrac{p_1(1-p_1)}{n}}\quad {\rm et}\quad c_2=p_2-q_{1-\alpha}\sqrt{\dfrac{p_2(1-p_2)}{n}},\)

où \(q_{1-\alpha}\) est le quantile d’ordre \(1-\alpha\) de la loi Normale standard. Ainsi :

si \(f_{\cal C} \in \rbrack c_1\ ;\ c_2\lbrack\), alors nous décidons «\({\cal H}_1^{(4)}\) est vraie» ;
si \(f_{\cal C} \notin \rbrack c_1\ ;\ c_2\lbrack\), alors nous décidons «\({\cal H}_0^{(4)}\) est vraie».

Conditions 4. Pour avoir une cohérence sur les valeurs critiques, nous admettons que la taille de l’échantillon a été fixée telle que :

\(\max\left(7\ ;\ q_{\alpha}\sqrt{\dfrac{1-p_1}{p_1}}\ ;\ q_{\alpha}\sqrt{\dfrac{p_2}{1-p_2}}\ ;\ \dfrac{q_{1-\alpha}}{p_2-p_1}\sqrt{p_2(1-p_2)+p_1(1-p_1)}\right) < \sqrt{n}\).

La première condition \(50 \leq n\) nous permet d’envisager l’approximation de le loi de la fréquence \(F_{\cal C}\) par une loi Normale. La deuxième condition \(q_{\alpha}\sqrt{\dfrac{1-p_1}{p_1}} <\sqrt{n}\) implique \(0 < c_1\) ; remarquons que cette condition est satisfaite pour tout \(n\) dés que \(0 < \alpha \leq 0,5\). La troisième condition \(q_{\alpha}\sqrt{\dfrac{p_2}{1-p_2}} <\sqrt{n}\) nous donne \(c_2 < 1\) ; cette condition est aussi satisfaite pour tout \(n\) dés que \(0 < \alpha \leq 0,5\). Enfin la dernière condition implique \(c_1<c_2\). Nous avons ainsi une cohérence pour le test et ses valeurs critiques.

Remarque 1. Si pour l’utilisateur décider à tort que la proportion des unités d’une population qui possèdent un caractère \(\cal C\) est comprise entre \(p_1\) et \(p_2\) a les conséquences les plus défavorables, c’est sur ce test \(\psi^{(4)}_{\infty}(X_{\bullet})\) qu’il doit fonder sa démarche.

Remarque 2. Le test \(\psi^{(4)}_{\infty}\), au seuil \(\alpha\), et le test \(1-\psi^{(3)}_{\infty}\), au seuil \(1-\alpha\), sont identiques.

Propriété 2. Le test \(\psi^{(4)}_{\infty}\) satisfait à :

Pour tout \(p\notin\rbrack p_1\ ;\ p_2\lbrack\), nous avons \(\displaystyle\lim_{n\rightarrow +\infty}{\mathbb E}_p\lbrack\psi^{(4)}_{\infty}(X_{\bullet})\rbrack \leq \displaystyle\lim_{n\rightarrow +\infty}{\mathbb E}_{p_1}\lbrack\psi^{(4)}_{\infty}(X_{\bullet})\rbrack= \displaystyle\lim_{n\rightarrow +\infty}{\mathbb E}_{p_2}\lbrack\psi^{(4)}_{\infty}(X_{\bullet})\rbrack=\alpha\) ; le test est asymptotiquement de seuil \(\alpha\).
Pour tout \(p\in\rbrack p_1\ ;\ p_2\lbrack\), nous avons \(\alpha\leq \displaystyle\lim_{n\rightarrow +\infty}{\mathbb E}_p\lbrack\psi^{(4)}_{\infty}(X_{\bullet})\rbrack\) ; le test est asymptotiquement sans biais à ce seuil.
Pour tout \(p\in\rbrack 0\ ;\ 1\lbrack\), une approximation de la fonction puissance est donnée par
\(pu_{\psi^{(4)}_{\infty}}(p)\approx\Phi\left(\sqrt{n}\dfrac{p_2-p}{\sqrt{p(1-p)}}-q_{1-\alpha}\sqrt{\dfrac{p_2(1-p_2)}{p(1-p)}}\right)- \Phi\left(\sqrt{n}\dfrac{p_1-p}{\sqrt{p(1-p)}}+q_{1-\alpha}\sqrt{\dfrac{p_1(1-p_1)}{p(1-p)}}\right)\).

La Propriété 1. et des calculs simples sur la f.r. de la loi Normale Standard, nous donnent ces résultats.\(\ \square\)

Remarque 3. Si nous avons observé \(F_{\cal C}=f_{\cal C}\), une approximation de la puissance a posteriori est donnée par :

\(pu_{\psi^{(4)}_{\infty}}(f_{\cal C})\approx\Phi\left(\sqrt{n}\dfrac{p_2-f_{\cal C}}{\sqrt{f_{\cal C}(1-f_{\cal C})}}-q_{1-\alpha}\sqrt{\dfrac{p_2(1-p_2)}{f_{\cal C}(1-f_{\cal C})}}\right)- \Phi\left(\sqrt{n}\dfrac{p_1-f_{\cal C}}{\sqrt{f_{\cal C}(1-f_{\cal C})}}+q_{1-\alpha}\sqrt{\dfrac{p_1(1-p_1)}{f_{\cal C}(1-f_{\cal C})}}\right).\)

Propriété 3. Si nous avons observé \(F_{\cal C}=f_{\cal C}\), la \(p-\)valeur du test est

\(p_{val}=\max\left\lbrace\Phi\left(\sqrt{n}\dfrac{p_1-f_{\cal C}}{\sqrt{p_1(1-p_1)}}\right)\ ;\ \Phi\left(\sqrt{n}\dfrac{f_{\cal C}-p_2}{\sqrt{p_2(1-p_2)}}\right)\right\rbrace.\)

Ainsi :

si \(p_{val} < \alpha\), nous décidons «\({\cal H}_1^{(4)}\) est vraie»
si \(\alpha \leq p_{val}\), nous décidons «\({\cal H}_0^{(4)}\) est vraie».

Pour le voir, il suffit de faire apparaître \(\alpha=\Phi(-q_{1-\alpha})\) dans les inégalités ci-dessus et d’effectuer un calcul direct. \(\ \square\)

Remarque 4. Pour réaliser le test \(\psi^{(4)}_{\infty}\) nous avons créé dans R quatre procédures. Les deux premières Test4Asym1Prop et Test4Asym1Prop_Int qui permettent la réalisation du test 4 avec exécution non interactive et interactive, respectivement. Les deux dernières Puis4Asym1Prop et Puis4Asym1Prop_Int permettent le calcul d’une approximation de la fonction puissance asymptotique du test 4 avec exécution non interactive et interactive, respectivement.

Exemple . Un cabinet d’expertise met en place un contrôle statistique de conformité concernant les pièces d’un lot produit par une usine. Ce lot est conforme si la proportion théorique des pièces défectueuses n’est pas comprise entre \(0,5\%\) et \(7,5\%\). Nous admettons que la situation la plus défavorable pour le cabinet est celle de décider à tort que le lot n’est pas conforme. Donc nous nous proposons de tester l’alternative :

\({\cal H}_0^{(4)}=\lbrace p\notin\rbrack 0,005\ ;\ 0,075\lbrack\rbrace\quad\) contre \(\quad{\cal H}_1^{(4)}=\lbrace p\in\rbrack 0,005\ ;\ 0,075\lbrack\rbrace\),

Nous constatons que, sur \(210\) pièces choisies au hasard dans le lot, il y a \(3\) pièces non conformes. Nous fixons un seuil à \(0,01\) et nous exécutons, après les avoir compilées («sourcée» dans R), les procédures de la Remarque 4 ci-dessus. La procédure non interactive nous donne :

Test4Asym1Prop(3,210,.005,.075,.01), réponse :

Test asymptotique de l’alternative : H_0^{(4)}={p⩽0.005 ou bien 0.075⩽p} contre H_1^{(4)}={ 0.005 <p<0.075 }.
Condition de cohérence du test : 144 .
Taille de l’échantillon : 210 ; nombre de "un" : 3 ; proportion observée : 0.01429 .
Seuil asymptotique du test : 0.01 ; valeurs critiques : 0.01632 et 0.03272 .

La p-valeur du test est : 0.02821 .
Décision : «H_0^{(4)}={p⩽0.005 ou bien 0.075⩽p} est vraie».

La puissance asymptotique a posteriori est : 0.3896 .

La procédure interactive, quant à elle, nous donne :

Test4Asym1Prop_Int(), réponse :
Saisir le nombre de «un» : 3, réponse :
Saisir la taille de l’échantillon : 210, réponse :
Saisir la proportion P1 : .005, réponse :
Saisir la proportion P2 : .075, réponse :
Saisir le seuil du test : .01, réponse : le résultat est strictement identique à celui du mode non interactif.

Le test n’est pas significatif ; étant donné la puissance a posteriori, nous pouvons avoir modérément confiance en notre décision. Il faudrait, en principe, augmenter la taille de l’échantillon. Nous pouvons estimer la puissance de ce test au point \(p=0,01429\) et \(p=0,04\) par exemple. Après avoir compilé («sourcé») les procédures correspondantes de la Remarque 4 ci-dessus, nous les exécutons en indiquant les données \(N=210,\ p_1=0,005,\ p_2=0,075,\ Seuil=0,01,\ p=0,01429\) et \(p=0,04\) à utiliser. La procédure non interactive donne :

Puis4Asym1Prop(210,.005,.075,.01,0.01429), réponse : 0.3898 .
Puis4Asym1Prop(210,.005,.075,.01,0.04), réponse : 0.2551 .

La procédure interactive, quant à elle, nous donne :

Puis4Asym1Prop_Int(), réponse :
Saisir la taille de l'échantillon : 210, réponse :
Saisir la proportion P1 : .005, réponse :
Saisir la proportion P2 : .075, réponse :
Saisir Saisir seuil du test : .01, réponse :
Saisir le point P où calculer une estimation de la puissance : .04, réponse : le résultat est strictement identique à celui du mode non interactif.

Nous pouvons également tracer le graphique d’une approximation de la fonction puissance asymptotique du test avec les commandes suivantes :

plot( function(P) Puis4Asym1Prop(210,.005,.075,.01,P),.0,.09, xlab="p",
ylab="pu", ylim= c(0,.6), main="Fig. Approximation de la puissance\n asymptotique Test 4.", col="green4");
x0=c(.005,.075,.075,0.01429,.01429,.04,.04); y0=c(0,0,0.01,0,.3898,0,.2551);
x1=c(0.04,0,0.04286,0,0.1,0); y1=c(.01,.01,.01,.3898,.3898,.2551,.2551);
segments(x0,y0,x1,y1, col="blue");
points( x=c(.005,.075,.01429,.04), y=c(.01,.01,.3898,.2551), col="red", pch='.', cex=8), réponse :

Nous avons marqué en rouge les points de coordonnées \((p_1\ ;\ \alpha)=(0,005\ ;\ 0,01)\), \((p_2\ ;\ \alpha)=(0,075\ ;\ 0,01)\), \((0,01429\ ;\ pu_{\psi^{(4)}_{\infty}}(0,01429))\approx(0,01429\ ;\ 0,3828)\) et \((0, 4\ ;\ pu_{\psi^{(4)}_{\infty}}(0,04))\approx(0,04\ ;\ 0,2551)\). Nous constatons, entre autres, que le test est asymptotiquement de seuil \(0,01\) et sans biais. \(\ \square\)

Haut de la page.

7. Tests classiques d’hypothèses.

7. Tests classiques d’hypothèses.

7.5.4.c. Tests asymptotiques sur une proportion théorique - Contre-hypothèses intervalles finis.