Nous avons déjà donné la définition générale d’intervalle de confiance. Dans ces pages nous présentons quelques méthodes de construction. L’outil fondamental que nous utilisons est le suivant.
Définition 1. Soit \(\alpha\in\rbrack 0\ ;\ 1\lbrack\). Nous appelons intervalle de prédiction d’une v.a. \(X\) de loi \({\cal L}(X)=P\), au seuil de confiance \(100(1-\alpha)\ \%\) ou au seuil de signification \(100 \alpha\ \%\), le plus petit intervalle de probabilité supérieure ou égale à \(1-\alpha\). Nous le notons \(I_{pred}(P\ ;\ \alpha)=\lbrack \underline{c}\ ;\ \overline{c}\rbrack\) et nous avons :
\[ P\left(\underline{c}\leq X \leq \overline{c}\right)=P\left(X \in I_{pred}(P\ ;\ \alpha)\right)\geq 1-\alpha. \]Interprétation. En théorie, pour \(\alpha\) petit, une observation de \(X\) doit être plus souvent dans l’intervalle de prédiction qu’à l’extérieur de celui-ci.
Remarque 1. Il y a deux manières de procéder pour la détermination d’un intervalle de prédiction. Soit à partir du mode de la v.a. en incluant les valeurs à gauche et à droite jusqu’à atteindre la probabilité souhaitée. Soit en réduisant à gauche et à droite l’ensemble des valeurs de \(X\). Nous décrivons ci-dessous la démarche.
Remarque 2. Si la loi a plusieurs modes, alors il se peut que nous ne puissons pas atteindre la probabilité \(1-\alpha\). L’exigence d’avoir un intervalle implique alors une probabilité supérieure au seuil de confiance. C’est le cas de l’inégalité dans la définition.
Remarque 3. Dans le cas continu nous atteignons en général le seuil. Dans le cas discret, seules les valeurs entières de l’intervalle sont concernées. Si la loi est symétrique, alors \(\underline{c}\) et \(\overline{c}\) sont de part et d’autre, à égale distance, du mode et :
\[ P(X < \underline{c})=P(\overline{c} < X)\leq \frac{\alpha}{2}. \]Très souvent, en pratique, nous nous contentons de cette approximation, même si la loi n’est pas symétrique.
Cas discret. Nous retenons les modalités en cumulant les probabilités jusqu’à ce que \(1-\alpha\) soit atteint ou dépassé pour la première fois. Si l’ensemble des modalités est fini, nous procédons par élimination des modalités dans l’ordre croissant des probabilités. Dans le cas contraire, à partir du mode de la distribition, nous retenons les modalités dans l’ordre décroissant des probabilités.
Exemple 1. Considérons la loi de Poisson \({\cal P}(1,5)\). Nous utilisons la procédure créée dans R PoissonInterPred. Après l’avoir compilée (sourcée), elle est exécutée en indiquant le paramètre de la loi et le seuil de signification de l’intervalle ; voici le résultat :
PoissonInterPred(1.5, 0.05) ;
réponse :
Intervalle de prédiction de la loi P( 1.5 ),
Seuil de l’intervalle : 5 %,
Intervalle : [ 0 ; 4 ].
Ainsi nous en déduisons que \(I_{pred}({\cal P}(1,5)\ ;\ 0,05)=\lbrack 0\ ;\ 4\rbrack\). \quad\square\)
Cas continu. La détermination d’un intervalle de prédiction est fondée sur le résultat suivant :
Propriété 1. Si \(f(x)\) désigne la densité de \(X\), v.a. unimodale, alors, si la densité est croissante puis décroissante, les bornes de \(I_{pred}(P_X\ ;\ \alpha)=\lbrack \underline{c}\ ;\ \overline{ c}\rbrack\) satisfont à l’égalité \(f(\underline{c})=f(\overline{c})\).
Pour le voir il suffit d’utiliser la méthode des multiplicateurs de Lagrange. Pour ce type de densité, nous utilisons l’algorithme suivant :
Exemple 2. Considérons la loi du Khi-deux \(\chi_9^2\) à \(9\) degrés de liberté. Nous utilisons la procédure créée dans R KhideuxInterPred. Après l’avoir compilée (sourcée), elle est exécutée en indiquant le degré de liberté de la loi et le seuil de signification de l’intervalle ; voici le résultat :
KhideuxInterPred(9, 0.05) ; réponse :
Intervalle de prédiction de la loi Khi-deux( 9 ),
Seuil de l'intervalle : 5 %,
Intervalle : [ 1.902587 ; 17.39227 ].
Ainsi nous en déduisons que \(I_{pred}(\chi_9^2\ ;\ 0,05)=\lbrack 1,902587\ ;\ 17,392266\rbrack\). \quad\square\)
Dans le cadre des paramètres des lois usuelles nous donnons des procédures dans R qui permettront le calcul d’intervalles de prédiction.
Haut de la page.