le logo du site

4. Lois théoriques usuelles.

4.1.2. Lois Binomiales.

Nous présentons la loi fondamentale dans l’étude d’une proportion. Elle trouve son application la plus concrète dans le contrôle industriel de fabrication.

Propriété 1. Considérons \(n\) v.a. indicatrices \(I_1,\ \cdots,\ I_n\) indépendantes et de même loi de Bernoulli \({\cal B}(1\ ;\ p)\), avec \(p\in \lbrack 0\ ;\ 1\rbrack\). Alors la loi de la v.a. \(X=\displaystyle\sum_{j=1}^n I_j\) est donnée par :

\[ P(X=k)=\frac{n!}{k!(n-k)!}p^k(1-p)^{n-k}, \]

pour \(k=0,\ 1,\cdots ,\ n\).

Définition 1. La loi d’une v.a. \(X\) satisfaisant à la propriété précédente est appelée loi binomiale de paramètres \(n\in {\mathbb N}\) et \(p\in \lbrack 0,\ 1\rbrack\). Nous notons \({\cal L}(X)={\cal B}(n\ ;\ p)\).

Modélisation. Supposons que dans un ensemble une proportion \(p\) d’unités possèdent une caractéristique \({\cal C}\). Nous tirons au hasard \(n\) unités avec remise, c’est-à-dire qu’après avoir observé une unité, celle-ci est remise dans l’ensemble des unités avant le tirage de l’unité suivante ; ainsi au moment du tirage de chaque unité, la proportion de celles qui possèdent la caractéristique \({\cal C}\) est toujours égale à \(p\). Le tirage ainsi défini nous permet la réalisation des indicatrices \(I_1,\ \cdots,\ I_n\), indépendantes et de même loi \({\cal B}(1\ ;\ p)\). Le codage \(0\ {\rm ou}\ 1\) pour chaque indicatrice implique que la v.a. \(X\) est le nombre d’unités extraites possédant la caractéristique \({\cal C}\).

Remarque 1. Si \(X=0\) aucune unité parmi les \(n\) unités extraites ne possède \({\cal C}\). Si \(X=n\) toutes les unités extraites possèdent \({\cal C}\). En pratique, nous effectuons souvent des tirages sans remise. Dans ce cas il faut utiliser pour \({\cal L}(X)\) la loi Hypergéométrique. Cependant, si nous extrayons moins d’un dixième de l’ensemble et si celui-ci est assez grand, les tirages sans remise peuvent être assimilés à des tirages avec remise ; nous pouvons alors utiliser la loi Binomiale.

Remarque 2. Si \({\cal L}(X)={\cal B}(n\ ;\ p)\), alors la v.a. \(n-X\) qui dénombre le nombre d’unités ne possèdant pas la caractéristique \({\cal C}\), suit une loi \({\cal L}(n-X)={\cal B}(n\ ;\ 1-p)\).

Remarque 3. Le coefficient \(\displaystyle C_n^k=(\sideset{^n _k}{})=\frac{n!}{k!(n-k)!}\) est le nombre de manières différentes de tirer \(k\) unités parmi \(n\). Ces coefficients apparaissent dans la formule du binôme, dite de Newton :

\[ (a+b)^n=\sum_{k=1}^n C_n^k a^k b^{n-k}. \]

En posant \(a=p\) et \(b=1-p\) cette identité permet de montrer que la somme des probabilités vaut bien \(1\).

Ces coefficients peuvent être calculés par la formule de récurrence \(C_n^k =C_{n-1}^k + C_{n-1}^{k-1}\). Cette récurrence nous permet de construire le triangle de Pascal :

\(k\backslash n\)\(0\)\(1\)\(2\)\(3\)\(4\)\(5\) \(\quad\cdots\)
\(0\) \(1\)
\(1\)\(1\)\(1\)
\(2\)\(1\)\(2\)\(1\)
\(3\)\(1\)\(3\)\(3\)\(1\)
\(4\)\(1\)\(4\)\(6\)\(4\)\(1\)
\(5\)\(1\)\(5\)\(10\)\(10\)\(5\)\(1\)
\(\cdots\)\(\qquad\)\(\qquad\)\(\qquad\)\(\qquad\)\(\qquad\) \(\qquad\)\(\qquad\)\(\qquad\)

Calculs avec R. A la base, les commandes comprennent l’expression «binom» précédée d’une lettre spécifiant le calcul à réaliser. Les deuxième et troisième options de la commande sont respectivement \(n\) et \(p\). Par exemple, si \({\cal L}(X)={\cal B}(10\ ;\ 0,5)\), alors \(P(X=3)\) se détermine avec la commande :

dbinom(3,10,.5) ; réponse : 0.1171875.

Si \({\cal L}(X)={\cal B}(10\ ;\ 0,7)\), alors \(F_X(6)=P(X\leq 6)\) se détermine avec la commande :

pbinom(6,10,.7,lower.tail=TRUE) ; réponse : 0.3503893.

Si \({\cal L}(X)={\cal B}(10\ ;\ 0,7)\), alors \(P(6 < X)=1-F_X(6)\) se détermine avec la commande :

pbinom(6,10,.7,lower.tail=FALSE) ; réponse : 0.6496107.

Si \({\cal L}(X)={\cal B}(10\ ;\ 0,6)\), alors \(P(3 < X \leq 8)\) se détermine avec la commande :

sum(dbinom(4:8,10,.6)) ; réponse : 0.8988807.

Si \({\cal L}(X)={\cal B}(10\ ;\ 0,7)\), alors la médiane \(Me\lbrack X\rbrack\) se détermine avec la commande quantile :

qbinom(0.5,10,.7,lower.tail=TRUE) ; réponse : 7.

C’est la même commande qui permet le calcul de tout quantile en remplaçant 0.5 par l’ordre du quantile souhaité. Il est possible de réaliser des simulations d’observations d’une loi Binomiale avec la commande rbinom et les paramètres souhaités. Lorsque \(n\geq 50\), il est possible, pour calculer ces probabilités, d’utiliser une approximation soit avec une loi Normale (et le T.L.C.) soit avec une loi de Poisson ( et la loi des événements rares).

Propriété 2. Si \({\cal L}(X)={\cal B}(n\ ;\ p)\), nous avons les résultats \({\mathbb E} \lbrack X\rbrack = np\) et \( \sigma^2\lbrack X\rbrack = n p (1-p).\)

Remarque 4. Il n’existe pas d’expression simple donnant directement la médiane et plus généralement les quantiles d'une loi Binomiale. En pratique il faut utiliser la commande de R qbinom ci-dessus .

Propriété 3. Si \({\cal L}(X)={\cal B}(n\ ;\ p)\), le mode \(Mo\lbrack X\rbrack\) est compris entre les deux nombres \(np+p-1\) et \(np+p\). L’intervalle défini par ces deux nombres est de longueur \(1\), il contient soit un seul entier, soit deux, qui correspondent alors aux bornes de celui-ci. Ainsi nous avons soit un seul mode soit deux.

Propriété 4. Si \({\cal L}(X)={\cal B}(n\ ;\ p)\), Les coefficients d’asymétrie et d’aplatissement sont respectivement :

\[ \gamma_1\lbrack X\rbrack = \frac{\mu_3\lbrack X\rbrack}{\sigma^3\lbrack X\rbrack}=\frac{1-2p}{\sqrt{np(1-p)}},\qquad \gamma_2\lbrack X\rbrack = \frac{\mu_4\lbrack X\rbrack}{\sigma^4\lbrack X\rbrack}-3=\frac{1-6p(1-p)}{np(1-p)}. \]

Remarque 5. Lorsque \(p=0,5\), la distribution de \(X\) est symétrique autour de l’espérance \(0,5 n\). Lorsque \(n\rightarrow +\infty\), la distribution de \(X\) converge vers une distribution Normale. Nous verrons également qu’une distribution Binomiale peut converger, sous certaines conditions, vers une loi de Poisson.

Propriété 5. Si \({\cal L}(X)={\cal B}(n\ ;\ p)\), la fonction de répartition est :

\[ F_X(t)=P(X\leq t)=\cases{ 0 & \({\it si} \quad t\) < \( 0\), \cr \displaystyle\sum_{l=0}^{k-1} C_n^l p^l (1-p)^{n-l}& \({\it si} \quad k-1 \leq t\) < \(k,\ {\it pour}\ k=1,\cdots,\ n\), \cr 1 & \({\it si}\quad n \leq t\). } \]

La fonction caractéristique \(c_X(t)\) et la fonction génératrice des moments \(g_X(t)\) sont respectivement :

\[ c_X(t)=((1-p)+pe^{it})^n \quad {\it et} \quad g_X(t)=((1-p)+pe^{t})^n. \]

Intervalle de prédiction. Nous avons créé une procédure dans R, BinomInterPred, qui permet de déterminer un intervalle de prédiction pour les lois Binomiales. Pour l’obtenir nous éliminons les modalités dans l’ordre croissant des probabilités ; l’intervalle de prédiction recherché est le dernier ensemble avec une probabilité supérieure au seuil de confiance. Nous considérons diverses lois Binomiales. Nous utilisons la procédure, après l’avoir compilée («sourcée») dans R, en indiquant les paramètres de la loi et le seuil de signification de l’intervalle ; voici les résultats :

BinomInterPred(20,0.5,0.05) ; réponse :
Intervalle de prédiction de la loi B( 20 ; 0.5 ),
Seuil de l'intervalle : 5 %,
Intervalle : [ 6 ; 14 ].

BinomInterPred(20,0.1,0.05) ; réponse :
Intervalle de prédiction de la loi B( 20 ; 0.1 ),
Seuil de l'intervalle : 5 %,
Intervalle : [ 0 ; 4 ].

BinomInterPred(20,0.9,0.05) ; réponse :
Intervalle de prédiction de la loi B( 20 ; 0.9 ),
Seuil de l'intervalle : 5 %,
Intervalle : [ 16 ; 20 ].

Interprétation. Les intervalles

\[ I_{pred}({\cal B}(20\ ;\ 0,1)\ ;\ 0,05)=\lbrack 0\ ;\ 4\rbrack \quad {\rm et}\quad I_{pred}({\cal B}(20\ ;\ 0,9)\ ;\ 0,05)=\lbrack 16\ ;\ 20\rbrack \]

sont symétriques par rapport à \(20/2=10\), comme \(0,1\) et \(0,9\) le sont par rapport à \(1/2=0,5\). Les deux intervalles sont de même amplitude. Notons également que l’amplitude de \(I_{pred}({\cal B}(20\ ;\ 0,1)\ ;\ 0,05)\), égale à \(4\), est inférieure à celle de \(I_{pred}({\cal B}(20\ ;\ 0,5)\ ;\ 0,05)\) qui est de \(8\) ; c’est-à-dire qu’il y a une plus grande incertitude pour cette dernière loi. \(\quad\square\)

Propriété 6. Si deux v.a. \(X^{(1)}\) et \(X^{(2)}\) sont indépendantes et respectivement de lois \({\cal B}(n_1\ ;\ p)\) et \({\cal B}(n_2\ ;\ p)\), alors :

\[ {\cal L}(X^{(1)}+X^{(2)})={\cal B}(n_1+n_2\ ;\ p). \]

La preuve est immédiate lorsque nous considérons les variables sous la forme de sommes d’indicatrices de même loi de Bernoulli \({\cal B}(1\ ;\ p)\). Cette propriété n’est satisfaite que si la proportion \(p\) est la même pour les deux lois. Cependant nous avons créé les procédures BinomialesSomme et BinomialesDifference qui permettent, après les avoir compilées («sourcées») de calculer les lois de la somme et de la différence deux variables indépendantes de lois Binomiales quelconques.

Exemples. Nous considérons deux v.a. \(X^{(1)}\) et \(X^{(2)}\) respectivement de lois \({\cal B}(5\ ;\ 0,4)\) et \({\cal B}(7\ ;\ 0,35)\). Pour la loi de la somme nous avons :

BinomialesSomme(5,.4,7,.35) ; réponse :

[,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9]
[1,]  0.000000  1.00000  2.00000  3.0000  4.0000  5.0000  6.0000  7.00000  8.00000
[2,] 0.003812 0.02707 0.08805 0.1734 0.2301 0.2171 0.1491 0.07518 0.02761
[,10] [,11] [,12] [,13]
[1,]  9.000000  10.000000   1.100e+01  1.200e+01
[2,] 0.007205 0.001268 1.351e-04 6.588e-06

Pour la loi de la différence nous avons :

BinomialesDifference(5,.4,7,.35) ; réponse :

[,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8]
[1,]  -7.000e+00  -6.0000000  -5.000000  -4.00000  -3.0000  -2.0000  -1.0000  0.0000
[2,]  5.003e-05  0.0008172  0.006014  0.02633  0.0763  0.1539  0.2212  0.2281
[,9] [,10] [,11] [,12] [,13]
[1,]  1.0000  2.00000  3.00000  4.000000  5.000000
[2,]  0.1674  0.08518  0.02854  0.005657  0.000502

La première ligne nous donne la valeur de la somme ou de la différence et la seconde sa probabilité. Bien entendu nous retrouvons la Propriété 5. Si par exemple les v.a. sont indépendantes et de lois \({\cal L}(X^{(1)})={\cal B}(5\ ;\ 0,5)\) et \({\cal L}(X^{(2)})={\cal B}(3\ ;\ 0,5)\), la loi de la somme est donnée par :

BinomialesSomme(5,.5,3,.5) ; réponse :

[,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9]
[1,]  0.000000  1.00000  2.0000  3.0000  4.0000  5.0000  6.0000  7.00000  8.000000
[2,]  0.003906  0.03125  0.1094  0.2188  0.2734  0.2188  0.1094  0.03125  0.003906

Ces probabilités peuvent être obtenues directement, à l’arrondi près, avec la commande (et la Propriété 5) :

dbinom(0:8,8,.5) ; réponse :
0.003906  0.031250  0.109375  0.218750  0.273438  0.218750  0.109375  0.031250  0.003906 \(\quad\square\)

Haut de la page.