Nous généralisons les lois Binomiales au cas multivarié.
Propriété 1. Considérons \(n\) v.a. \(Y_1, \cdots, Y_n\), indépendants et de même loi \({\cal B}(1\ ;\ p_1, \cdots, p_r)\), avec \(p_j\in \lbrack 0,\ 1\rbrack,\ j=1, \cdots, r,\) et \(\displaystyle\sum_{j=1}^rp_j=1\). Alors la loi du v.a. \(X=\displaystyle\sum_{i=1}^n Y_i\) est donnée par :
\[ P(X=\sideset{^t}{}(k_1, \cdots, k_r))=\frac{n!}{k_1!\cdots k_r!}p_1^{k_1}\cdots p_r^{k_r}=C_n^{k_1, \cdots, k_r}p_1^{k_1}\cdots p_r^{k_r}, \]pour \(k_j=0,\ 1,\cdots, n,\ j=1, \cdots, r\), avec \(\displaystyle\sum_{j=1}^rk_j=n\).
Définition 1. La loi d’un v.a. \(X\) satisfaisant à la propriété précédente est appelée loi Multinomiale de paramètres \(n\in {\mathbb N}\), \(p_j\in \lbrack 0,\ 1\rbrack,\ j=1, \cdots, r\) et \(\displaystyle\sum_{j=1}^rp_j=1\). Nous notons \({\cal L}(X)={\cal M}(n\ ;\ p_1, \cdots, p_r)\).
Modélisation. Cette loi est adaptée à l’étude simultanée de plusieurs proportions. En effet, considérons un ensemble partitionné en \(r\) sous-ensembles. Cette partition des unités peut être induite, par exemple, par \(r\) caractéristiques \({\cal C}_1, \cdots, {\cal C}_r\), exclusives les unes des autres. La proportion des unités qui possèdent la caractéristique \({\cal C}_j\) est \(p_j\). Nous avons bien entendu \(p_j \in \lbrack 0,\ 1\rbrack,\ j=1, \cdots, r\) et \(\displaystyle\sum_{j=1}^rp_j=1\). Nous tirons au hasard \(n\) unités avec remise. Le tirage ainsi défini nous permet la réalisation des v.a. \(Y_1, \cdots,Y I_n\), indépendants et de même loi \({\cal B}(1\ ;\ p_1, \cdots, p_r)\). Le codage \(0\) et \(1\) pour chaque composante des \(Y_i\) implique que les composantes du v.a. \(X\) correspondent au nombre d’unités extraites possédant chacune des caractéristiques \({\cal C}_j,\ j=1, \cdots, r\).
Remarque. Le coefficient \(C_n^{k_1,\cdots, k_r}= (\sideset{^n _{k_1,\cdots, k_r}}{})=\dfrac{n!}{k_1!\cdots k_r!}\) est le nombre de manières différentes d’extraire \(k_1\) unités possédant \({\cal C}_1,\cdots,\) \(k_r\) unités possédant \({\cal C}_r\), parmi \(n\). Ces coefficients apparaissent dans la formule suivante, dite formule du multinôme.
\[ (a_1+\cdots +a_r)^n=\sum_{\scriptstyle 0\le k_1,\cdots,k_r\atop\scriptstyle k_1+\cdots +k_r=n} C_n^{k_1,\cdots, k_r} a_1^{k_1}\cdots a_r^{k_r}. \]En posant \(a_1=p_1,\cdots, a_r=p_r\) cette identité permet de montrer que la somme des probabilités vaut bien \(1\).
Calculs avec R. La commande s’exprime par «dmultinom». La première option est un vecteur qui indique les réalisations à calculer, la deuxième est le nombre de tirages et la troisième option de la commande est un vecteur qui donne les \(p_1, \cdots, p_r\). Ainsi par exemple si \({\cal L}(X)={\cal M}(10\ ;\ 0,7\ ;\ 0,1\ ;\ 0,2)\), alors \(P(X=\sideset{^t}{}(5,\ 2,\ 3))\) se détermine avec la commande
dmultinom(c(5,2,3),size=10,prob=c(0.7,0.1,0.2)) ; réponse : 0.03388291.
Il est possible de réaliser des simulations d’observations d’une loi Multinomiale avec la commande rmultinom et les paramètres souhaités.
Propriété 2. Si \({\cal L}(X)={\cal M}(n\ ;\ p_1, \cdots, p_r)\), alors pour tout \(j=1, \cdots, r\), la loi marginale de \(X_j\) est une loi de Binomiale \({\cal B}(n\ ;\ p_j)\). La loi marginale du couple \((X_{j_1}, X_{j_2})\) est une loi Multinomiale \({\cal M}(n\ ;\ p_{j_1}, p_{j_2}, 1-p_{j_1}-p_{j_2})\). La loi conditionnelle de \(X_{j_1}\) sachant que \(\ X_{j_2}=k_{j_2}\) est une loi Binomiale \({\cal B}(n-k_{j_2}\ ;\ \dfrac{p_{j_1}}{1-p_{j_2}})\).
Propriété 3. Si \({\cal L}(X)={\cal M}(n\ ;\ p_1, \cdots, p_r)\), alors la moyenne théorique de ce vecteur est le vecteur défini par :
\[ {\mathbb E}\lbrack X\rbrack=\pmatrix{ {\mathbb E}\lbrack X_1\rbrack\cr \vdots \cr {\mathbb E}\lbrack X_r\rbrack \cr}= \pmatrix{ np_1\cr \vdots \cr np_r\cr}. \]Propriété 4. Si \({\cal L}(X)={\cal M}(n\ ;\ p_1, \cdots, p_r)\), alors la matrice des variances-covariances théoriques de ce vecteur est la matrice définie par :
\[ \Sigma\lbrack X\rbrack={\mathbb E}\left\lbrack (X - {\mathbb E}\lbrack X\rbrack)\ \sideset{^t}{}(X - {\mathbb E}\lbrack X\rbrack)\right\rbrack= \] \[ =\pmatrix{ np_1(1-p_1) & -np_1p_2& \cdots & -np_1p_r \cr -np_2p_1& np_2(1-p_2) & \cdots & -np_2p_r \cr \vdots & \vdots & \ddots & \vdots\cr -np_rp_1 & \cdots & \cdots & np_r(1-p_r) \cr} \]Propriété 5. Si \({\cal L}(X)={\cal M}(n\ ;\ p_1, \cdots, p_r)\), alors sa fonction caractéristique \(c_X(s_1, \cdots, s_r)\) et sa fonction génératrice des moments \(g_X(s_1, \cdots, s_r)\) sont respectivement :
\[ c_X(s_1, \cdots, s_r)=(\sum_{j=1}^rp_je^{is_j})^n \quad {\rm et} \quad g_X(s_1, \cdots, s_r)=(\sum_{j=1}^rp_je^{s_j})^n. \] Haut de la page.