Nous généralisons les lois de Bernoulli au cas multivarié.
Définition 1. Nous disons que le v.a. discret \(\sideset{^t}{}X=(X_1,\cdots, X_r)\), de dimension \(r\), suit une loi de Bernoulli multivariée de paramètres \(p_1,\cdots, p_r\), avec \(p_j \in \lbrack 0,\ 1\rbrack,\ j=1,\cdots, r\) et \(\displaystyle\sum_{j=1}^rp_j=1\), lorsqu’une seule de ses composantes prend la valeur \(1\) et toutes les autres la valeur \(0\) ; de plus pour \(\sideset{^t}{}x=(x_1, \cdots, x_r)\) avec \(x_{j_0}=1, x_j=0,\ j=1,\cdots, r\) et \(j\not=j_0\), nous avons \(P(X=x)=p_{j_0}\). Ceci est noté \({\cal L}(X)={\cal B}(1\ ;\ p_1, \cdots, p_r)\).
Modélisation. Considérons un ensemble partitionné en \(r\) sous-ensembles. Cette partition des unités peut être induite, par exemple, par \(r\) caractéristiques \({\cal C}_1, \cdots, {\cal C}_r\), exclusives les unes des autres. La proportion des unités qui possèdent la caractéristique \({\cal C}_j\) est \(p_j\). Nous avons bien entendu \(p_j \in \lbrack 0,\ 1\rbrack,\ j=1, \cdots, r\) et \(\displaystyle\sum_{j=1}^rp_j=1\). Alors le tirage d’une unité «au hasard» dans cette population correspond à une réalisation du v.a. \(X\) : toutes les composantes sont nulles, sauf celle qui correspond à la caractéristique possédée par l’unité tirée et qui vaut \(1\). Donc \(X\) est l’indicatrice multivariée de la présence de l’une des caractéristiques \({\cal C}_1, \cdots, {\cal C}_r\). L’expression «au hasard» signifie dans ce contexte que le choix est tel que chaque unité possède la même chance d’être extraite.
Propriété 1. Si \({\cal L}(X)={\cal B}(1\ ;\ p_1, \cdots, p_r)\), alors pour tout \(j=1, \cdots, r\), la loi marginale de \(X_j\) est une loi de Bernoulli \({\cal B}(1\ ;\ p_j)\).
Propriété 2. Si \({\cal L}(X)={\cal B}(1\ ;\ p_1, \cdots, p_r)\), alors la moyenne théorique de ce v.a. est le vecteur défini par :
\[ {\mathbb E}\lbrack X\rbrack=\pmatrix{ {\mathbb E}\lbrack X_1\rbrack\cr \vdots \cr {\mathbb E}\lbrack X_r\rbrack \cr}= \pmatrix{ p_1\cr \vdots \cr p_r\cr}, \]Propriété 3. Si \({\cal L}(X)={\cal B}(1\ ;\ p_1, \cdots, p_r)\), alors la matrice des variances-covariances théoriques de ce vecteur est définie par :
\[ \Sigma\lbrack X\rbrack={\mathbb E}\left\lbrack (X - {\mathbb E}\lbrack X\rbrack)\ \sideset{^t}{}(X - {\mathbb E}\lbrack X\rbrack)\right\rbrack= \] \[ =\pmatrix{ p_1(1-p_1) & -p_1p_2& \cdots & -p_1p_r \cr -p_2p_1& p_2(1-p_2) & \cdots & -p_2p_r \cr \vdots & \vdots & \ddots & \vdots\cr -p_rp_1 & \cdots & \cdots & p_r(1-p_r) \cr} \]Propriété 4. Si \({\cal L}(X)={\cal B}(1\ ;\ p_1, \cdots, p_r)\), alors sa fonction caractéristique \(c_X(s_1, \cdots, s_r)\) et sa fonction génératrice des moments \(g_X(s_1, \cdots, s_r)\) sont respectivement :
\[ c_X(s_1, \cdots, s_r)=\sum_{j=1}^rp_je^{is_j} \quad {\rm et} \quad g_X(s_1, \cdots, s_r)=\sum_{j=1}^rp_je^{s_j}. \] Haut de la page.