le logo du site

1. Les observations.

1.9.3. Variables aléatoires. \(\ast\)

Les objets fondamentaux utilisés en Statistique sont les observations qui sont des réalisations de variables aléatoires ou simplement variables. Nous en donnons une définition précise.

Définition 1. Considérons un espace mesurable \((\Omega,\ {\cal A})\). Nous appelons variable aléatoire réelle, en abrégé v.a., toute application \(X\) de \(\Omega\) dans \(\mathbb{R}\) telle que, pour tout intervalle \(I\) de \(\mathbb{R}\), nous avons :

\[ X^{-1}(I)=\lbrace \omega\ :\ X(\omega)\in I \rbrace = \lbrace X\in I \rbrace \in {\cal A}. \]

Nous dirons que \(X(\omega)=x\) est une réalisation de \(X\).

Remarque. Il est possible de considérer des v.a. à valeurs vectorielles, à valeurs complexes, à valeurs dans un espace de fonctions ou encore à valeurs dans un espace mesurable abstrait. Le cas vectoriel est traité à la page 1.9.4..

Définition 2. Soit \(X\) une v.a. réelle définie sur un espace probabilisé \((\Omega,\ {\cal A},\ P)\). Nous appelons loi de probabilité de \(X\), la probabilité, notée \(P_X\), image de \(P\) par \(X\), c’est-à-dire la probabilité définie par :

\[ \forall A\in {\cal B}(\mathbb{R}), \qquad P_X(A) = P(X\in A) = P(\lbrace \omega\ :\ X(\omega)\in A \rbrace). \]

Nous appelons fonction de répartition la fonction \(F_X(t) = P(X\leq t),\ \forall t\in{\mathbb R}\). Son complémentaire à \(1\) est appelé fonction de survie \(S_X(t) = 1- F_X(t) = P(t < X),\ \forall t\in{\mathbb R}\).

Remarque. Lorsqu’il n’y pas de confusion possible, l’indice \(X\) est omis. La fonction de répartition est définie pour tous les nombres réels. Elle est croissante et en tout point, elle est continue à droite et admet une limite à gauche ; de plus \(\displaystyle\lim_{x\rightarrow -\infty} F(x)=0\) et \(\displaystyle\lim_{x\rightarrow +\infty} F(x)=1\).

Remarque. En Statistique, nous considérons essentiellement deux types de v.a..

\(1.\) Les v.a. discrètes dont l’ensemble des valeurs \(X(\Omega)=\lbrace x_1,\ x_2,\ \cdots \rbrace\) est inclus dans l’ensemble des nombres naturels \(\mathbb{N}\) ou égal à ce dernier ; la loi de probabilité d’une telle v.a. est définie par la donnée de \(\lbrace p_1,\ p_2,\ \cdots \rbrace\) satisfaisant :

\[ \forall j,\ p_j\geq 0,\qquad \sum_{j=1}^{\infty}p_j=1,\qquad {\rm et} \qquad P(X=x_j)=p_j. \]

De plus, les considérations précédentes impliquent :

\[ F_X(t) = P(X\leq t) = \sum_{x_j\leq t} p_j. \]

La fonction de répartition est en escalier, elle présente des sauts ; ceux-ci se situent à chaque point \(x_j\) et sont de hauteur égale au \(p_j\) correspondant.

\(2.\) Les v.a. absolument continues, ou simplement continues, dont l’ensemble des valeurs \(X(\Omega)\) est un intervalle de \(\mathbb{R}\) ou égal à ce dernier ; la loi de probabilité d’une telle v.a. est définie par la donnée d’une fonction \(f_X(x)\), appelée densité de probabilité, positive, telle que :

\[ \forall a,\ b \in \mathbf{R},\quad P(X\in \lbrack a,\ b \rbrack) = P(a\leq X\leq b)= \int_a^b f_X(t) dt. \]

De plus, les considérations précédentes impliquent :

\[ F_X(t) = P(X\leq t) = \int_{-\infty}^t f_X(u) du \qquad {\rm et}\qquad \frac{\partial}{\partial t}F_X(t)=F_X^{\prime}(t)=f_X(t). \]

Il est clair que l’aire sous la courbe de \(f_X(t)\) doit être égale à \(1\). La fonction de répartition associée est continue. Pour tout nombre réel \(t\) nous avons \(P(X=t)=0\) ; en effet l’aire au-dessus d’un point est nulle, c’est-à-dire que pour une telle v.a., nous ne pouvons pas associer une probabilité aux observations, mais uniquement aux intervalles susceptibles de les contenir.

Définition 3. Nous appelons fonction caractéristique d’une v.a. \(X\) la fonction définie par :

\[ \forall t\in{\mathbb R},\qquad c_X(t)=\sum_{j=1}^{\infty}p_j \exp(itx_j)\qquad \left({\it resp.}\qquad c_X(t)=\int_{-\infty}^{+\infty} \exp(itu) f_X(u) du \right), \]

dans le cas discret (resp. continu) avec \(i\) est le nombre complexe tel que \(i=\sqrt{-1}\).

Haut de la page.