le logo du site

4. Lois théoriques usuelles.

4.13. Lois empiriques.

Nous présentons un ensemble de lois construites à partir des observations d’une v.a. \(X\). Elles sont très utiles dans l’étude des propriétés des différents éléments calculés sur ces observations. Soit un \(n-\)échantillon \(X_{\bullet}=(X_1,\ \cdots ,\ X_n)\) (resp. sa réalisation \(x_{\bullet}=(x_1,\ \cdots ,\ x_n)\)) de \(X\). Nous notons \(X_{(\bullet)}=(X_{(1)},\ \cdots ,\ X_{(n)})\) (resp. \(x_{(\bullet)}=(x_{(1)},\ \cdots ,\ x_{(n)})\)) l’échantillon ordonné dans l’ordre croissant.

Définition 1. Nous appelons loi empirique associée à cet échantillon la loi de probabilité discrète qui à chaque \(X_{(i)}\) (resp. \(x_{(i)}\)) associe la probabilité \(\dfrac{1}{n}\). La v.a., suivant la loi empirique, sera notée \(X_{EM}\) (resp. \(X_{em}\)).

Remarque 1. Nous avons une ambiguité de langage. Avant observation, une loi empirique est une loi «aléatoire» ; après observation, c’est une loi au sens habituel du terme. C’est le contexte et les notations qui préciseront l’objet dont il s’agit.

Exemple 1. Considérons le moment empirique d’ordre \(r\), c’est-à-dire le moment d’ordre \(r\) de la loi empirique. Avant observation nous avons :

\[ {\mathbb E}\lbrack X_{EM}^r\rbrack=\frac{1}{n}\sum_{i=1}^nX_{(i)}^r=\frac{1}{n}\sum_{i=1}^nX_i^r. \]

C’est une v.a. ou statistique. Après observation nous avons :

\[ m_r(x)=\frac{1}{n}\sum_{i=1}^nx_{(i)}^r=\frac{1}{n}\sum_{i=1}^nx_i^r. \]

C’est un nombre réel fixe, non aléatoire.

Exemple 2. Nous considérons la f.r. empirique. Pour tout \(t\in{\mathbb R}\), nous notons \(\sharp(\lbrace X_{\bullet}\ ; X_j\leq t\rbrace)\) (resp. \(\sharp(\lbrace x_{\bullet}\ ; x_j\leq t\rbrace)\)) le nombre de \(X_j\) (resp. \(x_j\)) inférieurs à \(t\). D’après la définition de la f.r. d’une v.a. discrète, avant observation nous avons :

\[ F_n(t)=F_{EM}(t)=\frac{1}{n}\sum_{j=1}^n I_{\lbrace X_j\leq t\rbrace}(t)={\mathbb E}\lbrack I_{\lbrace X_{EM}\leq t\rbrace}(t)\rbrack = \frac{\sharp(\lbrace X_{\bullet}\ ; X_j\leq t\rbrace)}{n}=\cases{ 0 \quad {\rm si} & \(t < X_{(1)}\), \cr \dfrac{j}{n} \quad {\rm si} & \( X_{(j)} \leq t < X_{(j+1)}\),\cr 1 \quad {\rm si} & \(X_{(n)} \leq t\). } \]

C’est une fonction aléatoire ou encore processus stochastique, très utilisé en probabilités. Après observation, nous avons :

\[ F_n(t)=F_{em}(t)=\frac{1}{n}\sum_{j=1}^n I_{\lbrace x_j\leq t\rbrace}(t)={\mathbb E}\lbrack I_{\lbrace X_{em}\leq t\rbrace}(t)\rbrack = \frac{\sharp(\lbrace x_{\bullet}\ ; x_j\leq t\rbrace)}{n}=\cases{ 0 \quad {\rm si} & \( t < x_{(1)}\), \cr \dfrac{j}{n} \quad {\rm si} & \( x_{(j)} \leq t < x_{(j+1)}\),\cr 1 \quad {\rm si} &\( x_{(n)} \leq t\). } \]

C’est une fonction au sens classique du terme, en escalier et croissante. La notation \(F_n(t)\) est la plus courante ; c’est le contexte qui indique s’il s’agit d’une fonction aléatoire ou d’une réalisation.

Remarque 2. Dans toute la statistique nous avons des expressions calculées sur les lois empiriques par essence même de l’objet de la discipline. Nous allègerons les notations en omettant, sauf nécessité, les termes \(EM\) et \(em\).

Haut de la page.