le logo du site

4. Lois théoriques usuelles.

4.14. Lois associées à la Statistique d’ordre. \(\ast\)

Nous présentons les lois qui apparaissent dans l’étude des échantillons ordonnés. Soit une v.a. \(X\) de f.r. \(F(t)\) et de densité \(f(t)\). Le cas discret se traite de manière analogue à celle qui suit. Nous considérons un \(n-\)échantillon de \(X\) noté \(X_{\bullet}=(X_1,\ \cdots,\ X_n)\) et sa réalisation \(x_{\bullet}=(x_1,\ \cdots,\ x_n)\).

Définition 1. Nous appelons échantillon ordonné ou statistique(s) d’ordre associée à \(x_{\bullet}=(x_1,\ \cdots,\ x_n)\) le vecteur obtenu en ordonnant dans l’ordre croissant l’échantillon. Nous notons :

\[ X_{(\bullet)}=T(X_{\bullet})=(X_{(1)},\ \cdots,\ X_{(n)})\quad{\it avec}\quad X_{(1)}\leq X_{(2)}\leq\cdots\leq X_{(n)}. \]

En particulier :

\[ X_{(1)}=\min_{i=1}^nX_i\quad {\it et}\quad X_{(n)}=\max_{i=1}^nX_i, \]

La différence \(Et(X_{\bullet})=X_{(n)}- X_{(1)}\) est l’étendue de l’échantillon.

Remarque 1. La statistique d’ordre est aussi notée :

\[ (X_{1:n},\ X_{2:n},\ \cdots,\ X_{n:n}). \]

Cette notation permet d’indiquer la taille de l’échantillon. Cependant, sauf ambiguïté, nous utiliserons ici la notation de la définition.

Remarque 2. Ces fonctions interviennent très souvent en Statistique. En particulier, le minimum et le maximun de l’échantillon apparaissent dans plusieurs exemples de ce site.

Remarque 3. Les réalisations de ces statistiques sont :

\[ x_{(\bullet)}=(x_{(1)},\ \cdots,\ x_{(n)}),\quad x_{(1)}=\min_{i=1}^nx_i\quad \quad x_{(n)}=\max_{i=1}^nx_i,\quad{\it et}\quad Et(x_{\bullet})=x_{(n)}- x_{(1)}. \]

Propriété 1. La densité de \(X_{(\bullet)}\) est donnée par :

\[ f_{X_{(\bullet)}}(t_1,\ \cdots,\ t_n)=n!\prod_{i=1}^n f(t_i),\quad \forall\ (t_1,\ \cdots,\ t_n)\in{\mathbb R}^n,\ t_1\leq t_2\leq \cdots \leq t_n. \]

Pour décrire les lois des statistiques d’ordre nous utilsons l’égalité qui suit.

Propriété 2. Pour tous nombres réels \(0\leq a\leq b\leq c\) et tous le nombres entiers \(0\leq m_1 < m_2 \leq m_3\), l’égalité suivante est satisfaite :

\[ \sum_{i=m_2}^{m_3}\frac{(c-b)^{m_3-i}}{(m_3-i)!}\frac{(b-a)^{i-m_1}}{(i-m_1)!}=\int_a^b\frac{(c-u)^{m_3-m_2}}{(m_3-m_2)!}\frac{(u-a)^{m_2-m_1-1}}{(m_2-m_1-1)!}du. \]

La preuve se fait par récurrence. Nous pouvons déterminer la loi de chaque \(X_{(j)}\). \(\quad\square\)

Propriété 3. La f.r. de \(X_{(j)},\ j\in\lbrace 1,\ \cdots,\ n\rbrace,\) est donnée par :

\[ \begin{array}{rl} F_{X_{(j)}}(t) =& \displaystyle n! \sum_{i=j}^n \frac{F(t)^i}{i!} \frac{(1-F(t))^{n-i}}{(n-i)!},\\ = & \displaystyle n!\int_0^{F(t)}\frac{u^{j-1}}{(j-1)!}\frac{(1-u)^{n-j}}{(n-j)!}du,\quad \forall\ t\in{\mathbb R}.\\ \end{array} \]

En particulier :

\[ F_{X_{(1)}}(t)= 1-(1-F(t))^n\quad {\it et}\quad F_{X_{(n)}}(t)= F(t)^n,\quad \forall\ t\in{\mathbb R}. \]

Pour le voir il suffit de déterminer, pour \(k\in\lbrace j,\ \cdots,\ n\rbrace\), le nombre d’événements \(\lbrace X_{i_1}\leq t,\ \cdots,\ X_{i_k}\leq t,\ X_{i_{k+1}}\ > t,\ \cdots,\ X_{i_n}\ > t\rbrace\), puis d’appliquer la propriété 2 avec \(0=a\leq b=F(t)\leq c=1\) et \(m_1=0< m_2=j\leq m_3=n. \quad\square\)

Cette f.r. est liée à la fonction Bêta incomplète.

Propriété 4. La densité de \(X_{(i)},\ j\in\lbrace 1,\ \cdots,\ n\rbrace,\) est donnée par :

\[ f_{X_{(i)}}(t)= n!\frac{F(t)^{i-1}}{(i-1)!}\frac{(1-F(t))^{n-i}}{(n-i)!}f(t),\quad \forall\ t\in{\mathbb R}. \]

En particulier :

\[ f_{X_{(1)}}(t)= n(1-F(t))^{n-1}f(t)\quad {\it et}\quad f_{X_{(n)}}(t)= n F(t)^{n-1}f(t),\quad \forall\ t\in{\mathbb R}. \]

Exemple. Nous considérons un \(n-\)échantillon \(X_{\bullet}=(X_1,\ \cdots,\ X_n)\) d’une v.a. \(X\) qui suit une loi de Gumbel de paramètres \(\lambda\in{\mathbb R},\ \delta\in{\mathbb R}_+^{\star},\) c’est-à-dire que \({\cal L}(X)={\cal GU}(\lambda\ ;\ \delta)\). Comme \(F_X(t)=\exp(-\exp(-\displaystyle(\frac{t-\lambda}{\delta}))),\ t\in{\mathbb R}\), nous constatons que :

\[ F_{X_{(n)}}(t)= F_X(t)^n=\exp(-\exp(\frac{t-\lambda-\delta \ln(n)}{\delta})),\quad \forall\ t\in{\mathbb R} ; \]

le maximum d’un échantillon d’une loi de Gumbel \({\cal GU}(\lambda\ ;\ \delta)\) suit la loi de Gumbel \({\cal GU}(\lambda+\delta \ln(n)\ ;\ \delta. \quad\square\)

Nous étudions la loi conjointe d'un couple de statistique d’ordre.

Propriété 5. La f.r. du couple \((X_{(j)},\ X_{(k)})\), pour \(1\leq j< k\leq n,\) est donnée par :

\[ \begin{array}{rl} F_{(X_{(j)},\ X_{(k)})}(s,\ t) =& \displaystyle n! \sum_{k_1=k}^n \sum_{j_1=j}^{k_1} \frac{(F(s))^{j_1}}{j_1!}\frac{(F(t)-F(s))^{k_1-j}}{(k_1-j)!} \frac{(1-F(t))^{n-k_1}}{(n-k_1)!},\\ = & \displaystyle n!\int_0^{F(s)}du\int_u^{F(t)}dv\frac{u^{j-1}}{(j-1)!}\frac{(v-u)^{k-j-1}}{(k-j-1)!}\frac{(1-v)^{n-k}}{(n-k)!},\\ & \forall\ s,\ t\in{\mathbb R},\ s\leq t.\\ \end{array} \]

Pour le voir il suffit de déterminer, pour \(k_1 \in\lbrace k,\ \cdots,\ n\rbrace\) et \(j_1 \in\lbrace j,\ \cdots,\ k_1\rbrace\), le nombre d’événements

\[ \lbrace X_{i_1}\leq s,\ \cdots,\ X_{i_{j_1}}\leq s,\ s < X_{i_{j_1+1}}\leq t,\ \cdots,\ s < X_{i_{k_1}}\leq t,\ X_{i_{k_1+1}} > t,\ \cdots,\ X_{i_n} > t\rbrace, \]

puis d’appliquer deux fois la propriété 2 : une première fois à la deuxième somme avec \(0=a\leq b=F(s)\leq F(t)=c\) et \(m_1=0< m_2=j\leq m_3=k_1,\) puis une deuxième fois à la première somme avec \(a=u\leq(F(s)\leq)b=F(t)\leq 1=c\) et \(m_1=j< m_2=k\leq m_3=n. \quad\square\)

Cette f.r. est liée à la fonction Bêta incomplète de dimension deux.

Propriété 6. La densité du couple \((X_{(j)},\ X_{(k)})\), pour \(1\leq j< k\leq n,\) est donnée par :

\[ f_{(X_{(j)},\ X_{(k)})}(s,\ t) =n! \frac{(F(s))^{j-1}}{(j-1)!}\frac{(F(t)-F(s))^{k-j-1}}{(k-j-1)!} \frac{(1-F(t))^{n-k}}{(n-k)!}f(s)f(t),\quad \forall\ s,\ t\in{\mathbb R},\ s\leq t. \]

Cette relation nous permet d’énoncer le résultat :

Propriété 7. La densité de l’étendue \(Et(X_{\bullet})\), est donnée par :

\[ f_{Et(X_{\bullet})}(t) =n! \int_{-\infty}^{+\infty}\frac{(F(t+u)-F(u))^{n-2}}{(n-2)!} f(t+u)f(u) du,\quad \forall\ t\in{\mathbb R}. \] Haut de la page.