L’objet d’étude de la statistique est, en général, une ou plusieurs populations constituées d’unités ou individus observables. Ces unités peuvent être par exemple des personnes, des animaux, des plantes, une partie de ces êtres (organes), des cultures, des objets manufacturés, etc.
Définition 1. Le choix des unités est appelé un tirage avec remise si, après chaque observation, l’unité est remise dans la population. Ainsi toutes les unités ont toujours les mêmes «chances» d’être observées, y compris celles qui avaient été tirées précédemment. Si ce n’est pas le cas, le tirage est appelé sans remise
Dans toute la suite nous supposerons que nous avons toujours un tirage avec remise. Dans la pratique très souvent ce n’est pas le cas ; mais lorsque nous tirons moins d’un dixième de la population, nous pouvons admettre qu’un tirage sans remise peut être assimilé à un tirage avec remise. Les autres méthodes de choix, décrites dans la théorie des échantillonnages et des sondages, ne seront pas présentées dans ce site. En revanche, nous étudierons par la suite le nombre d’unités à extraire de la population en fonction de nos objectifs.
Sur chaque unité nous observons ou mesurons une ou plusieurs quantités : longueur, poids, durée, nombre d’occurrences, couleur, présence-absence d’une propriété, etc. Les quantités observées sont appelées variables aléatoires, v.a. en abrégé. L’ensemble du processus conduisant à l’observation d’une v.a. donnée sera noté en général par une lettre majuscule de l’alphabet latin : \(X,\ Y,\) etc. Nous dirons que nous sommes en présence d’une expérience aléatoire, son issue n’étant pas, en effet, exactement prévisible. La réalisation effective d’une observation sera quant à elle notée par la lettre minuscule correspondant à celle de la v.a. : \(x,\ y,\) etc.
Définition 2. Les v.a. sont classées en quatre catégories suivant leurs valeurs possibles :
- Les v.a. qualitatives nominales sont celles dont les valeurs possibles sont des attributs ou modalités sans ordre naturel.
- Les v.a. qualitatives ordinales sont celles dont les valeurs possibles sont des attributs ou modalités avec un ordre naturel.
- Les v.a. quantitatives discrètes sont celles dont les valeurs possibles sont numériques en nombre fini ou dénombrables, c’est-à-dire pouvant être numérotées par des nombres entiers naturels.
- Les v.a. quantitatives continues sont celles dont les valeurs possibles constituent un intervalle inclus dans l’ensemble des nombres réels \({\mathbb R}\). En général nous ne connaissons pas ces valeurs exactement du fait de l’imperfection de nos instruments de mesure.
Remarque 1. Il est clair que, en allant du premier au quatrième type de variable, la structure des valeurs observables devient de plus en plus complexe. Ce sont les v.a. quantitatives qui retiennent notre attention dans la mesure où leur traitement permet une inférence plus précise sur la population. Il est important de bien déterminer le type des v.a., dans la mesure où les méthodes d’étude sont spécifiques pour chaque type d’entre elles.
Définition 3. Un \(n-\)échantillon d’une v.a. \(X\) est une suite de \(n\) observations, suite notée sous la forme d’un \(n\)−uplet \(x_{\bullet}=(x_1,\ \cdots,\ x_n )\), réalisées selon les conditions décrites ci-dessus et mises dans l’ordre où elles ont été observées.
Remarque 2. Nous appelerons «\(n\)−échantillon» indifféremment, soit le \(n-\)uplet de v.a. \(X_{\bullet}=(X_1,\ \cdots,\ X_n)\), soit le \(n\)−uplet des réalisations \(x_{\bullet}=(x_1,\ \cdots,\ x_n)\). Le fait que chaque réalisation \( x_i\) ait été obtenue strictement dans les mêmes conditions nous permet d’affirmer que les v.a. \( X _i\) sont des copies identiques de la variable d’étude \(X\), indépendantes les unes des autres dans leurs variations.
Haut de la page.