le logo du site

7. Tests d’hypothèses.

7.1. Hypothèses et alternatives.

Nous présentons la plupart des alternatives qui apparaissent dans les tests les plus utilisés.

Définition 1. Soit une v.a. \(X\). Une hypothèse est simple lorsqu’elle est déterminée par une seule loi, \({\cal H}=\lbrace {\cal L}(X)={\cal L}_0\rbrace\). Dans le cas contraire c’est une hypothèse multiple.

Définition 2. Nous appelons hypothèse paramétrique celle pour laquelle les différentes lois qu’elle détermine sont décrites par les valeurs d’un ou de plusieurs paramètres. Dans le cas contraire elle est appelée hypothèse non paramétrique.

Nous supposons que la loi \({\cal L}(X)\) dépend d’un paramètre \(\theta\in\Theta\subset{\mathbb R}\). Nous admettons que cet ensemble de paramètres est la réunion de deux sous-ensembles disjoints \(\Theta=\Theta_0\bigcup\Theta_1\). Nous confondons \({\mathfrak L_i}\) avec \(\Theta_i\), \(i=0,1\). Considérons les éléments \(\theta_0,\ \theta_1,\ \theta_2\in\Theta,\ \theta_0 \not= \theta_1 < \theta_2\). A titre d’exemples, nous donnons une liste non exhaustive d’alternatives usuelles en Statistique.

Une alternative d’hypothèses simples :

Des alternatives dont les contre-hypothèses sont des hypothèses unilatérales :

Des alternatives dont les contre-hypothèses sont des intervalles finis :

Des alternatives dont les contre-hypothèses sont des hypothèses bilatérales :

Pour la plupart des paramètres des lois usuelles il existe des tests optimaux de ces alternatives. Lorsque le paramètre est multidimensionnel, il est clair que seule une partie des alternatives précédentes est testée. C’est le cas aussi lorsque nous comparons sur plus de deux populations la même caractéristique, par exemple les moyennes théoriques de plusieurs lois Normales. Par contre pour deux populations, liées ou pas, il est possible de tester l’ensemble des alternatives. Dans le cadre paramétrique nous pouvons tester l’adéquation d’un modèle du type linéaire \(y=a_1x_1+\cdots+a_px_p+b\) ainsi que des alternatives précédentes sur tous les coefficients, pris individuellement ou en groupe.

Les alternatives non paramétriques sont beaucoup plus générales dans la mesure où les procédures de décision ne dépendent pas de la loi de la v.a. étudiée. Dans certaines alternatives sont impliquées deux ou plusieurs v.a.. Citons entre autres :

Alternative du test des Suites :

Alternative du test de la médiane :

Alternatives des tests de Dixon :

Alternative du test de Wilcoxon et de celui de Kolmogorov - Smirnov :

Alternative du test de Kruskal - Wallis et de celui de Friedman :

Une famille particulière de tests est celle des tests de lois ou tests d’adéquation. Soit \({\cal L}_0\) une loi donnée et \({\mathfrak L}\) une famille donnée de lois. Deux types d’alternatives sont concernées :

Les tests concernés sont ceux : du Khi-deux d’adéquation, de Kolmogorov, les tests de Normalité de Henry, de Shapiro - Wilk, de Lilliefors, etc, \(\cdots\)

Enfin nous avons les tests sur les tableaux de contingence construits par le croisement de deux ou plusieurs distributions statistiques : le test exact de Fisher, celui du Khi-deux d’indépendance, etc,\(\dots\) Pour ce type de tests, une alternative peut être :

Nous constatons que pour la plupart des tests précédents les alternatives sont fixées, exception faite des tests concernant des contre-hypothèses unilatérales, des contre-hypothèses de type intervalle fini et des contre-hypothèses bilatérales. Lorsque nous avons le choix de l’alternative, nous proposons la stratégie suivante :

Choix des hypothèses. Poser en \({\cal H_1}\) l’hypothèse dont l’acceptation à tort, c’est-à-dire décider qu’elle est vraie alors qu’en réalité elle ne l’est pas, entraîne les conséquences les plus graves pour l’utilisateur.

Exemple. Pour illustrer cette stratégie nous présentons un exemple simplifié. Considérons un boulanger qui doit fabriquer des pains de 1 kg. Nous admettons qu’un pain choisi au hasard dans la fabrication a un poids qui, en kg, est la réalisation d’une v.a. qui suit une loi Normale de moyenne théorique \(\mu\). Nous avons le choix entre trois alternatives, deux concernant les hypothèses unilatérales et celle concernant l’hypothèse bilatérale. Nous prélevons \(n\) pains au hasard. L’alternative est choisie en fonction de l’utilisateur.

Le Boulanger. S’il décide \(\lbrace \mu < 1 \rbrace\) est vraie, il doit augmenter la quantité de farine utilisée. S’il décide \(\lbrace 1 < \mu \rbrace\) est vraie, il doit diminuer la quantité de farine utilisée. S’il décide \(\lbrace \mu \not= 1\rbrace\) est vraie, il ne sait pas quoi faire. Nous en déduisons que la décision erronée qui a les conséquences immédiates les plus graves (pertes financières) est \(\lbrace \mu < 1 \rbrace\) est vraie ; il posera donc l’alternative :

Le Représentant des consommateurs. S’il décide \(\lbrace \mu < 1\rbrace\) est vraie, il déconseillera à ses lecteurs cette boulangerie. S’il décide \(\lbrace 1 < \mu \rbrace\) est vraie, il proposera à ses lecteurs cette boulangerie. S’il décide \(\lbrace \mu \not= 1 \rbrace\) est vraie, il ne sait pas quoi faire. Nous en déduisons que la décision erronée qui a les conséquences immédiates les plus graves (perte de la confiance de ses lecteurs) est \(\lbrace 1 < \mu \rbrace\) est vraie ; il posera donc l’alternative :

Le Contrôleur des fraudes. La décision erronée qui a les conséquences immédiates les plus graves pour lui (dresser à tort un procès-verbal de fraude) est \(\lbrace \mu \not= 1 \rbrace\) est vraie. Il posera l’alternative :

Bien entendu cet exemple est très simplifié, sinon simpliste. Mais l’important est de souligner qu’en pratique il n’y pas de symétrie dans les alternatives, qu’elles dépendent du contexte réel et qu’il faut les considérer avec beaucoup d’attention.

Haut de la page.