Nous présentons un graphique très commode, introduit en 1900 par Bowley et popularisé par Tukey.
Définition 1. Considérons un échantillon \( x_{\bullet}\). Le diagramme branche et feuilles est un graphique, par exemple horizontal, très simplifié, construit de la manière suivante : pour chaque \(x_i\), l’ensemble des chiffres significatifs jusqu’à l’avant-dernière position à droite est retenu ; ces nombres sont reportés sur un axe vertical et chaque dernier chiffre significatif est reporté horizontalement par juxtaposition, dans l’ordre croissant, autant de fois qu’il est observé.
Interprétation. Ce type de représentation graphique permet d’indiquer exactement non seulement l’ensemble des données, mais également l’allure générale de la distribution.
Remarque. Ce diagramme est construit très simplement. Dans le cas d’une variable continue, c’est un histogramme simplifié, évitant l’écueil du choix des classes.
Application 1. Nous reprenons l’exemple des Sinistres. Nous construisons un diagramme branche et feuilles pour la variable PERM, ancienneté en années du permis du conducteur (quatrième colonne du tableau des donnés), avec la commande suivante :
stem (Donnees[,4])
Réponse de R:
Interprétation. Nous constatons des observations à \(0,\ 1,\ 2\), \(5\ (2\ {\rm fois})\), \(6\ (3\ {\rm fois})\), \(7\ (16\ {\rm fois})\), \(8\ (16\ {\rm fois})\), \(9\ (10\ {\rm fois})\), \(10\ (15\ {\rm fois}),\dots,\ 51,\ 54,\ 55\), années. Au delà de la huitième observation \(18\), nous avons \(11\) observations qui valent \(18\) ou \(19\) années. La distribution a une forte asymétrie droite.
Haut de la page.