le logo du site

1. Les observations et le modèle aléatoire.

1.2.2. Application 2 : Plantes.

Sujet. Cette application concerne l’observation des quantités d’azote et de phospore contenues dans des plantes dont les prélèvements ont été réalisés sous certaines conditions. Les données sont dans le classeur LibreOffice Plantes.ods. Outre la première colonne qui contient l’identificateur de chaque prélèvement, chacune des 6 autres colonnes de ce classeur contient une variable et chacune des 160 lignes contient les observations de toutes les variables pour un même prélèvement. Ce tableau se trouve également directement dans l’environnement de travail de R, Plantes.RData sous le nom Donnees.

Dictionnaire des variables. Les définitions des variables sont :

IDEN : identificateur du prélèvement. Ce n’est pas à proprement parler une variable.

ESPE : indentificateur de l’espèce prélèvée, avec les codes «AIL» pour la première espèce «Ail» et «CIR» pour la deuxième «Circea». C’est une variable qualitative nominale à 2 modalités.

TYPE : indique le type de terrain où le prélèvement a été réalisé, avec les codes «INO» pour un terrain inondable et «NON» pour un terrain non inondable. C’est une variable qualitative nominale à 2 modalités.

pH : indique l’acidité du terrain où le prélèvement a été réalisé. Cet indice transformé en une variable qualitative nominale à 2 modalités, avec les codes «BAS» pour un terrain considéré comme basique et «ACI» pour un terrain considéré comme acide.

PERI : indique la période de développement de la plante durant laquelle le prélèvement a été réalisé. Cette variable a été rendue qualitative ordinale avec les 5 modalités codifiées par «DEB» pour la période de débourrement, «FEI» pour la période de présence des feuilles, «FLE» pour la période de présence des fleurs, «FRU» pour la période de présence des fruits et «SEN» pour la période de sénescence de la plante.

Les modalités des quatre variables précédentes n'ont pas, à proprement parler, été observées. Elles ont été fixées par l’expérimentateur. Ces variables sont appelées facteurs. Le but étant d’analyser leur influence sur les variables d’étude qui sont les suivantes.

P : pourcentage de phospore contenu dans la matière sèche. C’est une variable continue.

N : pourcentage d’azote contenu dans la matière sèche. C’est une variable continue.

Traitement. Nous procédons à la lecture des données dans le logiciel R. Nous assignons un répertoire de travail, dans lequel nous enregistrons une version « csv » de notre fichier Plantes.csv, c’est-à-dire le format texte avec séparateur de champs le « ; », le « . » pour la séparation de la partie décimale et tous les textes entre « " ». Nous lisons dans R le fichier avec la commande :

Donnees= read.delim ("Plantes.csv", header =TRUE, sep =";")

Il est à remarquer l’affectation des données à un objet dont le nom est Donnees, l’option qui indique la présence d’en-tête pour les colonnes et enfin l’option qui indique le signe séparant les enregistrements. Pour afficher les objets contenus dans l’environnement de travail de la session, nous effectuons :

ls(); réponse : "Donnees".

Nous affichons les six premières lignes avec la commande :

head (Donnees) ; réponse :

ESPE TYPE  pH PERI    P   N
A1 AIL INO BAS DEB 0.56 5.15
A2 AIL INO BAS DEB 0.58 5.45
A3 AIL INO BAS DEB 0.51 5.81
A4 AIL NON BAS DEB 0.48 6.03
A5 AIL NON BAS DEB 0.51 6.12
A6 AIL NON BAS DEB 0.47 6.07

La commande suivante permet de dénombrer le nombre d’observations pour les modalités de la variable qui se trouve en quatrième colonne.

table (Donnees[,4]) ; réponse :

DEB FEI FLE FRU SEN
29 34 39 34 24

Nous constatons qu’il n’y a pas le même nombre d’observations pour chaque modalité. Nous dirons que l’expérience est déséquilibrée. Ceci aura des conséquences négatives dans notre analyse statistique, mais nous devons accepter la réalité expérimentale.

Une commande analogue à la précédente permet de croiser deux variables qualitatives, en comptant le nombre d’observations ayant réalisé chaque couple de modalités.

table (Donnees[,3],Donnees[,4]) ; réponse :

DEB FEI FLE FRU SEN
ACI 12 18 12 18 10
BAS 17 16 27 16 14

Cette table est appellée tableau de contingence. Il est possible de croiser dans R plus de deux variables.

A la fin de la session nous sauvegardons l’environnement de travail sous le nom «Plantes» soit avec le menu déroulant, soit avec la commande :

save.image ("D:\cheminComplet\Plantes.RData").

Haut de la page.