Analyse Factorielle des Correspondances (AFC) - Jonathan Lenoir
TD. Utilisation du logiciel libre R sur des données de présence/absence issues
de ... 1.3 Distinction entre Analyse en Composante Principale (ACP) et AFC en ...
part of the document
Analyse Factorielle des Correspondances : application à des données phytoécologiques
TD
Utilisation du logiciel libre R sur des données de présence/absence issues de relevés floristiques forestiers
Le but de cette session de Travaux Dirigés est de réaliser lanalyse factorielle des correspondances (AFC) dun tableau floristique codé en présence/absence afin davoir une idée de la distribution des espèces et de la structuration des communautés de végétation spontanée dans le Massif du Lomont (Jura). On essaiera dexpliquer la variabilité des coordonnées factorielles des relevés sur les principaux axes factoriels avec des données écologiques issues du terrain pour avoir une idée des principaux gradients écologiques responsable de cette variabilité.
Table des matières
TOC \o "1-3" 1 INTRODUCTION A LAFC DUN TABLEAU FLORISTIQUE PAGEREF _Toc381879665 \h 3
1.1 Pourquoi utilise-t-on lAFC en phytoécologie ? PAGEREF _Toc381879666 \h 3
1.2 Définition et principes : approche phytoécologique PAGEREF _Toc381879667 \h 3
1.3 Distinction entre Analyse en Composante Principale (ACP) et AFC en phytoécologie PAGEREF _Toc381879668 \h 5
2 JEU DE DONNEES PAGEREF _Toc381879669 \h 6
2.1 Données floristiques PAGEREF _Toc381879670 \h 6
2.1.1 Présentation du tableau floristique brut PAGEREF _Toc381879671 \h 6
2.1.2 Codage en présence/absence PAGEREF _Toc381879672 \h 7
2.2 Données écologiques PAGEREF _Toc381879673 \h 7
2.2.1 Localisation PAGEREF _Toc381879674 \h 7
2.2.2 Végétation PAGEREF _Toc381879675 \h 8
2.2.3 Conditions stationnelles PAGEREF _Toc381879676 \h 8
2.2.4 Conditions climatiques PAGEREF _Toc381879677 \h 9
2.2.5 Conditions édaphiques PAGEREF _Toc381879678 \h 9
3 IMPORT DES DONNÉES DANS LE LOGICIEL LIBRE R PAGEREF _Toc381879679 \h 11
3.1 Préparation de votre répertoire de travail dans R PAGEREF _Toc381879680 \h 11
3.2 Importation du tableau floristique sur lequel sera réalisé lAFC PAGEREF _Toc381879681 \h 11
3.3 Importation du tableau écologique pour linterprétation de lAFC PAGEREF _Toc381879682 \h 12
4 AFC DU TABLEAU FLORISTIQUE ET INTERPRETATIONS ECOLOGIQUES PAGEREF _Toc381879683 \h 13
4.1 Réalisation de lAFC PAGEREF _Toc381879684 \h 13
4.1.1 Quelques commandes utiles à connaître avant de lancer une AFC PAGEREF _Toc381879685 \h 13
4.1.2 Chargement du package ade4 de lUniversité Lyon 1 PAGEREF _Toc381879686 \h 13
4.1.3 Lancement de lAFC PAGEREF _Toc381879687 \h 14
4.1.4 Accéder aux valeurs propres de lAFC PAGEREF _Toc381879688 \h 14
4.1.5 Edition des cartes factoriels PAGEREF _Toc381879689 \h 15
4.2 Interprétation de lAFC PAGEREF _Toc381879690 \h 15
4.2.1 Dépouillement de laxe 1 PAGEREF _Toc381879691 \h 15
4.2.2 Dépouillement de laxe 2 PAGEREF _Toc381879692 \h 16
INTRODUCTION A LAFC DUN TABLEAU FLORISTIQUE
Pourquoi utilise-t-on lAFC en phytoécologie ?
En phytoécologie, on cherche généralement à mettre en évidence des associations entre espèces (notion de communautés végétales) ou bien à faire des groupes écologiques de relevés (notion de typologies de station). De manière intuitive, cela revient à regrouper les espèces et les relevés qui se ressemblent, soit en associant les espèces présentent dans les mêmes relevés, ou bien en regroupant les relevés ayant des profils floristiques similaires. Effectuer ce travail à la main, dés linstant où lon dispose dun nombre important de données, représente un travail long et fastidieux.
Le recours à loutil statistique permet dautomatiser une procédure de tri par agrégations des espèces qui vont ensemble et des relevés qui se ressemblent. En ce sens, lAnalyse Factorielle des Correspondances (AFC) dun tableau floristique est une méthode semi-automatique permettant de représenter géométriquement, dans un espace à plusieurs dimensions, les « distances écologiques » qui séparent les espèces suivant leurs dispositions dans les relevés ainsi que pour les relevés, suivant la composition de leurs profils floristiques.
La difficulté associée à cette méthode dordination réside dans la représentation que lon se fait dun espace à plusieurs dimensions (autant que despèces ou de relevés). Néanmoins, il est possible de simplifier cet espace par projection sur une, deux ou trois dimensions afin de mieux « voir » les distances qui séparent chaque espèce ou chaque relevés. Le jeu consiste à bien choisir la projection la plus pertinente de cet espace à plusieurs dimensions dans un espace réduit à un plan, ou un axe, de façon à résumer au mieux la variabilité, ou inertie du nuage des espèces (resp. des relevés).
Par analogie, si lon veut décrire un chameau à quelquun qui na jamais vu lanimal, le message le plus explicite sera de dessiner sur le papier une représentation de profil, cest le plan factoriel qui décrit le mieux lanimal en question. Lobjectif de lAFC appliquée au tableau floristique est identique à celui de vouloir expliquer par le dessin ce que lon a retenu de lallure générale du chameau (simplification de notre réalité tridimensionnelle sur une feuille de papier plane).
En définitive, lAFC permet danalyser un espace multidimensionnel, afin dy trouver un axe ou bien un plan dit « factoriel » qui maximise simultanément la correspondance entre les espèces et les relevés.
Définition et principes : approche phytoécologique
LAFC a été conçu au départ comme une méthode de statistique descriptive destinée à étudier les relations entre deux variables qualitatives à partir dun « tableau de contingence ». Cette table de contingence correspond au croisement des différentes modalités qui composent chacune des deux variables qualitatives : à chaque case du tableau est affecté leffectif des individus présentant les modalités considérées. Par exemple, soit une variable peuplement à trois modalités, et une variable humus à trois modalités. On effectue lAFC sur la table de contingence suivante :
ModerHemimoderEumoderTotalPeuplement feuillus1191030Peuplement résineux1310730Mélange feuillus/résineux10101030Total34292790Tableau SEQ Tableau \* ARABIC 1 : Table de contingence Humus/Peuplement
Or un tableau floristique nest pas un tableau de contingence : on parle plutôt de « tableau disjonctif semi-complet » : chaque case du tableau contient une information codée en présence/absence pour lespèce j dans le relevé i :
Espèce1Espèce2Espèce3Espèce jEspèce PRelevé n°1011
1Relevé n°2100
0Relevé n°3101
1Relevé n°i
Relevé n°N001
1Tableau SEQ Tableau \* ARABIC 2 : Tableau floristique codé en présence/absence
Si en phytoécologie, lobjectif de lAFC est létude de la correspondance entre les espèces, alors il faut attribuer à chaque espèce du tableau floristique un rôle de variable qualitative à deux modalités (présence ou absence) et à chaque relevé le rôle dindividu. Par analogie avec lAFC classique, cela reviendrait à construire une table de contingence très complexe sur un nombre important de variables bimodales. Pour retombé dans le cas de lAFC classique, il faudrait que sur lensemble des relevés étudiés, le nombre total despèces atteigne deux (cas très simple, non rencontré dans la réalité). Dans ce cas très simplifié, on pourrait transformer le tableau floristique en une table de contingence du type :
Espèce1 (présence)Espèce1 (absence)Espèce2 (présence)2412Espèce2 (absence)1014Tableau SEQ Tableau \* ARABIC 3 : Table de contingence Espèce1/Espèce2
Pour trois espèces, on peut aussi représenter la table de contingence dans un cube à deux modalités par côté. Au delà de trois, la représentation de la table de contingence est impossible. Néanmoins, lorsque le nombre de variables qualitatives est supérieur à deux, il est possible deffectuer une AFC non plus sur la table de contingence, mais sur un « tableau disjonctif complet ». Il sagit deffectuer ce que lon appel un codage disjonctif des variables. Reprenons lexemple de lAFC classique sur les variables Humus/Peuplement : dans ce cas, chaque variable dispose de trois modalités. Parmi les 90 relevés issus de leffectif total, considérons 5 relevés à titre dexemples et contenant les modalités Humus/Peuplement suivantes :
R1 : Moder/Résineux
R2 : Eumoder/Feuillus
R3 : Moder/Résienux
R4 : Hemimoder/Résineux
R5 : Eumoder/Mélange
Pour ces 5 relevés, le tableau disjonctif complet correspond à un éclatement des modalités de chacune des deux variables Humus et Peuplement en un ensemble de 6 variables binaire (0/1) :
ModerHemimoderEumoderRésineuxFeuillusMélangeR1100100R2001010R3100100R4010100R5001001Tableau SEQ Tableau \* ARABIC 4 : Tableau disjonctif complet sur 5 relevés
Le résultat de lAFC sur le tableau disjonctif complet contenant les 90 relevés de leffectif total donne les mêmes résultats que lAFC effectué sur la table de contingence présentée plus haut. Cette représentation permet cependant de travailler sur un nombre plus grand de variables qualitatives, autant que despèces contenues dans lensemble des relevés. Cest sur la base de ce constat que lon sappuie pour dire que lAFC dun tableau floristique correspond à réaliser une AFC sur une table de contingence à n variables (n étant le nombre despèces). Cependant dans le cas dun tableau floristique, le tableau disjonctif nest pas complet, étant donné le rôle symétrique de la variable espèce (présence/absence). En toute logique, il faudrait compléter le tableau floristique des présences par celui des absences pour obtenir un tableau disjonctif complet (information redondante).
Par conséquent le lien qui existe entre AFC classique et AFC sur tableau floristique, cest le passage par un codage disjonctif des variables.
Distinction entre Analyse en Composante Principale (ACP) et AFC en phytoécologie
LAFC est une méthode proche de lACP, que lon emploie lorsque lon dispose de données qualitatives. Comme lAFC, lACP est utilisée à des fins descriptives pour étudier les ressemblances entre variables et les proximités entre individus. Cependant, lACP étudie les ressemblances entre les variables de nature quantitative par lintermédiaire des distances euclidiennes, tandis que lAFC sintéresse à la relation entre deux variables (ou plus) de nature qualitative par comparaison des distances du Chi2.
JEU DE DONNEES
Le jeu de données est extrait de lexercice phytoécologique 2006 réalisé par la 16ème promotion de la Formation des Ingénieurs Forestiers (FIF) dans le massif du Lomont (Jura). Le but de cet exercice était la réalisation dune typologie de stations forestières dont lobjectif est daider les gestionnaires forestiers à établir un diagnostic rapide des conditions écologiques existant sur une parcelle forestière. Un tel diagnostic permet dadapter la gestion aux conditions écologiques en conciliant production de bois de qualité et respect de lenvironnement dans le contexte actuel de production durable. La méthode déchantillonnage employée par les élèves au cours de lexercice est celle des transects.
On a cherché ensuite, à équilibrer a posteriori notre échantillon de relevés en utilisant un plan stratifié suivant laltitude et lexposition étant donné limportance de ces deux facteurs dans un massif forestier comme celui du Lomont :
laltitude est un facteur très structurant de la végétation : on peut distinguer un étage collinéen aux altitudes inférieures à 500m et un étage montagnard aux altitudes supérieures à 500m ;
Linfluence microclimatique est également très importante dans les massifs du Jura, avec de fortes oppositions de versants (Nord-Sud et Ouest-Est) : on distingue 5 modalités dexposition différentes ;
Pour cette séance de travaux dirigés, nous avons sélectionné 125 relevés (afin de limiter la taille du jeu à manipuler et déquilibrer le plan déchantillonnage) parmi lensemble des relevés effectués par les élèves de la 16ème promotion de la FIF.
On obtient ainsi un plan comprenant 10 strates :
Exposition NExposition EExposition SExposition OPlateauTotalEtage collinéen8912121152Etage montagnard2572310873Total3316352219125Tableau SEQ Tableau \* ARABIC 5 : Plan déchantillonnage stratifié suivant laltitude et lexposition
Données floristiques
( Le tableau floristique se trouve dans le fichier flo.txt.
Présentation du tableau floristique brut
Il est le fruit dune numérisation des relevés de terrain. Les données saisies à l'issue de la phase de terrain sont très rarement utilisables en l'état et il est souvent nécessaire de les retravailler pour pouvoir les analyser. La meilleure façon de présenter les données pour lanalyse est de disposer les relevés en lignes et les espèces en colonnes. Le tableau « flo » comporte 125 lignes (une ligne = un relevé) et 143 colonnes (une colonne = une espèce végétale spontanée). Seules la flore spontanée, issue de la strate herbacée ou de la strate arbustive basse, est traitée ici car peu ou moins influencée par la gestion forestière que les espèces issues de la strate arboré. Font partie de la strate herbacée ou de la strate arbustive basse, les bryophytes, les ptéridophytes et les plantes vasculaires. Le cas des plantes grimpantes comme le lierre terrestre est considéré comme appartenant à la flore spontanée. Le nom des espèces est indiqué par un radical à 4 lettres. Pour obtenir le nom scientifique complet en latin, voir le fichier espece.txt qui donne les correspondances entre code radical à 4 lettres et nom complet.
Codage en présence/absence
Les données sont codées de manière binaire (0/1) :
0. absence
1. présence
Données écologiques
( Le tableau écologique se trouve dans le fichier eco.txt.
Il représente la numérisation des données écologiques disponibles sur les 125 placettes (données relevés sur le terrain, ou issues des valeurs indicatrices des espèces, ou encore issues de croisements sous système dinformation géographique).
Localisation
ID : Identifiant unique de la placette. Correspond à la concaténation du numéro du groupe délèves, du numéro du transect effectué, ainsi que du numéro du relevé effectué sur le transect.
St1 : Strate altitudinal ou étage dappartenance du relevé, première strate déchantillonnage à deux modalités :
1. étage collinéen (alt500m)
St2 : Exposition du site, deuxième strate déchantillonnage à cinq modalités :
1. exposition nord N (entre 350 et 50 grad)
2. exposition est E (entre 50 et 150 grad)
3. exposition sud S (entre 150 et 250 grad)
4. exposition ouest O (entre 250 et 350 grad)
5. situation de plateau P (aucune exposition)
Stnum : Résultat de la concaténation des strates 1 et 2, 10 modalités croisées.
XLamb2 : Coordonnées longitudinales (m) en X Lambert II (étendu) pointées sur carte.
YLamb2 : Coordonnées latitudinales (m) en Y Lambert II (étendu) pointées sur carte.
Alt : Altitude du site par rapport au niveau moyen de la mer, mesuré à laide dun altimètre étalonné (m).
Expo : Exposition du site (grad).
Végétation
Habitat : Code Corinne (CB) des habitats forestiers rencontrés. Habitats identifiés à laide de la clé de détermination des habitats forestiers du Nord-Est de la France.
RecArbre : Recouvrement de la strate arborée (%).
RecArbu : Recouvrement de la strate Arbustive (%).
RecHerb : Recouvrement de la state Herbacée (%).
RecMous : Recouvrement de la strate Muscinale (%).
Traitement : Traitement sylvicole de la placette en six modalités :
1. FI : peuplement traité en futaie irrégulière
2. FR : peuplement traité en futaie régulière
3. T : taillis
4. TC : taillis à courte rotation
5. TSF : taillis sous futaie
6. TSFV : taillis sous futaie vieilli
Conditions stationnelles
Cosexpo : Cosinus de lexposition (converti en radians), mesure les oppositions de versants Sud-Nord (vaut -1 pour lexposition Sud et 1 pour lexposition Nord, annulation pour les expositions Est et Ouest).
Sinexpo : Sinus de lexposition (converti en radians), mesure les oppositions de versants Ouest-Est (vaut -1 pour lexposition Ouest et 1 pour lexposition Est, annulation pour les expositions Nord et Sud).
Pente : Pente du site à lendroit du relevé (%).
Confin : Confinement du site à lendroit du relevé, calculé à laide du masque (%).
Drainage : Bilan des circulations latérales deau du sol liées à la topographie du site. Quatre modalités de drainage latéral :
0. départs deau
1. apports et départs équilibrés
2. apports faibles à moyens
3. apports importants
Conditions climatiques
PA : Somme des précipitations annuelles (mm). Données issues du modèle AURELHY au pas de 1km qui couvre lensemble du territoire français. Récupération de linformation par croisement SIG des relevés géoréférencés avec la couche AURELHY des précipitations.
TmoyA : Température moyenne annuelle (°C). Données issues du modèle AURELHY au pas de 1km qui couvre lensemble du territoire français. Récupération de linformation par croisement SIG des relevés géoréférencés avec la couche AURELHY des températures.
Tmin01 : Minimum des températures du mois de janvier (°C). Données issues du modèle AURELHY au pas de 1km qui couvre lensemble du territoire français. Récupération de linformation par croisement SIG des relevés géoréférencés avec la couche AURELHY des températures.
DM : Indice de De Martonne : P/(T+10), mesure laridité du site. Données issues dun croisement SIG au pas de 1km sur la France.
BH06 : Bilan Hydrique du mois de juin, correspond au bilan entre apports deau (précipitations) et départs deau (évapotranspirations). Données issues dun croisement SIG au pas de 1km sur la France.
Conditions édaphiques
ProfArret : Profondeur darrêt (cm) de la fosse pédologique.
CauseArret : Cause darrêt de la prospection. Quatre modalités :
1. horizon compact
2. éléments grossiers
3. dalle
4. volontaire
Profondeur disparition des racines fines : Profondeur (cm) à partir de laquelle les racines fines ne sont plus visibles sur le profil pédologique. Correspond à la profondeur prospectable par les racines (interprétation du profil).
ProfHCL : Profondeur (cm) dapparition de leffervescence à lacide chlorhydrique (dans la terre fine).
Oln : Présence dune couche Oln dans lHumus. Trois modalités :
1. Oln absent
2. Oln discontinu
3. Oln continu
Olv : Présence dune couche Olv dans lHumus. Trois modalités :
1. Olv absent
2. Olv discontinu
3. Olv continu
OF : Présence dune couche OF dans lHumus. Trois modalités :
1. OF absent
2. OF discontinu
3. OF continu
OH : Présence dune couche OH dans lHumus. Trois modalités :
1. OH absent
2. OH discontinu
3. OH continu
OHmm : Epaisseur de lhorizon OH (cm).
Agrum : Présence dun horizon A grumeleux. Deux modalités :
0. absence
1. présence
Ahum : Présence dun horizon A humifère. Deux modalités :
0. absence
1. présence
Humus : Type dhumus. Sept modalités :
1. amphimull
2. mor
6. dysmull
7. oligomull
8. mesomull
9. eumull
10. hydromull
RU : Réserve utile du sol (mm). Calculée à partir de la profondeur prospectable par les racines, de la texture par horizon, ainsi que de la charge en éléments grossiers par horizons.
IMPORT DES DONNÉES DANS LE LOGICIEL LIBRE R
Préparation de votre répertoire de travail dans R
( Lancez le logiciel libre R.
( Demandez à R le répertoire de travail actuel.
Pour cela, utilisez la fonction « getwd() » :
> getwd()# Indique le chemin daccès au répertoire de travail actuel
[1] "C:/Users/admin2/Documents"
( Indiquez à R le chemin daccès à votre nouveau répertoire de travail contenant lensemble des jeux de données à analyser (exemple dossier intitulé « Données »).
Pour cela, utilisez la fonction « setwd() » en indiquant le chemin daccès à vos données :
> setwd("C:/.../TD AFC-CAH/Données")# Paramètre le nouveau répertoire de travail
( Vérifiez le contenu de votre nouveau répertoire de travail.
Pour cela, utilisez la fonction « dir() » :
> dir("C:/.../TD AFC-CAH/Données")# Affiche le contenu du répertoire de travail
[1] "eco.txt" "flo.txt" "espece.txt"
Importation du tableau floristique sur lequel sera réalisé lAFC
( Importez le fichier flo.txt dans R.
Pour cela, utilisez la fonction « read.table() » :
> flo str(flo)# Donne des informations précieuses sur lobjet « flo » et la nature des variables quil contient
'data.frame': 125 obs. of 144 variables:
$ Releve: int 10101 10102 10103 10104 10105 10106 10107 10601...
$ acsp: int 0 0 0 0 0 0 0 0 0 0...
$ adal: int 0 0 0 0 0 0 0 0 0 0...
[list output truncated]
Importation du tableau écologique pour linterprétation de lAFC
( Importez le fichier eco.txt dans R et créez un objet nommé « eco » contenant les données écologiques à utiliser pour linterprétation de lAFC.
Pour cela, utilisez les fonctions que nous venons de voir ensemble.
( Quelle est la nature de chaque variable ?
AFC DU TABLEAU FLORISTIQUE ET INTERPRETATIONS ECOLOGIQUES
( Vérifier que le tableau floristique (objet « flo ») et le tableau écologique (objet « eco ») ont bien étés importés dans R.
Pour cela, utilisez la fonction « ls() » :
> ls()# Liste lensemble des objets importés et créés au cours de cette session R
Réalisation de lAFC
Quelques commandes utiles à connaître avant de lancer une AFC
> flo[, 1]# Appel la première colonne du tableau floristique
> flo[, "aepo"]# Appel la colonne nommé « aepo » contenant le vecteur dinformation présence/absence par relevés de lespèce Aegopodium podagraria
> flo[1, ]# Appel la première ligne
> flo[flo$Releve=="10101", ]# Appel la ligne nommé « 10101 » contenant le premier relevé du groupe 1 sur le transect numéro 1
> flo[, 1:2]# Appel les 2 premières colonnes du tableau
> flo[, c("acsp","adal")]# Appel les 2 premières colonnes du tableau
> flo$aepo# Appel la colonne nommé « aepo »
Chargement du package ade4 de lUniversité Lyon 1
Pour réaliser une AFC avec le logiciel libre R, il est possible dutiliser plusieurs fonctions disponible dans différents package :
1. dans le package MASS, fonction « corresp() »
2. dans le package ade4, fonction « dudi.coa() »
3. dans le package FactoMineR, fonction « CA() »
Dans le cadre de ce TD, nous allons utiliser le package ade4 qui dispose de nombreuses fonctions graphiques pour visualiser et interpréter les résultats de lAFC.
( Vérifiez que vous disposez du package ade4 dans votre librairie de modules et sinon importer le package ade4.
Pour vérifier la liste des packages installés dans votre librairie (cf. en dur sur votre disque), utilisez la fonction « library() » et si le package ade4 ny figure pas, utilisez les fonctions « chooseCRANmirror() » et « install.packages() » pour sélectionner un miroir à partir duquel il vous sera possible de télécharger le package ade4 :
> library()# Une liste détaillant le contenu des packages installés sur votre ordinateur apparaît
> chooseCRANmirror()# Une liste de miroir apparaît, sélectionner le miroir « France (Lyon1) » par exemple (NB : une connexion Internet est nécessaire)
> install.packages("ade4")# Télécharge et installe le package ade4 dans votre librairie (NB : une connexion Internet est nécessaire)
( Une fois installer dans votre librairie de packages, il faut charger le package ade4 dans R.
Pour cela, utilisez la fonction « library() » :
> library("ade4")# Charge le package ade4 dans votre espace de travail actuel
> ?dudi.coa# Affiche laide de la fonction « dudi.coa() »
Lancement de lAFC
( Lancer lAFC sur le jeu de données « flo » (relevés en lignes et espèces en colonnes) en faisant bien attention dexclure la première colonne contenant les identifiants des relevés.
Pour cela, utilisez la fonction « dudi.coa() » et créez un objet qui va recevoir le résultat de votre AFC :
> monafc monafc# Affiche un résumé contenant lensemble des résultats de votre AFC
> summary(monafc)# Edite le rapport de votre AFC contenu dans lobjet « monafc »
Accéder aux valeurs propres de lAFC
( Récupérez les valeurs propres de chaque axe factoriel qui renseignent sur le pourcentage dinertie (variance) du nuage de points (relevés) portée par chaque axe factoriel.
Pour cela, utilisez et décortiquezlobjet « monafc » qui contient le vecteur de valeurs propres ou « eigenvalues » en anglais :
> monafc$eig# Renvoie le vecteur de valeurs propres issues de votre AFC
> inertie barplot(inertie, ylab="% d'inertie", names.arg=round(inertie, 2))# Affiche lhistogramme des valeurs propres classées de manière décroissante
> title("Eboulis des valeurs propres en %")# Ajoute un titre à votre histogramme
> screeplot(monafc)# Une façon plus rapide dobtenir la même chose
( Quel est le nombre d'axes à conserver ?
Edition des cartes factoriels
( Editez la position des espèces et des relevés dans le plan factoriel F1/F2 de votre AFC.
Pour cela, utilisez la fonction « scatter.coa() » :
> scatter.coa(monafc, clab.row=0, clab.col=0.5, sub="Espèces (radicaux) et relevés (points)", posieig="none")# Affiche le graphique du nuage de points des espèces et des relevés dans le plan factoriel F1/F2 avec les espèces situées aux barycentres des relevés dans lesquelles elles sont présentes et les relevés situé aux barycentres des espèces qui les composent
> par(mfrow=c(1, 2))# Découpe la fenêtre graphique en 1 ligne et 2 colonnes
> s.label(monafc$co, clab=0.7, label=colnames(flo[, 2:144]), boxes=FALSE, sub="Espèces")# Affiche la position des espèces dans le plan factoriel F1/F2
> s.label(monafc$li, clab=0.7, label= flo$Releve, boxes=FALSE, sub="Relevés")# Affiche la position des relevés dans le plan factoriel F1/F2
Interprétation de lAFC
Dépouillement de laxe 1
Analyse des espèces : interprétation des gradients écologiques sous-jacents
( Déterminez les contributions des espèces à la construction de laxe F1.
Pour cela, utilisez la fonction « inertia.dudi() » :
> inertia.dudi(monafc, col.inertia=T)$col.abs[, 1]# Affiche les valeurs absolues des contributions des espèces le long de laxe F1 de votre AFC
> plot(monafc$co[, 1], monafc$co[, 2], type="n", xlab="Axe F1",ylab="Axe F2")# Affiche un graphique vide prêt à accueillir vos valeurs
> text(monafc$co[, 1], monafc$co[, 2], lab=colnames(flo[, 2:144]), cex=(inertia.dudi(monafc, col.inertia=T)$col.abs[, 1]/max(inertia.dudi(monafc, col.inertia=T)$col.abs[, 1])+0.1))# Affiche les espèces avec une taille de texte proportionnelle à leurs contributions sur laxe F1
( Quelles espèces contribuent le plus à laxe F1 ?
( Observez l'autécologie de ces espèces dans une Flore pour vous aider à interpréter la signification de laxe F1.
( Quelles sont les caractéristiques communes des espèces situées au pôle négatif, qui s'opposent aux caractéristiques communes des espèces situées au pôle positif de laxe F1 ?
Quelques lignes de code très utiles pour visualiser le nom complet des espèces le long de laxe F1 :
> esp sco.distri(score=monafc$l1[, 1], df=flo[, 2:144], labels=esp[match(colnames(flo[, 2:144]), esp$Radical), "Espece"], clab=0.5)# Range les espèces le long de laxe F1
> par(mfrow=c(1,2))# Découpe la fenêtre graphique en 1 ligne et 2 colonnes
> sco.label(monafc$co[, 1], lab=esp[match(colnames(flo[, 2:144]), esp$Radical), "Espece"], reverse=TRUE, boxes=FALSE, horizontal=FALSE, pos.lab=0.3, clab=0.5, lim=c(-4, 4)))# Range les espèces le long de laxe F1
> sco.label(monafc$l1[, 1], horizontal = FALSE, boxes=FALSE, lab=flo$Releve, clab=0.5, lim = c(-4, 4))# Range les relevés le long de laxe F1
Analyse des relevés : confirmation de linterprétation par des variables mesurées sur le terrain
( Utilisez les variables mesurées sur le terrain et disponible dans le jeu de données « eco » pour confirmer votre interprétation de la signification écologique de laxe F1.
Pour cela, utilisez la fonction « s.class() » pour les variables qualitatives (type factor) et la fonction « s.value() » pour les variables quantitatives (type double) :
> s.class(monafc$li, as.factor(eco$Drainage), label=c("xero", "meso", "frais", "hydro"))# Affiche les relevés dans le plan factoriel F1/F2 et leurs appartenances à une ellipse représentant chacune une modalité de la variable drainage
> s.value(monafc$li, eco$Alt, method="greylevel", csize=0.2)# Affiche les relevés dans le plan factoriel F1/F2 avec des niveaux de gris fonction de laltitude des relevés (i.e., couleurs claires pour les basses altitudes et couleurs foncées pour les hautes altitudes)
> plot(eco$Alt, monafc$li[, 1], pch=20)# Affiche les coordonnées factorielles des relevés le long de laxe F1 (Y) en fonction de laltitude (X)
> summary(lm(monafc$li[, 1]~eco$Alt))# Edite les résultats dun modèle linéaire simple pour expliquer la position des relevés le long de laxe F1 en fonction de laltitude
> pred lines(eco$Alt[order(eco$Alt)], pred[order(eco$Alt)], lty=2, lwd=2)# Ajoute une droite de tendance au graphique précédant
( Quelles sont les variables qui expliquent le mieux laxe F1, pour lesquelles on maximise le R² ?
Dépouillement de laxe 2
( Que dire de laxe F2 ?
Analyse Factorielle des Correspondances appliquée à des données de présence/absence DATE 06/03/2014
AUTHOR jonathan lenoir Page PAGE 2