analyse multivariée de résultats de tests de détection de

95
ACADEMIE DE MONTPELLIER UNIVERSITE MONTPELLIER II (Sciences et Techniques du Languedoc) D.E.S.S. METHODES STATISTIQUES DES INDUSTRIES AGRONOMIQUES, AGROALIMENTAIRES ET PHARMACEUTIQUES MEMOIRE sur le stage - effectué du OS Mars 1996 au 03 Septembre 1996. - au Laboratoire d'Hydrologie de l'ORSTOM, de Montpellier. - par Mr Franck GAUTIER - soutenu le 04 Septembre 1996. - devant la commission d'examen. Jury : Mrs A. DELCAMP et A. GANNOUN - sur le sujet : ANALYSE MULTIVARIEE DE RESULTATS DE TESTS DE DETECfION DE RUPTURE SUR DES SERIES CHRONOLOGIQUES DE DONNEES PLUVIOMETRIQUES APPLICATION A LA REPRESENTATION SPATIO-TEMPORELLE SUR L'AFRIQUE DE L'OUEST NONSAHELIENNE

Upload: others

Post on 15-Nov-2021

3 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Analyse multivariée de résultats de tests de détection de

ACADEMIE DE MONTPELLIER

UNIVERSITE MONTPELLIER II

(Sciences et Techniques du Languedoc)

D.E.S.S.METHODES STATISTIQUES DES INDUSTRIES AGRONOMIQUES,

AGROALIMENTAIRES ET PHARMACEUTIQUES

MEMOIRE sur le stage

- effectué du OS Mars 1996 au 03 Septembre 1996.

- au Laboratoire d'Hydrologie de l'ORSTOM, de Montpellier.

- par Mr Franck GAUTIER

- soutenu le 04 Septembre 1996.

- devant la commission d'examen.

Jury : Mrs A. DELCAMP et A. GANNOUN

- sur le sujet :

ANALYSE MULTIVARIEE DE RESULTATS DE TESTS DE DETECfION DE RUPTURESUR DES SERIES CHRONOLOGIQUES DE DONNEES PLUVIOMETRIQUES

APPLICATION A LA REPRESENTATION SPATIO-TEMPORELLESUR L'AFRIQUE DE L'OUEST NON SAHELIENNE

Page 2: Analyse multivariée de résultats de tests de détection de

Ce mémoire a été réalisé sous la direction de Mademoiselle Hélène LUBES, que Je

remercie de m'avoir guidé avec beaucoup de sollicitude au cours de ce travail.

Je remercie respectueusement Mr Marc MORELL, Directeur du Laboratoire d'Hydrologie

de l'ORSTOM (Institut Français de Recherche Scientifique pour le Développement en

Coopération) de Montpellier, pour m'avoir accueilli au sein de ses locaux durant la durée du

stage.

Je remercie également Mr Jean-Marie FRITSCH, Responsable de l'Unité de Recherche:

Dynamiques, enjeux et usages des hydrosystèmes régionaux, pour m'avoir permis de participer au

travail de l'équipe du programme ICCARE.

Je souhaite exprimer ma gratitude envers Mr Robert SABATIER, pour son aide précieuse

tout au long du stage, et à Mlle Monique SIMIER, pour son soutien à l'usage du logiciel ADE.

Je voudrais adresser ma reconnaissance à tous les membres du Laboratoire d'Hydrologie,

pour leur accueil chaleureux parmi eux.

J'ai une pensée toute particulière pour tous les étudiants stagiaires que j'ai été ravi de

côtoyer pendant toute la durée du stage, notamment Mlle Hayet KHODJA, avec qui j'ai eu plaisir

à travailler.

Page 3: Analyse multivariée de résultats de tests de détection de

INTRODUCTION,

LES DONNEES.

1- Description des variables.

2- Séries chronologiques.

3- Matrice des données.

METHODES D'ANALYSE STATISTIOlJE.

1- Description des données.

2- Traitement des données binaires : AFC.

3- Analyse des Corre~ondancesMultiples: ACM.

3. 1- Codage disjonctif complet.

3.2- Description de l'ACM.

3.2.1- Réduction de l'information.

3.2.2- Représentation factorielle.

3.2.3- Mesure de l'inertie.

3.2.4- Contribution relative et absolue.

ANALYSE FACTORIELLE SUR I,'ENSEMBI.E DES VARIABLES.

1- Introduction.

2- AFC sur la première saison des pluies.

3- AFC sur la deuxième saison des pluies.

4- Interprétation des deux AFC.

S- Conclusion.

ANALYSES REDUITES A CERTAINES VARIABLES.

1- Introduction.

2- ACM avec la première saison des pluies.

3- ACM avec la deuxième saison des pluies.

4- Interprétation des deux ACM.

S- Conclusion.

p02.

p02.

p03.

p04.

pOS.

pOS.

pOS.

p06.

p06.

p06.

p06.

pO?

pO?

p08.

pOlO.

pOlO.

pOllo

pOlI.

pOIS.

pOIS.

pOl?

pOl?

p018.

p020.

p023.

p024.

Page 4: Analyse multivariée de résultats de tests de détection de

ANALYSE TENANT COMPTE DE l,A DATE DE RlJPTIJRE. p026.

1- Introduction. p026.

2- Analyse des données. p027.

3- Interprétation et cartographie des résultats. p029.

4- Conclusion. p031.

REpONSE"ANOMALIE" CONSIDEREE COMME RUPTURE. p033.

1- Introduction. p033.

2- Analyse des données. p033.

3- Conclusion. p036.

ANALYSE AVEC UNE VARIABLE SUPPLEMENTAffiE. p037.

1- Introduction. p037.

2- Analyse des données. p038.

3- Conclusion. p040.

ANALYSE SUR L'ENSEMBLE DES VARIABLES. p04l.

1- Introduction. p041.

2- Analyse des données. p042.

3- Conclusion. p044.

ANALYSE AVEC LA DATE DE RUPTURE ASSOCIEE A SA PROBABILITE. p046.

1- Introduction. p046.

2- Analyse des données. p047.

CONCLUSION GENERALE. p052.

BmLIOGRAPRIE·

ANNEXES.

Page 5: Analyse multivariée de résultats de tests de détection de

LISTE DES FIGURES;

- Figure n° 1 : Cartographie de toutes les stations de mesure. p02.

- Figure n02 : Tableau des données brutes. p04.

- Figure n03 : Tableau des données de l'AF.C. sur l'ensemble des variables. pOlO.

- Figure n04 : AF.C. sur l'ensemble des variables.

- Représentation des variables dans le plan factoriel 1-2. p012.

- Figure n05 : AF.C. sur l'ensemble des variables.

- Représentation des stations dans le plan factoriel 1-2. pO 12.

- Figure n06 : AF.C. sur l'ensemble des variables.

- Représentation des variables dans le plan factoriel 1-2. pO 14.

- Figure n07 : AF.C. sur l'ensemble des variables.

- Représentation des stations dans le plan factoriel 1-2. p014.

- Figure n08 : Tableau des données de l'AC.M.réduite à certaines variables. pO 17.

- Figure n09 : AC.M. réduite à certaines variables.

- Représentation des variables dans le plan factoriel 1-2. p019.

- Figure nOlO : AC.M. réduite à certaines variables.

- Représentation des stations dans le plan factoriel 1-2. p019.

- Figure nOIl : A C.M. réduite à certaines variables.

- Représentation des variables dans le plan factoriel 1-2. p021.

- Figure nO 12 : AC.M. réduite à certaines variables.

- Représentation des stations dans le plan factoriel 1-2. p021.

- Figure nOl3 : Cartographie de l'AC.M. réduite à certaines variables.

- Première saison des pluies. p023.

- Figure n014 : Cartographie de l'AC.M. réduite à certaines variables.

- Deuxième saison des pluies. p024.

- Figure n015 : Tableau des données de l'AC.M.tenant compte de la date de rupture. p026.

- Figure n° 16 : AC.M. tenant compte de la date de rupture.

- Représentation des variables dans le plan factoriel 1-2. p028.

- Figure nO 17 : AC.M. tenant compte de la date de rupture.

- Représentation des stations dans le plan factoriel 1-2. p028.

- Figure n018 : Cartographie de l' AC.M. tenant compte de la date de rupture. p030.

Page 6: Analyse multivariée de résultats de tests de détection de

- Figure n019 : AC.M. avec l'Anomalie considérée comme rupture.

- Représentation des variables dans le plan factoriel 1-2. p034.

- Figure n020 : AC.M. avec l'Anomalie considérée comme rupture.

- Représentation des stations dans le plan factoriel 1-2. p034.

- Figure n02l : Cartographie de l' AC.M. avec l'Anomalie considérée comme rupture. p035.

- Figure n022 : Tableau de données de l'AC.M. avec une variable supplémentaire. p037.

- Figure n023 : A C.M. avec une variable supplémentaire.

- Représentation des variables dans le plan factoriel 1-2. p039.

- Figure n024 : AC.M. avec une variable supplémentaire.

- Représentation des stations dans le plan factoriel 1-2. p039.

- Figure n025 : Cartographie de l' AC.M. avec une variable supplémentaire. p040.

- Figure n026 : AC.M. avec l'ensemble des variables.

- Représentation des variables dans le plan factoriel 1-2. p043.

- Figure n027 : AC.M. avec l'ensemble des variables.

- Représentation des stations dans le plan factoriel 1-2. p043.

- Figure n028 : Cartographie de l'AC.M. avec l'ensemble des variables. p044.

- Figure n029 : AC.M. sur la date de rupture associée à sa probabilité.

- Représentation des variables dans le plan factoriel 1-2. p048.

- Figure n030 : AC.M. sur la date de rupture associée à sa probabilité.

- Représentation des stations dans le plan factoriel 1-2. p048.

- Figure n03l : A C.M. sur la date de rupture associée à sa probabilité.

- Représentation des variables dans le plan factoriel 1-3. p049.

- Figure n032 : AC.M. sur la date de rupture associée à sa probabilité.

- Représentation des stations dans le plan factoriel 1-3. p049.

- Figure n033 : Cartographie de l'AC.M. avec la date de rupture associée à sa probabilité. p050.

Page 7: Analyse multivariée de résultats de tests de détection de

Depuis plus d'une vingtaine d'années, l'Afrique de l'Ouest non Sahélienne semble

soumise à une modification de son régime pluviométrique, qui se traduit le plus manifestement par

une diminution des quantités annuelles précipitées.

L'étude de ces variations climatiques est très importante dans une région où la vie, basée

sur l'agriculture, est régie par le régime pluviométrique et ses fluctuations.

Le volet "pluie" du programme ICCARE (Identification et Conséquences d'une variabilité

du Climat en AfRique de l'ouest non sahElienne), fait partie du projet FRIEND (Flow Regimes

from International and Experimental Network Data) AOC (Afrique de l'Ouest et Centrale) de

l'UNESCO sous la thématique "Régionalisation Hydrologique", et a pour objectif de caractériser

les variations climatiques survenues au cours de ces quarante dernières années, par l'analyse de

séries chronologiques de données de pluie de nature diverse (totaux annuels, saisonniers, début et

fin des saisons des pluies.... ), à différentes stations de mesure.

L'hypothèse de départ est celle d'une variation brutale du régime pluviométrique d'où la

mise en oeuvre de tests de détection de rupture en moyenne sur les séries chronologiques

constituées en chaque poste, pour chaque variable étudiée.

Les résultats de ces tests ont été cartographiés variable par variable, mais aucune organisation

spatiale des réponses aux variations climatiques n'a pu être mise clairement en évidence par ces

analyses univariées.

Après de telles analyses ponctuelles, il convient donc d'effectuer des analyses multivariées,

afin d'obtenir une cartographie de la réponse globale rupture-non rupture de chaque station pour

l'ensemble des variables, et de permettre une classification des stations, c'est à dire de regrouper

(régionaliser) des stations aux comportements similaires.

L'objectif de ces analyses multivariées est donc de permettre de mieux identifier les

modifications du comportement pluviométrique de cette région d'Afrique.

Page 8: Analyse multivariée de résultats de tests de détection de

Figure nO 1 : cartographie de toutes les stations de mesure.

Echelle 1 cm = 257.9 km

r--'­1i1

Tchad

\

\1

/

**

*

*Nigeria

**

*

* *

Niger

**

* *Cameroun*

~ *** * **

\* ** * * * *1

*

*

*

Mali

* ** *•**

,,\

\\\i

.----------.ll-J

l ... . _

Page 9: Analyse multivariée de résultats de tests de détection de

La zone initiale de l'étude est constituée de 271 stations de mesure réparties sur

les 16 pays suivants, de l'Afrique de l'Ouest non Sahélienne, entre les latitudes 2 et 14° nord et les

méridiens de longitude 18° ouest et 28° est : Bénin, Burkina Faso, Cameroun, Centrafrique, Côte

d'Ivoire, Gambie, Ghana, Guinée Bissau, Guinée Conakry, Liberia, Mali, Nigeria, Sénégal, Sierra

Leone, Tchad, Togo.

1- DescriIWon des yariahJes :

Le régime pluviométrique des stations a été décrit par 6 variables de pluie (appelées Points

dans le programme ICCARE).

- Variable 1 : hauteur annuelle des précipitations.

- Variable 2 : dates de début et de:fin de la saison des pluies (2 caractères).

- Variable 3 : cumul maximal des pluies sur trois décades consécutives et rapport de ce cumul

des 3 décades sur les 9 décades qui l'encadrent (2 caractères).

- Variable 4 : hauteur et centre de gravité des précipitations en saison sèche (2 caractères).

- Variable 5 : nombre de jours pluvieux classés selon l'amplitude de la pluviométrie journalière

(5 caractères: pluie faible, modérée, modérée à forte, forte, et très forte).

- Variable 6 : nombre de jours de pluie dans l'année.

Certaines stations ont un régime pluviométrique à deux saisons des pluies (quelques

stations au Bénin, au Cameroun, en Côte d'Ivoire, et au Togo), ce qui change la description de

ces stations par les variables.

La variable 2 possède alors quatre caractères : dates de début et de :fin des deux saisons des

pluies.

La variable 4 passe aussi à quatre caractères : hauteur et centre de gravité des deux saisons des

pluies.

La variable 3 correspond alors à la hauteur des deux saisons des pluies et au rapport de la

hauteur de la deuxième saison sur la première (trois caractères).

2

Page 10: Analyse multivariée de résultats de tests de détection de

Les analyses multivariées qui vont être réalisées par la suite, nécessitent un codage unique

pour toutes les stations, qu'elles soient à une ou à deux saisons de pluie.

Comme la variable 3 décrit des événements bien différents selon le nombre de saisons

considérées, il est difficile de respecter un codage uniforme sur toutes les stations pour cette

variable.

De plus les résultats obtenus pour cette variable par les tests de détection de rupture ont conduit

l'équipe d'hydrologues du programme ICCARE à remettre en cause sa pertinence, par conséquent

elle ne sera jamais prise en compte durant toutes les analyses réalisées.

2- Séries chronologiques:

Les stations sont décrites par les variables pluviométriques, sur une période allant de 1950

à 1990, soit 40 ans, à raison d'une observation par variable et par an.

Ces séries chronologiques, correspondant chacune à une station et une variable pluviométrique

données, ont été soumises à des tests de détection de rupture, au nombre de trois: test de Pettitt

(Pettitt,1979), procédure Bayesienne de Lee et Heghinian (Lee et Heghinian, 1977),

Segmentation de Hubert (Hubert et al., 1989). Ce sont les résultats de ces tests qui seront soumis

aux analyses multivariées.

Les résultats de ces tests correspondent à des dates de rupture dans la série

chronologique. Mais dans un premier temps dans la présente étude, les résultats considérés sont

une réponse rupture - non rupture, et dans un deuxième temps l'information date de rupture sera

analysée.

Tous les tests ne donnent pas toujours le même résultat pour une série chronologique

donnée. Lorsque le test de Pettitt (test jugé le plus significatif) ne détectait aucune rupture

contrairement aux deux autres tests, la date de rupture identifiée par ces derniers, est retenue mais

marquée sous le code "anomalie". Cette rupture notée sous cette forme est donc a priori jugée

moins fiable que les autres.

3

Page 11: Analyse multivariée de résultats de tests de détection de

3- Matrice des données;

La matrice formée par les résultats des tests de rupture : avec en lignes les stations de

mesure et en colonnes les variables pluviométriques, l'intersection correspondant à une date de

rupture, comporte de nombreuses données manquantes.

Ces lacunes sont dues soit à une coupure (années manquantes) dans la série chronologique, ce

qui n'a pas permis son analyse par les tests statistiques, soit à un problème de collecte dans

certains pays.

En effet, les stations de quelques pays (Gambie, Ghana, Liberia, Nigeria, et Sierra Leone) ne

sont décrites que par la première variable, ce qui rend leur prise en compte dans l'étude

impossible. De même le Tchad, où seules les variables l, 5 et 6 sont présentes, ne sera pas

considéré lors des différentes études.

Les analyses réalisées par la suite ne comporteront pas un nombre constant de stations.

Selon les variables considérées dans chaque analyse, le nombre de stations prises en compte sera

le plus élevé possible, le but étant de réaliser une cartographie représentant au mieux l'ensemble

de la zone d'étude.

Figure n02 : Tableau des données brutes.271 lignes et 11 colonnes.

1Variables

11

1

Stations

271

oou année oou année

oou année oou année

4

Page 12: Analyse multivariée de résultats de tests de détection de

1- Descrigtion .des lWnnées ;

Les données initiales sont des données quantitatives organisées sous forme de

séries chronologiques, correspondant aux différentes variables pluviométriques.

Ces données ont été soumises à une batterie de tests statistiques, dans le but de détecter des

dates de rupture dans ces séries.

La base de données à analyser est donc constituée des résultats de ces différents tests.

Les résultats peuvent être considérés sous deux aspects bien distincts: soit sous forme binaire,

rupture ou non rupture dans la série chronologique, soit sous forme de dates de rupture, avec

comme donnée la date précise (de 50 à 90), sinon un 0 pour le cas d'une absence de rupture.

Ces deux formes de résultats se distinguent par la nature des données : sous forme binaire

les données sont qualitatives, tandis que sous l'autre elles sont quantitatives discrètes.

Les données quantitatives de cette forme ne peuvent être soumises directement à une analyse. TI

convient de les transformer en données qualitatives, en appliquant un codage approprié, avant

d'envisager un quelconque traitement d'analyse multivariée.

2- TraitçIqentdes données binaires : AFC,

Les données sont analysées dans un premier temps sous leur forme binaire (rupture ou non

rupture) par une Analyse Factorielle des Correspondances (AFC).

L'AFC est une méthode qui permet d'analyser les tableaux de variables qualitatives, mises

sous forme disjonctive (codage binaire 1 ou 0).

Elle a pour but d'étudier les liaisons (dépendances) entre les caractères qualitatifs, en comparant

les profils lignes (profil-ligne = réponses d'un individu sur l'ensemble des variables) ou les profils

colonnes (profil-colonne = réponses d'une variable sur l'ensemble des individus) au profil marginal

des lignes ou des colonnes.

5

Page 13: Analyse multivariée de résultats de tests de détection de

3- Au.a.lyse des CorreSJlQ.WlJlnçes MultiDles :AçM~

Dans un deuxième temps, les données traitées sont sous la forme de dates de rupture

(données quantitatives discrètes). Elles ne peuvent pas être analysées directement et nécessitent

un codage particulier pour les rendre qualitatives et donc analysables.

L'Analyse des Correspondances Multiples (ACM) est une des techniques de description

qui s'applique le mieux à ce genre de données.

Elle s'applique à des données qualitatives ou à des données quantitatives qui ont été

préalablement disjonctivées sous forme de classes, ce qui les rend assimilable à des données

qualitatives.

Dans cette étude les dates de rupture ont subi un codage disjonctif complet, pour pouvoir par la

suite être analysées par une ACM.

3.1- Codage disjonctif compld..;,

Un codage disjonctif complet consiste à couper chacune des variables en un certain

nombre de modalités (en général impair). Le tableau de données comprend alors autant de

colonnes que de modalités créées.

Ensuite un codage binaire est utilisé pour remplir ce tableau, on applique un 1 quand l'individu

possède la modalité de la variable donnée, et un 0 dans le cas contraire. Ainsi, la somme des

nombres en ligne du tableau doit correspondre au nombre de variables de l'étude.

Donc, dans un codage disjonctif complet, les diverses modalités de réponse s'excluent

mutuellement (pour une variable, on ne peut choisir qu'une seule modalité). De plus, une modalité

est obligatoirement choisie par variable (Lebart et al., 1977).

Dans un tableau disjonctif complet, les lignes formées par les réponses des individus aux

variables sont appelées profils-lignes, tandis que les colonnes formées par le comportement des

variables vis à vis des différents individus sont appelées profils-colonnes.

3.2- Description d.ù'ACM ;

3.2.1- Réduction de ('information:

L'ACM a pour but de réduire l'information contenue dans le tableau à analyser, qm

correspond à un espace IR à q dimensions, pour passer à un espace à 2 ou 3 dimensions, afin d'y

6

Page 14: Analyse multivariée de résultats de tests de détection de

représenter simultanément les individus et les variables, le tout en concentrant le maximum

d'information dans ces deux ou trois dimensions restantes (Diday et al., 1982).

Les axes factoriels issus de l'ACM sont constitués de telle manière qu'ils expriment le

pourcentage d'information (inertie) le plus important possible. A chaque axe est associée une

valeur propre qui mesure ce pourcentage d'inertie.

L'ACM va regrouper les individus qui ont des profils-lignes proches, de même qu'elle

regroupe les modalités des variables qui ont un profil-colonne similaire.

3.2.2- Représentation factorielle:

La représentation factorielle (abscisse sur un axe factoriel) d'un individu (profil-ligne) est

égale à la moyenne arithmétique simple des modalités auxquelles il appartient. De même,

l'abscisse d'une modalité sur un axe factoriel est égale à la moyenne arithmétique des abscisses

des individus qui l'ont choisie comme réponse (Lebart et al., 1977).

Le critère de la représentation est de maximiser la dispersion (variance) des points modalités

autour du centre de gravité général des individus. C'est à dire de rendre maximale la somme des

carrés des rapports de corrélation(l) entre les individus et les variables (Diday et al., 1982).

3.2.3- Mesure de l'inertie:

L'inertie mesure le pourcentage d'information contenue dans un tableau de données et

rendue par une analyse, ACM par exemple.

L'inertie totale d'une ACM dépend du nombre de variables et du nombre de modalités de

chacune d'elles. Elle ne dépend pas des liaisons entre les variables, donc son étude sert peu

(Bouroche et Saporta, 1992).

L'inertie totale du tableau est égale à la somme des valeurs propres (Âi ), mais aussi égale au

rapport du nombre de modalités sur le nombre de variables moins 1 :l-Q

Inertie =L Âi = ~ - 1 où J est le nombre de modalités et Q le nombre de variables.;=1

(1) _ Le rapport de corrélation est pour chaque variable, chaque modalité, la variance des scoresdes modalités rapportée à la variance des scores des individus. TI indique dans quelle mesure unaxe prend en compte une variable.

7

Page 15: Analyse multivariée de résultats de tests de détection de

En ACM, l'inertie obtenue pour chacun des axes factoriels est toujours faible, donc on se

contente d'un pourcentage peu important pour l'interprétation, qui se borne en général au premier

plan factoriel.

La part d'inertie due à une variable est proportionnelle à son nombre de modalités :

Iq = nqQ" 1 où llq est le nombre de modalités de la variable q.

Quand on découpe les variables en modalités, il faut donc éviter d'avoir un écart trop grand dans

le nombre de modalités de chaque variable, si l'on ne veut pas privilégier une variable en lui

accordant une part d'inertie trop importante par rapport aux autres.

La part d'inertie due à une modalité est inversement proportionnelle à son effectif :

lj = ~ (1- ~) où nj est l'effectif de la modalité j et n le nombre total d'individus.

Plus l'effectif d'une modalité est faible, plus l'inertie est importante. Donc lors du codage, il faut

éviter de former des modalités d'effectifs trop différents. La somme de chacune des colonnes du

tableau disjonctif complet ne doit pas trop varier selon la colonne considérée.

3.2.4.- Contribution relative et absolue:

L'interprétation de la représentation des variables et des individus dans un des plans

factoriels de l'ACM, s'effectue par l'analyse conjointe des contributions relatives et absolues des

variables puis des individus sur chacun des axes factoriels.

Ainsi on peut dire qu'un axe est représenté par une variable donnée (ou par un individu) que si

les deux contributions (absolue et relative) qui lui correspondent sur cet axe sont élevées.

La contribution relative d'une modalité (ou d'un individu) représente la qualité de la

représentation de cette modalité sur l'axe factoriel considéré. Exprimée en pourcentage, la

contribution relative (appelée CTR) correspond à la part prise par un axe factoriel donné dans la

reconstitution des données contenues dans une modalité ou dans un individu.

- Contribution relative pour un individu i sur l'axe k :

• •• • Cki2 coord2

CTR (mdlVldu 1, axe k) = J-Q =L~~ 2 coord2

L..J CIi

1=1

où Cki est la composante principale (coordonnée) de l'individu i sur l'axe factoriel k.

- Contribution relative pour une modalité j sur l'axe k :

ak· 2

CTR ( axe k, variable j) = J _Q J

Lal/1=1

8

Page 16: Analyse multivariée de résultats de tests de détection de

où akj est l'axe principal (coordonnée) de la modalité j sur l'axe factoriel k.

Une modalité est bien représentée dans le plan factoriel considéré et donc interprétable sur

cet axe, si la CTR est importante, en générale supérieure à 70%.

La contribution absolue d'une modalité (ou d'un individu) est la part prise par cette

modalité dans la représentation du plan factoriel et donc des axes. Une contribution absolue

(appelée CTA) importante pour une modalité (ou un individu) sur un axe donné signifie que

l'information contenue sur cet axe est surtout imputable à cette modalité.

Une contribution absolue est considérée comme importante si sa valeur est supérieure au poids

(effectif) de la modalité concernée. Dans le cas d'une pondération uniforme des colonnes et des

lignes une CTA est significative si elle est supérieure à la contribution absolue moyenne.

- Contribution absolue pour une modalité j sur l'axe k :

(. ,~\ n.j aki

2

CTA axe k, modalite JI = nQ Âk

où n.j est le nombre d'individu portant la modalité j et Âk est la kème valeur propre.

- Contribution absolue pour un individu i sur l'axe k :. ... 1 Cki

2

CTA (mdlvldu 1, axe k) =-~n J\,k

Par l'étude des contributions absolues on peut interpréter l'information contenue sur les

axes factoriels. En faisant un parallèle entre la représentation des modalités et celle des individus,

on arrive à former des groupes d'individus et à leur associer un comportement défini par les

modalités.

L'avantage de l'Analyse des Correspondances Multiples est de faire apparaître

explicitement toutes les modalités de chaque variable, ce qui permet donc une interprétation

efficace des données contenues dans le tableau initial.

De plus l'ACM permet de décrire toutes les liaisons non linéaires entre les variables, grâce au

codage disjonctif complet des variables quantitatives (Bouroche et Saporta, 1992).

Toutes les analyses seront réalisées sous le logiciel ADE-4 (Analyse de Données

Ecologiques), développé par le CNRS de Lyon1 par D. Chessel et S. Dolédec.

9

Page 17: Analyse multivariée de résultats de tests de détection de

Figure n0 3 ; Tableau des dOQnées.

72 lignes et Il colonnes

Variables1 11

1

Stations

72

1 ou 0 1 ou 0

louO 1 ou 0

Page 18: Analyse multivariée de résultats de tests de détection de

1- Intrndndion i

La première analyse est réalisée en tenant compte de l'ensemble des variables

pluviométriques, soit Il variables.

Les données ne sont présentes sur l'ensemble des variables que pour 72 stations, les autres

possédant des lacunes pour au moins une des variables.

Le tableau croise donc 72 lignes à Il colonnes, l'intersection des deux étant la réponse aux tests

de détection de rupture.

Cette analyse a été réalisée avec un codage binaire simple, une date de rupture est codée

par un 1 et une série sans rupture est codée o.Par contre, l'hypothèse de départ est que la rupture dans le régime pluviométrique de la région

étudiée semble se situer, si elle existe, autour des années 70. Les ruptures étant situées à d'autre

moment sont jugées moins intéressantes, par conséquent on ne considère comme effective que les

ruptures ayant eu lieu autour des années 70, c'est à dire entre 1965 et 1975 (soit une marge de 5

ans autour de la date estimée).

Ce tableau de données qualitatives est soumis à une Analyse Factorielle des

Correspondances (AFC).

Pour cette étude, la notion d'anomalie a été considérée comme étant une rupture, la justification

de ce choix fera l'objet d'une étude particulière.

Certaines stations possèdent deux saisons des pluies, donc il convient de réaliser deux

études distinctes, en considérant d'abord les données de la première saison des pluies et dans un

deuxième temps celles de la deuxième saison.

Les stations ne possédant qu'une seule saison de pluies, sont toujours analysées avec les

données de la saison unique, même dans la seconde étude.

Les deux études sont identiques en tout point, 72 lignes pour Il colonnes avec le même codage

binaire, seules les données diflèrent en partie.

10

Page 19: Analyse multivariée de résultats de tests de détection de

2- A.F.e avec la gremière saison lkuluies :

Cette première analyse ainsi réalisée donne une inertie de 35.93%, pour le premier

plan factoriel (axe 1 : 20.10 et axe 2 : 15.83). Ce pourcentage d'information expliquée par l'AFC

est faible, et donc ne permet pas une interprétation totale de l'information contenue dans le

tableau des données.

li faut 6 axes pour avoir une inertie correcte, soit 80.67%, mais l'interprétation de l'information

sur autant d'axes est difficile. Ainsi l'interprétation des résultats ne sera faite que sur le premier

plan factoriel de l'analyse.

Le premier axe factoriel sépare la variable 4 (centre de gravité de la saison sèche: 4gv) de

toutes les autres variables. Toutes les variables représentent mal l'axe l, saufla variable 4gv, qui a

une forte contribution absolue: 6715(1) , et qui donc prend une forte part explicative dans la

construction de cet axe, la contribution absolue moyenne étant de 909 (10.000/11).

Le deuxième axe factoriel oppose les deux modalités de la variable 2 (début, codé 2d, et

fin, codée 2f, de la saison des pluies). Les autres variables sont mal représentées (faible

contribution relative) ou peu explicatives (faible contribution absolue), et donc non interprétables.

La représentation des stations dans le plan factoriel 1-2 ne permet pas de faire apparaître

distinctement des groupes de stations au comportement voisin vis à vis de l'ensemble des

variables.

En effet, les stations sont réparties dans l'ensemble du plan factoriel et ne forment pas

d'agglomérats bien distincts.

Donc, aucune interprétation au niveau des stations n'est envisageable à partir de cette analyse,

encore moins une représentation spatiale de leurs comportements pluviométriques.

3- A.F.e avec la deuxième saisou..des pluies:

Cette deuxième étude est similaire à la première au niveau de la formation en

lignes et en colonnes du tableau des données, mais aussi au niveau des conclusions.

Seules quelques données ont changé, puisque l'on considère maintenant la deuxième

saison des pluies. Ces changements n'affectent que 16 stations sur les 72 considérées (6 stations

en Côte d'Ivoire, 4 au Bénin, 3 au Cameroun et 3 au Togo).

(1) - Les contributions absolues et relatives sont toujours exprimées en 1110000.

11

Page 20: Analyse multivariée de résultats de tests de détection de

Figure 0°4 : A.I.e. sur l'ensemble des variables.

72 stations (lignes) et 11 variables (colonnes)première saison des pluies

- Représentation des variables dans le plan factoriel 1-2 -

Inertie du plan factoriel : 35.94%

a

2d

a0+

6 •

4hs ala

a 4gv a80+

a20+

a95+

a 50+2fa

Codage des variables:- 1 : variable 1.- 2d : variable 2, début de la saison des pluies.- 2f: variable 2, fin de la saison des pluies.- 4hs : variable 4, hauteur de la saison sèche.- 4gv: variable 4, centre de gravité de la saison sèche.- 0+ : variable 5, nombre de jours à pluie faible.- 20+: variable 5, nombre de jours à pluie modérée.- 50+: variable 5, nombre de jours à pluie modérée à forte.- 80+: variable 5, nombre de jours à pluie forte.- 95+: variable 5, nombre de jours à pluie très forte.- 6 : variable 6.

Page 21: Analyse multivariée de résultats de tests de détection de

figure nOS: A.F.C. sur l'ensemble des variables.

72 stations (lignes) et Il variables (colonnes)première saison des pluies

- Représentation des stations dans le plan factoriel 1-2 -

Inertie du plan factoriel 1-2 : 35.94%.

..a b15

p19a

b14

h4 e14 ..k16 ~l5 b13

b10a ..k13 d14

h13 ..

a23 a26 k5 .. h8cl .. .. .. h7a

k18 a24 h10 .. b4 ..a a el h12 d22 a hll

m6 a14 a am10a a p25

e13

k-14 h9..h17

b2 akI a k3 i9

ah2 e3aa

il7 a ah1a h6 m9 Da e17c17 h14a d12c19

ah5 kI1a al 7

aab7 i4 e22

ab16e20 ai 8 a

ab18 e19 p22

a ab9

ap18

a p9

a b5 h15aa6 h3aa a

m5am12

k4a

12

Page 22: Analyse multivariée de résultats de tests de détection de

L'inertie de cette seconde étude est de 37.25% pour le premier plan factoriel. Ce

pourcentage d'information expliquée est faible, et ne permet pas une interprétation complète des

données.

TI faudrait conserver au moms 6 axes (80.13%) pour atteindre un pourcentage d'inertie

suffisamment représentatif de l'information contenue dans le tableau de données, mais

l'interprétation sur autant d'axes est difficilement réalisable.

On se contente donc du premier plan factoriel pour une première amorce d'explication des

données.

Le premier axe factoriel isole des autres variables, la variable 4gv (centre de gravité de la

saison sèche), qui représente très bien l'axe l, avec une forte contribution absolue de 6073.

Les autres variables sont soit mal représentées soit peu représentatives de l'information

contenue sur cet axe.

Le deuxième axe factoriel oppose la variable 2d (début de la saison des pluies) à la

variable 4gv. Contrairement aux autres variables qui ont une contribution absolue faible

(inférieure à 600), ces deux variables ont de fortes contributions relatives, respectivement de 6660

et de 1376.

La représentation des stations dans le plan factoriel 1-2 permet de faire apparaître quatre

groupes distincts.

Le groupe 1 correspond à la variable 4gv, le groupe 2 à la variable 2d, le groupe 3 aux deux

variables précédentes, et le dernier groupe aux autres variables, non représentatives dans ce plan.

Donc chaque groupe de stations correspond à une seme variable (deux tout au plus).

L'intérêt de l'AFC est de former des groupes de stations qui ont un comportement proche

vis à vis de l'ensemble des variables considérées (analyse multivariée). Or dans cette étude les

groupes ne correspondent qu'à une seme variable comme dans une analyse univariée, la

signification de ces groupes n'a donc que peu de valeur.

13

Page 23: Analyse multivariée de résultats de tests de détection de

Figure p06 ; A.F.C. sur l'ensemble des yariables.

72 stations (lignes) et Il variables (colonnes)deuxième saison des pluies

- Représentation des variables dans le plan factoriel 1-2 -

Inertie du plan factoriel 1-2 : 37.25%

a

2d

a 2f

180+ aa

a

a 620+

95+a 50+

aa

4hs

a

0+

4gv

Page 24: Analyse multivariée de résultats de tests de détection de

Figure n07 : A.F.C. sur J'ensemble des variables.

72 stations (lignes) et Il variables (colonnes)deuxième saison des pluies

- Représentation des stations dans le plan factoriel 1-2 -

Inertie du plan factoriel 1-2 : 37.25%

ab14

p18"b9

a

blDa

k13

b2

b18 ele14 a ae 3

e2D

a

b7

a23 a

h2 k4a a k14

i17 kl a e17cl a k3 a h6

Groupe 3

e22 a

ab5

i9a

am12

Groupe 4

h3 a

am5

a h9 ab17

hl aa17 d12

akll a

p22

ak5 h8

i4 a

e13a

a

a b13

a

ah13

a26a

b16

ah15

ah7

14

Page 25: Analyse multivariée de résultats de tests de détection de

4- Ioterprétati..2D des deux A,FtC :

Le principe de l'AFC est de calculer les distances entre individus et entre variables,

afin d'isoler les variables (ou les stations) en fonction de leur variance, les variables à variance

forte étant isolées en premier sur le premier axe, qui porte l'inertie la plus importante.

En AFC, l'inertie totale est égale à la somme des valeurs propres:q

Inertie totale =L Âi

i=l

Donc une variable isolée par l'axe 1 est une variable à forte variance, c'est à dire que peu de

stations possèdent ce caractère.

Les variables isolées par les deux analyses précédentes, sont des variables qui sont "rares",

c'est à dire que peu de stations de la zone d'étude ont présenté une rupture dans leur série

chronologique pour ces variables.

Les variables "rares" sont mises en avant par l'AFC alors qu'en fait elles ne représentent qu'un

phénomène peu important, vu le faible nombre de stations concernées par une rupture pour ces

variables.

De plus, l'analyse du tableau récapitulatif des études univariées (cf annexe 3), effectuées sur

l'ensemble de la zone d'étude, donc variable par variable, montre que les variables ne réagissent

pas uniformément aux tests de détection de rupture.

Par conséquent, la prise en compte des variables 2d et 2t: de la variable 4gv, et de toutes les

modalités de la variable 5 ne semble donc pas judicieuse, dans l'analyse des variations climatiques

de la zone intéressée.

Les prochaines analyses seront réalisées en ne tenant compte que des variables présentant

des pourcentages significatifs de taux de rupture (variables 1, 4hs et 6).

5- Cooçlusioll..&

Ces deux premières études sont basées sur un codage binaire des réponses aux

tests de détection de rupture, en considérant l'ensemble des variables pluviométriques mesurées.

L'AFC a permis de montrer une grande disparité entre les taux de rupture de chaque

variable, si bien que les variables où ce taux est faible, ont été mises en avant par l'analyse. En

conséquence, la représentation des stations n'est interprétable que par ces quelques variables.

15

Page 26: Analyse multivariée de résultats de tests de détection de

De plus aucun groupe significatif de stations n'est apparu distinctement.

Le nombre de stations gardées pour ces études est faible et relativement insuffisant pour

permettre de couvrir l'ensemble de la zone étudiée.

La réalisation des deux AFC avait pour but de comparer le comportement des variables et

des individus face au changement de saison des pluies.

Cependant, les représentations des variables et des individus dans chacune des analyses ne

permettent pas encore de conclure sur les différences apportées par la considération de l'une ou

de l'autre des saisons des pluies.

Lors des prochaines analyses, la réduction du nombre de variables à celles ayant eu un

taux significatif de rupture, doit permettre de mettre en évidence des groupes de stations

interprétables.

16

Page 27: Analyse multivariée de résultats de tests de détection de

Figure nOS: Tableau des données.

83 lignes et 8 colonnes

Variables

1

Stations

83

1 4 6

neu ano rupt neu ano rupt neu rupt

1 ou 0 1 ou 0 1 ou 0 louO 1 ou 0 1 ou 0 1 ou 0 1 ou 0

1 ou 0 1 ou 0 1 ou 0 louO 1 ou 0 1 ou 0 1 ou 0 1 ou 0

Page 28: Analyse multivariée de résultats de tests de détection de

l-Int.rndudion....:.

Les analyses univariées, réalisées variable par variable sur les résultats des tests de

détection de rupture, montrent l'existence de disparité entre les réponses des diverses variables.

Les variables 1, 4 et 6 sont les trois variables qui ont le mieux réagi aux tests.

En effet, pour de nombreuses stations de mesure, une rupture a été détectée dans la série

chronologique analysée, pour au moins une de ces trois variables.

La variable 2 a elle aussi donné beaucoup de ruptures dans ses séries chronologiques, mais un

peu moins que les trois variables précédentes.

Par contre, les tests n'ont que rarement détecté des ruptures dans les séries chronologiques de

l'ensemble des stations pour la variable 5, quelle que soit la modalité considérée.

La prochaine analyse réalisée est une Analyse des Correspondances Multiples (A. C.M) qui

ne tient compte que des variables 1, 4 et 6.

Le tableau de cette étude croise 83 stations en lignes et 8 variables en colonnes. Seules 83

stations ne présentent aucune donnée manquante pour les trois variables considérées.

Le codage des trois variables prend en compte toutes les réponses possibles aux tests de

détection de rupture, c'est à dire pas de rupture, anomalie et rupture, qui sont codées

respectivement p, a et r.

Seule la première modalité de la variable 4 (hauteur des précipitations en saison sèche) a

été conservée pour cette étude.

La deuxième modalité (centre de gravité) offre peu de rupture dans ses séries chronologiques et

ne semble pas être un critère définissant bien le régime pluviométrique.

L'ACM est appliquée à un tableau disjonctif complet, ainsi chaque variable est divisée en

trois modalités qui correspondent aux trois critères de réponse aux tests de détection de rupture.

La variable 6 ne présentant pas d'anomalie sur l'ensemble des 83 stations étudiées, n'est codée

que sous les deux autres réponses: pas de rupture et rupture.

Pour chaque modalité des 3 variables, les stations sont codées en 1 si elles présentent ce

caractère, ou en 0 dans le cas contraire.

17

Page 29: Analyse multivariée de résultats de tests de détection de

Les stations possèdent une ou deux saisons des pluies, par conséquent deux analyses

identiques sont nécessaires, chacune tenant compte d'une saison différente.

La comparaison des deux études doit permettre de voir pour les stations à deux saisons, si les

résultats des tests de détection de rupture diffèrent selon la saison des pluies considérée.

2- A.C.M avec la première saison des pluies:

Le premier plan factoriel de cette analyse donne une inertie de 56.05%, avec

respectivement pour l'axe 1 et l'axe 2 une inertie de 37.13 et 18.92%.

En analyse des correspondances multiples, l'inertie apportée par le premier plan factoriel est

souvent faible, on considère donc que 56% d'inertie restitue bien les informations contenues dans

le tableau de données.

Le premier axe factoriel oppose les modalités de non-rupture pour les variables 1 et 6

(ptlp2 et pt6p2) à celles de rupture (ptlr2, pt4r2 et pt6r2) pour les trois variables étudiées.

Seule la modalité de rupture de la variable 1 (ptlr2) a une coordonnée moyenne (proche de

l'origine), car de nombreuses stations présentent une rupture dans leur série chronologique pour

cette variable.

Toutes les autres modalités de rupture (pt?r2) ou de non-rupture (pt?p2) ont des coordonnées

fortes sur cet axe, avec des contributions absolues importantes, supérieures à 900 alors que la

moyenne est de 625, ce qui indique qu'elles participent fortement à l'interprétation de ce premier

axe factorieL

Le deuxième axe factoriel est marqué par les modalités d'anomalie des variables 1 et 4

(ptla2 et pt4a2), la variable 6 n'étant pas codée pour l'anomalie. La modalité de non-rupture pour

la variable 4 (pt4p2) est en opposition avec les modalités précédentes.

Les contributions relatives de l'ensemble des modalités qui marquent cet axe, sont nettement

supérieures à la moyenne: plus de 1600 pour une moyenne de 625.

Les coordonnées factorielles des modalités d'anomalie sont beaucoup plus fortes que celles des

modalités des autres variables, ce qui veut dire que l'anomalie est un caractère à forte variance, et

donc rare en tant que réponse aux tests de détection de rupture.

La représentation des stations dans le plan factoriel 1-2 permet de faire apparaître cinq

groupes distincts, chacun d'eux s'apparentant à une ou plusieurs modalités des variables portées

par les axes.

18

Page 30: Analyse multivariée de résultats de tests de détection de

Figure p09 : A.C.M. réduite à certaines variables.

83 stations (lignes) et 8 variables (colonnes)première saison des pluies

- Représentation des variables dans le plan factoriel 1-2 -

Inertie du plan factoriel: 56.05%

a

pt4a2

a

ptla2

a pt4pl

a pt4r2 ptlrla

pt6p2a

pt6rlptlpl

aptlal ptlp2

pt6pl aa aa ptlr2 pt4al

pt6r2 pt4rla

pt4p2a

Codage des variables:- nom de la variable : pt? .- code de la réponse aux tests: p=rien, a=anomalie, r=rupture.- codage binaire: 1=non et 2=oui.

Exemples : - ptlr2 : rupture pour la variable 1.- ptIrI : non rupture pour la variable l, donc rien ou anomalie.

Page 31: Analyse multivariée de résultats de tests de détection de

Figure DOlO: A,C,M, réduite à certaines yariables,

83 stations (lignes) et 8 variables (colonnes)première saison des pluies

- Représentation des stations dans le plan factoriel 1-2 -

Inertie du plan factoriel: 56.05%

Groupe 2

c15a

i16

b21a

d14

Groupe 3

a c12

b9a

Groupes de stations:- A: a7, b5, b16, hl, hl, h3, h4, h5, h7, h9, hlO, hl1, h14, h15, k5, m5, m7, m12, p19.- B : b6, h12, h13, h16, il, i4, k16, m9, miO.- C : a14, a17, d21, e17, i8, kl, k3, k4, kl1, k13, k14, m6, mil.- D : a23, a26, b4, b8, b17, b19, b20, b23, e3, e19, e22, e26, ilO, ml, m4, p23.- E: bl1, b12, b22, c17, c19, d12, el, k18, plO.

19

Page 32: Analyse multivariée de résultats de tests de détection de

L'axe 1 oppose deux groupes: le premier (appelé groupe 1) formé de 22 stations au

comportement proche, présence d'une rupture dans leur série chronologique, et le deuxième

groupe (appelé groupe 2) composé de 12 stations, qui ne présente pas de rupture pour les

variables 1 et 6.

L'axe 2 permet d'isoler deux autres groupes de stations.

Le premier groupe (groupe 3) est constitué de 7 stations qui présentent une anomalie pour au

moins une des deux variables étudiées (variable 1 ou 4).

Le deuxième groupe (groupe 4), comportant 16 stations, correspond à la modalité de non­

rupture pour la variable 4, donc les stations qui composent ce groupe ne présentent pas de rupture

dans leur série chronologique, pour au moins cette variable.

Ce second groupe est donc proche dans son interprétation du groupe 2, qui comprend des

stations n'ayant pas de rupture pour les deux autres variables. Ces deux groupes seront donc à

rapprocher lors de l'interprétation spatiale des résultats de cette analyse.

Certaines stations n'ont pas encore été affectées à un groupe, car elles ne sont pas significatives

sur l'un des deux premiers axes factoriels (faible contribution absolue), ou sont mal représentées

dans ce plan principal (faible contribution relative).

Ces stations sont arbitrairement regroupées sous l'appellation de groupe 5, mais ce groupe n'a pas

de signification à part entière auprès des modalités des variables.

En fait, ces stations présentent une rupture pour une variable donnée mais n'en présentent pas

pour les autres, d'où un comportement difficilement classable par l'analyse.

3- A,Ç,M avec la deuxième saisoD.JIes pluies:

L'information contenue dans le tableau de cette analyse, formé en considérant les

résultats des tests pour la seconde saison des pluies, est expliquée à 56.54% par le premier plan

factoriel, constitué de l'axe 1 (33.93%) et de l'axe 2 (22.61%).

Ce pourcentage d'inertie est fort satisfaisant pour une ACM, et permet donc une bonne

interprétation des données initiales.

Le premier axe factoriel n'est interprétable que pour les modalités des variables 1 et 6.

Cet axe oppose les modalités de non-rupture (ptlp2 et pt6p2) à celles de rupture (ptlr2 et

pt6r2) pour ces deux variables.

20

Page 33: Analyse multivariée de résultats de tests de détection de

figure 0°11 : A.C.M. réduite à certaines yariahles.

83 stations (lignes) et 8 variables (colonnes)deuxième saison des pluies

- Représentation des variables dans le plan factoriel 1-2 -

Inertie du plan factoriel: 56.54%

pt4pla

apt4r2

ptla2a

pt6p2a

pt6rl

ptlpla

ptlr2a

ptlalaa

a ptlrlpt4al

a

ptlp2

pt6r2a

pt6pl pt4rla

pt4p2a

Codage des variables:- nom de la variable: pt? .- code de la réponse aux tests: p=rien, a=anomalie, r=rupture.- codage binaire : 1=non et 2=oui

Exemples : - ptIr2 : rupture pour la variable 1.- ptIrl : non rupture pour la variable 1, donc rien ou anomalie.

Page 34: Analyse multivariée de résultats de tests de détection de

Figure n012 : A.C.M. réduite à certaines variables.

83 stations (lignes) et S variables (colonnes)deuxième saison des pluies

- Représentation des stations dans le plan factoriel 1-2 -

Inertie du plan factoriel: 56.54%

Groupe 3

cl a

h6

pl

Groupe 2

c12 a

bla

aD

Groupe 5

Groupe 1

a

a18

b2e24 e16

Groupes de stations:- A: a7, b5, b16, e17, hl, h2, h3, h4, h5, h7, h9, hU, h14, h15, k5, m5, m7.- B : a23, b6, e3, e19, hlO, h12, h13, h16, il, i4, k16, m9, miO.- C : a14, a17, a24, d21, iS, kl, k3, k4, kll, k13, k14, m6, mU, m12, p19.- D : a26, b4, bS, b17, b19, b20, b23, e22, e26, ilO, ml, m4, p23.- E : bll, b12, b22, c17, c19, d12, k18, plO.

21

Page 35: Analyse multivariée de résultats de tests de détection de

Les modalités de la variable 4 ne sont pas interprétables sur ce premier axe, car elles ont une

faible contribution absolue: inférieure à la moyenne de 625, alors que les modalités des autres

variables en ont une forte: supérieure à 829, preuve qu'elles participent pleinement à l'explication

de cet axe.

Le deuxième axe factoriel est essentiellement marqué par la variable 4.

Sur cet axe, il y a opposition entre les modalités de rupture (pt4r2 et pt4pl) et celles de non­

rupture (pt4p2 et pt4rl) pour cette unique variable.

Les autres variables n'interviennent pas sur cet axe, d'où leur faible contribution absolue

(inférieure à 625), contrairement à celle de la variable 4, supérieure à 1100.

Les modalités d'anomalie pour les variables 1 et 4 ne rentrent pas en compte dans

l'interprétation de ce plan factorie~ car elles y sont très mal représentées (contribution relative

inférieure à 21%, ce qui veut dire que seul 20% de l'information contenue dans ces modalités est

retranscrite dans le plan factoriel 1-2).

La représentation des stations dans le premier plan factoriel fait apparaître cinq groupes

distincts, comprenant des stations au comportement similaire vis à vis des modalités des variables.

L'axe 1 isole un premier groupe (appelé groupe 1), constitué de 18 stations. Ce groupe a

un comportement général de rupture pour les variables 1 et 6.

TI s'oppose sur cet axe au groupe 2, formé de 14 stations, qui elles ont un comportement de

non-rupture pour ces mêmes variables.

L'opposition de deux groupes de stations créée sur l'axe 2, est essentiellement due aux

modalités de la variable 4 : l'axe 2 opposant la rupture à la non-rupture pour cette variable.

Un groupe de 17 stations (groupe 3) correspond à un comportement de rupture vis à vis de la

variable 4, tandis que le groupe opposé, groupe 4 formé de 19 stations, correspond à la non­

rupture pour cette même variable.

La réponse des stations de ces deux groupes envers les variables 1 et 6 ne rentre pas en

considération dans la formation de ces groupes sur l'axe 2.

Certaines stations ont un comportement moins marqué que la rupture, ou la non-rupture,

systématique pour l'ensemble des variables. Ces stations, au nombre de 15, sont regroupées pour

former le dernier groupe, appelé groupe 5. Ce groupe n'est donc pas homogène, d'où une

interprétation moins évidente vis à vis des variables.

22

Page 36: Analyse multivariée de résultats de tests de détection de

r­I

111,

.Figure nO 13 : cartographie de l'AtM réduite à certaines variables avec la première saison des pluies.

_ Groupe1: rupture pour les variables 4 et 6.o Groupe2: pas de rupture pour les variables 1 et 6._ Groupe3: anomalie pour les variables 1 et 4.0. Groupe4: pas de rupture pour la variable4.o Groupe5: indécis.

,.---­1:

,:\1

\________J

o

o 0. oo

o CP-_ 0 0

o '------------r-0

-1 ~ 0.

\ 0

!\

Page 37: Analyse multivariée de résultats de tests de détection de

4-Juterprétation des deux A,Ç,M=*.

La diminution du nombre de variables considérées a permis de faire apparaître des

groupes de stations au comportement similaire vis àvis des variables.

Le codage disjonctif complet appliqué au tableau initial de données permet de considérer toutes

les modalités de chaque variable (pas de rupture, anomalie et rupture), ce qui facilite ensuite

l'interprétation des groupes de stations dans leur réponse aux variables.

La cartographie des groupes a pour objectif de permettre une interprétation spatiale des

changements pluviométriques liés aux modalités des variables considérées.

La carte issue des résultats de la première analyse met en évidence l'existence de plusieurs

zones au comportement particulier :

- La Guinée Bissau et l'ouest du Sénégal semblent être une zone où les stations présentent des

ruptures, pour l'ensemble des variables.

- Des stations n'ayant pas de rupture pour la variable 4, forment un couloir allant du centre du

Mali vers l'ouest de la Côte d'Ivoire, en passant par l'est de la Guinée Conakry.

- Le Cameroun et la République de Centrafrique semblent se distinguer : le sud apparaît

marqué par une absence de rupture, et le nord par la présence d'anomalies. Cependant le manque

de stations dans cette zone et son éloignement par rapport au reste de l'aire d'étude, à cause de la

lacune formée par le Nigeria, ne permettent pas d'approfondir davantage les résultats.

- Le reste de la zone couvrant le Burkina Faso, le Bénin, le Togo et une grande partie de la

Côte d'Ivoire, n'est pas directement interprétable, quelle que soit la variable considérée, car il

regroupe des stations qui ont un comportement très hétéroclite : certaines ayant des ruptures, les

autres des anomalies ou des non-ruptures, sans que l'on puisse définir de zone distincte.

La deuxième carte issue de la seconde analyse permet elle aussi de distinguer des zones où

les stations ont un comportement similaire.

- La première zone qui apparaît franchement regroupe la Guinée Bissau, le Sénégal et l'ouest

de la Guinée Conakry, où les stations se divisent en deux groupes, l'un pour des ruptures sur les

variables 1 et 6 (groupe 1), l'autre pour une rupture sur la variable 4 (groupe 3), le premier étant

majoritaire en nombre de stations.

- Le Mali, l'ouest et le nord de la Côte d'Ivoire et l'est de la Guinée Conakry semblent être des

zones où les stations ne présentent pas de rupture (groupes 2 et 4).

- Le sud du Cameroun et de la République de Centrafrique apparaît maintenant être une zone

de non-rupture (groupe 2), le nord étant plus indécis avec quelques stations où il y a rupture pour

la variable 4 (groupe 3).

23

Page 38: Analyse multivariée de résultats de tests de détection de

,------------

.Figure nOM- : cartographie de l'ACM réduite à certaines variables avec la deuxième saison des pluies.

• Groupe 1: rupture pour les variables 1 et 6.o Groupe2: pas de rupture pour les variables 1 et 6.• Groupe3: rupture pour la variable 4./1 Groupe4: pas de rupture pour la variable 4.o GroupeS: indécis.

\1

1

---------- ----------------

• /1

\\1

\\11

\l '

/1 /10

•• '--~-lv---y\ C /1 /1 o. CP 0 0 0

o \ /1 ·~----'lL---l

/1V

(

1

L _

Page 39: Analyse multivariée de résultats de tests de détection de

- La zone de trouble présentée par la carte précédente est toujours présente. Elle couvre le

Burkina Faso, le Togo et le Bénin ainsi que l'ouest de la Côte d'Ivoire, les stations y ont réagi très

diversement, mais avec une majorité de non-rupture.

La comparaison entre les deux analyses doit montrer s'il existe une différence notable

entre les résultats selon que l'on considère l'une ou l'autre des saisons de pluie, pour par la suite

n'avoir plus qu'une analyse à réaliser au lieu d'une analyse pour chaque saison considérée.

Or les deux cartes permettent de distinguer les mêmes zones et d'y affecter le même genre de

comportement vis à vis des variables.

Les différences entre les deux cartes ne sont donc pas significatives, ce qui laisse penser que la

considération de l'une ou l'autre des saisons n'influe que peu sur les résultats de l'analyse.

En effet, les modifications entre les tableaux de données de chaque analyse sont rares, car les

pays à posséder deux saisons des pluies ne sont que quatre (Bénin, Cameroun, Côte d'Ivoire,

Togo), d'où un nombre de stations affectées par ces changements lors des deux ACM faible: 19

sur l'ensemble de la zone étudiée.

Seilles les 19 stations sont susceptibles de changer de groupe, et donc de comportement, selon

l'analyse considérée. Les zones considérées par les deux analyses sont donc proches à ces

quelques stations près.

L'observation des données initiales (cf annexe 3) montre que les stations présentent plus

de rupture pour les séries chronologiques de la seconde saison des pluies.

Les différences apportées par l'analyse de chaque saison étant faibles, les prochaines analyses

seront réalisées en ne considérant plus que la deuxième saison des pluies, saison semblant donner

le plus de ruptures dans ses séries chronologiques.

5- Conclusion:

La cartographie des groupes de stations formés par l'ACM effectuée sur un nombre

restreint de variables, fait apparaître quatre zones distinctes.

- La Guinée Bissau et l'ouest du Sénégal semblent former une zone de rupture pour l'ensemble

des variables.

- Le Mali, l'est de la Guinée Conakry et le nord ouest de la Côte d'Ivoire englobent des

stations qui n'ont pas de rupture pour la variable 4, les réponses aux autres variables étant plus

diverses.

24

Page 40: Analyse multivariée de résultats de tests de détection de

- Le Cameroun et la République de Centrafrique forment une zone plus complexe, où cetaines

stations ne présentent pas de rupture, tandis que d'autres présentent des anomalies, ou des

ruptures uniquement pour la variable 4, si l'on considère la deuxième saison des pluies.

- Le reste de la zone d'étude, c'est à dire le Burkina Faso, le Bénin, le Togo et la Côte

d'Ivoire, regroupe des stations qui ont un comportement très divers, sans que l'on puisse

distinguer une zone particulière de rupture ou de non rupture.

La cartographie ne fait pas apparaître de variations sensibles entre les deux saisons des

pluies, par conséquent les analyses futures seront réalisées avec les résultats de la deuxième saison

qui semble présenter plus de rupture.

Ces analyses ont donc permis de mettre en évidence des zones distinctes où les stations

ont un comportement similaire.

Mais ces différentes zones n'ont pas pu être caractérisées dans le temps, c'est à dire si la

variation dans une zone a été observée, il est encore impossible de savoir à quel moment a eu lieu

ce phénomène.

Pour les analyses à venir, il convient toujours d'effectuer un codage disjonctif complet des

variables, mais en tenant compte de la date de rupture. Cette méthode doit pouvoir permettre

d'affiner l'interprétation des zones déjà repérées, voire mieux les redéfinir géographiquement.

25

Page 41: Analyse multivariée de résultats de tests de détection de

Figure 0°15 : Tableau de données.

123 lignes et 14 colonnes

1 __ Variables 3

1

Stations :

123

Années Années Années50 ..... 80 50

_ ..... . .... - _ .. 80 50 80

OUl non

louO louO

louO louO

Page 42: Analyse multivariée de résultats de tests de détection de

1- Introd.D.ctiDn :

Cette analyse doit répondre aux deux objectifs suivants: regrouper les stations

ayant une rupture dans leur série chronologique pour les variables considérées, et caractériser ces

groupes de stations par l'année de cette rupture.

On effectue une ACM sur un tableau disjonctif complet, en lignes sont portées les stations,

au nombre de 123, et en colonnes les années, organisées sur la période encadrant les dates de

rupture, par classes d'au moins trois ans, et ce pour les trois variables considérées (variables 1, 4

et 6). Chaque colonne est dédoublée pour indiquer la réponse aux tests de détection de rupture

(oui-non).

Le tableau ainsi formé est donc rempli de 1 ou de 0, le 1 indiquant une réponse positive.

Cette opération est effectuée pour chaque variable, les trois tableaux ainsi constitués étant

ensuite juxtaposés pour n'en créer plus qu'un seul qui sera soumis à l'ACM.

Cette analyse prend en compte les mêmes variables (1, 4 et 6) que les ACM précédentes,

cependant le nombre de stations étudiées est plus important, il passe de 83 à 123 stations.

Les 40 stations supplémentaires n'ont pas pu être prises dans les premières analyses, car elles

possédaient des données manquantes, les tests n'ayant pas encore été effectués sur l'ensemble de

ces variables pour ces stations.

La considération du plus grand nombre de stations possible est capitale pour interpréter

spatialement les résultats des analyses. L'étendue de la zone d'étude étant importante, il ne faut

pas que le nombre de stations à cartographier soit trop faible, si l'on veut pouvoir effectuer une

interprétation judicieuse, d'où l'intérêt de passer de 83 à 123 stations étudiées.

26

Page 43: Analyse multivariée de résultats de tests de détection de

2- Analyse des données:

L'Analyse des Correspondances ainsi réalisée, donne une inertie de 24.57% pour le

premier plan factoriel (axe 1 : 13.38 et axe 2 : 11.19). Ce pourcentage d'information expliquée

par l'analyse est satisfaisant, et permet donc une bonne interprétation des données.

Le premier axe factoriel oppose les années 66-68, pour les trois variables, aux années 73­

80 pour la variable l, 72-75 pour la variable 4, et 76-79 pour la variable 6.

Le deuxième axe met lui en opposition les années 69-71 pour les trois variables, aux

années 73-80 pour la variable 1, 76-83 pour la variable 4, et 72-75 pour la variable 6.

La représentation des stations dans le premier plan factoriel de l'ACM permet de faire

apparaître 4 groupes distincts, chacun d'eux étant en rapport avec les années portées par les axes.

L'axe 1 isole et oppose deux groupes: le premier (appelé par la suite groupe 1) est

composé de 20 stations qui ont un comportement proche, rupture dans leur série chronologique

se situant dans les années 66-68, le deuxième groupe (appelé groupe 3) constitué de 15 stations

présente une rupture dans les années postérieures à 72.

L'axe 2 sépare les stations en deux autres groupes opposés.

Le premier groupe (appelé groupe 2) ayant une rupture dans les années 69-71 est composé de

30 stations, le deuxième (groupe 4) formé de 8 stations présente une rupture entre les années 72

et 83.

Un cinquième groupe peut être identifié dans le plan factoriel de l'analyse, correspondant

aux 16 stations regroupées autour du point origine du plan factoriel. Ce groupe ne présente

aucune rupture quelle que soit la variable pluviométrique considérée.

Un grand nombre de stations ne fait pas partie d'un groupe, soit parce que ces stations

n'ont une rupture que pour une seme des trois variables pluviométriques, les deux autres ne

présentant aucune rupture, soit parce que leur date de rupture est antérieure à l'année 65, année

n'ayant pas une représentation significative dans le plan factoriel 1-2. Ces stations sont regroupées

arbitrairement sous l'appellation de groupe 6.

L'ACM n'a pas pris en compte le critère anomalie, d'une part car par laps d'années les

anomalies sont rares donc ne peuvent être codées à part entière, dlautre part car leur signification

au niveau d'une interprétation pluviométrique est difficile.

27

Page 44: Analyse multivariée de résultats de tests de détection de

Figure p016 ; A,Ç,M, tenapt compte d~la date de rupture,

123 stations (lignes) et 28 variables (colonnes)deuxième saison des pluies

- Représentation des variables dans le plan factoriel 1-2 -

Inertie du plan factoriel : 24.57%

Groupe4

56-65-60a

58-65-10a

76-79-60a

Groupe3

69-71-40a

Groupe2

69-72-10a

a69-71-60

P.S : le groupe A rassemble toutes les années n'ayant pas de rupture (codage non).

Notation:Les deux premiers chiffres correspondent aux bornes de l'intelVal1e de temps considéré (exemple :66-68 = début de la période de rupture en 66 pour une fin en 68).Le troisième chiffre indique la variable considérée (exemple: 6 = variable 6 de l'étude).La lettre finale (0) indique que la réponse aux tests de rupture est oui.

Page 45: Analyse multivariée de résultats de tests de détection de

Figure n017 ; A.C.M. tenant compte des dates de rupture.

123 stations (lignes) et 28 variables (colonnes)deuxième saison des pluies

- Représentation des stations dans le plan factoriel 1-2 -

Inertie du plan factoriel: 24.57%

a

b19

Groupe 4

b9a

c13 ,p2l

e22a aa12

b2 a2 a k7d25 dl el

gb22 ab5

cla

klBa k16 k6

p17 p7 ad2l ,p12 aa23a

@ e7 ad14k9 a bl a

m ak17 aB a3a e 20

ac6 p2 e2

e26 a5 pl d12a plO d6

A:' h6 c2l

e15 c19

c17 c15

ah2 c7 all

h4 a Groupe 5a7 aalO

hB e14

Groupe2

aa17

P. S : les stations k9 et k17 ont été ajoutées au groupe 2, au vue des données de départ.le groupe 6 regroupe toutes les stations n'appartenant pas aux autres groupes.

28

Page 46: Analyse multivariée de résultats de tests de détection de

Donc l'anomalie a du être rattachée à une des deux réponses aux tests de rupture: "non"-pas

rupture ou "oui"-rupture.

L'étude précédente a été réalisée avec un codage qui estimait qu'une anomalie représentait une

réponse négative aux tests de rupture, soit un codage "non". Une autre étude sera réalisée

ultérieurement en considérant la notion d'anomalie comme étant une réponse positive aux tests de

rupture, soit en lui attribuant un codage"oui".

3- Inf«Ju:étation et camgraphie des résultats..;

L'Analyse des Correspondances Multiples a fait apparaître la présence de cinq groupes,

auxquels on a rajouté un groupe comprenant toutes les stations n'ayant pu être affectées aux

groupes précédents.

Chaque groupe est constitué d'un certain nombre de stations, qui ont un comportement

similaire dans le temps vis à vis des trois variables pluviométriques considérées.

Le groupe 1 est formé de 20 stations qui présentent une rupture entre les années 66 et 68,

pour les trois variables.

Ce groupe se compose essentiellement de stations de la Guinée Bissau et du Sénégal (14

stations au total), mais aussi de deux stations en Guinée Conakry et de trois stations proches au

Mali.

Une dernière station vient compléter ce groupe, il s'agit de la station de Birao en Centrafrique,

loin de la zone créée par les autres stations du groupe. L'absence de station proche de celle-ci ne

permet pas d'apporter une explication à sa présence dans le groupe 1.

Donc si l'on excepte la station de Birao, on peut admettre que le groupe 1 est relativement

homogène spatialement, autour de la zone ouest de l'aire d'étude.

Le groupe 2 a réagi positivement aux tests de rupture pour les années 69-71, pour

l'ensemble des variables.

n se compose de 30 stations, la plupart situées en Guinée Bissau, sur la région côtière, et au

Sénégal (9 stations).

Ensuite les stations sont réparties plus uniformément sur la zone d'étude, 2 en Guinée Conakry,

6 au Mali, 3 en Côte d'Ivoire, 3 dans la région ouest du Burkina, et 7 au Bénin.

.n est important de noter qu'aucune station de ces groupes ne fait partie de la zone est de l'étude,

formée par le Cameroun et la République de Centrafrique.

29

Page 47: Analyse multivariée de résultats de tests de détection de

Figure nO 18 : cartographie de l'AtM tenant compte des dates de rupture.

• Groupe1: rupture dans les années 66-68.• Groupe2: rupture dans les années 69-71 .• Groupe3: rupture dans les années postérieures à 72.• Groupe4: rupture dans les années postérieures è 72.o Groupe5: pas de rupture.o Groupe6: indécis.

,l _ -------------------------

~

\~( 1l '1 1

Page 48: Analyse multivariée de résultats de tests de détection de

Le groupe 3 et le groupe 4 présentent des comportements tout à fait proches, puisque les

stations de ces deux groupes ont réagi positivement aux tests de rupture dans les années

ultérieures à 1972.

Les deux groupes ont la même réponse pour la variable 1, avec une rupture dans les années 73 à

80. La différence entre les deux groupes se fait juste au niveau des variables 4 et 6, le groupe 3

ayant pour réponse les années 72-75 pour la variable 4 et les années 76-80 pour le variable 6, et

inversement pour le groupe 4 (rupture dans les années 72-75 pour la variable 6, dans les années

76-80 pour la variable 4).

Par conséquent, ces deux groupes ayant un comportement similaire, il semble justifié de les

associer lors de l'interprétation géographique.

La majorité des 23 stations qui composent ce "super-groupe", est située au Burkina Faso

(centre et est du pays) avec 10 stations. Quatre stations sont proches de ce noyau: une, Kandi,

dans le nord du Bénin, et trois sur la partie est du Mali.

Les autres stations du groupe sont plus éparses, avec une station dans l'ouest du Mali, une en

Guinée Conakry, trois en Côte d'Ivoire, une station dans le sud du Togo proche de deux autres

situées dans le sud du Bénin, et une dernière en Centrafrique.

La présence de cette dernière station, Bria, dans ce groupe est à nuancer, car elle n'est due qu'à

une réponse positive à la variable 1, responsable essentiellement de l'identification de ce groupe

par son importante contribution absolue sur l'axe 1 (CTA = 202, pour une moyenne de 81).

Donc on peut estimer que ce groupe est surtout localisé au Burkina Faso, avec quelques

stations supplémentaires disséminées sur la zone d'étude à l'ouest du méridien 2° est de longitude.

Le groupe 5 est formé par des stations qui n'ont pas de rupture dans leur série

chronologique quelle que soit la variable pluviométrique considérée. Les 16 stations qui

composent ce groupe, sont pratiquement toutes situées sous la latitude de 7° et à l'est du méridien

5° ouest de longitude, à l'exception d'une station sur l'archipel des Bijagos, Bubaque, au large de

la Guinée Bissau, et d'une station au nord du Togo, Barkoissi.

La majorité des stations est située au Cameroun ou en Centrafrique avec 7 stations, les autres

étant en Côte d'Ivoire (2), et dans le sud du Togo et du Bénin (5).

Le groupe 5 est donc relativement homogène bien que réparti sur une grande zone de l'étude.

Le groupe 6 se compose de stations plus dispersées, car il englobe toutes les stations

n'ayant pu être affectées aux groupes précédents. Donc il n'a pas de vraie signification en terme

d'interprétation vis à vis du comportement des variables et des années de rupture.

La plupart des 34 stations qui le composent, n'ont une rupture que pour une variable donnée,

quelle que soit l'année, les autres variables présentant des réponses diverses.

30

Page 49: Analyse multivariée de résultats de tests de détection de

Les stations du groupe 6 sont nombreuses au Cameroun et au Centrafrique (13 stations en

tout). Les autres se situent au sud de la Côte d'Ivoire, du Togo et du Bénin (13), au Sénégal (1),

en Guinée Conakry (1), au Mali (2) et au Burkina (4).

Si l'on admet comme groupes assez proches, les groupes 5 et 6, on voit alors apparaître

une zone formée par le Cameroun et la République de Centrafrique, où les stations n'ont pas eu

de rupture nette pour l'ensemble des variables, si l'on omet les 2 stations ayant réagi: Birao et

Bria.

A la vue de la cartographie de tous ces groupes, on peut raisonnablement séparer raire

d'étude en 4 zones:

- une première formée par la Guinée Bissau et le Sénégal où les stations ont une rupture soit

dans les années 66-68 soit dans les années 69-71,

- une deuxième avec le Burkina Faso où les stations ont réagi après 1972,

- une troisième zone avec le Cameroun et la République de Centrafrique où il n'y a pas eu de

rupture,

- et enfin une dernière zone regroupant tous les autres pays (Guinée Conakry, Mali, Côte

d'Ivoire, Togo et Bénin) où les stations ont plus ou moins réagi aux tests de rupture mais sans

date commune bien déterminée.

4- Conclusion:

Le codage disjonctif complet des réponses des variables aux tests de rupture,

permet de tenir compte de toutes les ruptures quelle qu'en soit la date, et non plus de se focaliser

sur une rupture entre 65 et 75.

De plus, le fait de tenir compte de la date de rupture sous forme de courts laps d'années, permet

d'affiner les comportements des individus vis à vis des variables, en jouant sur un pas de temps

plus précis, alors que dans les analyses précédentes le temps n'était pris en compte que sous

forme binaire, la rupture n'étant considérée comme positive que si elle se situait dans les années

65 à 75, les ruptures aux autres dates n'étant plus retenues.

Cette analyse permet donc d'améliorer la cartographie des études précédentes, les stations

étant regroupées en fonction des ruptures éventuelles sur les variables et des dates de celles-ci.

- La Guinée Bissau et le Sénégal forment une zone qui regroupe des stations présentant des

ruptures pour les trois variables autour de l'année attendue (1970), avec deux types de stations

31

Page 50: Analyse multivariée de résultats de tests de détection de

qui se mélangent, les unes ayant des ruptures entre 66 et 68, les autres entre 69 et 71. Cette zone

de rupture semble s'étendre à l'ouest de la Guinée Conakry et du Mali.

- Le Burkina Faso se distingue maintenant, il possède des stations qui présentent des ruptures

après les années 72, années considérées avant comme une non rupture.

- Le Cameroun et la République de Centrafrique apparaissent toujours être une zone où les

stations ne possèdent pas de rupture, ou alors que pour une seille des variables et à des dates très

diverses. Le sud et le nord ne sont plus maintenant aussi dissociables que précédemment.

- Le Mali n'a plus un comportement qui se détache des autres pays, et forme maintenant avec

l'est de la Guinée Conakry, la Côte d'Ivoire, le Bénin et le Togo, une zone où les stations ont des

comportements divers avec des ruptures sans date particulière.

32

Page 51: Analyse multivariée de résultats de tests de détection de

1- Intrn.dudion.!.

La réponse aux tests de détection de rupture a été codée "anomalie" quand les

résultats des trois tests n'ont pas été identiques, c'est à dire quand le test de Pettitt ne détectait

aucune rupture contrairement aux deux autres tests.

L'analyse précédente a été réalisée en considérant une anomalie comme une réponse

assimilable à une non-rupture. Cependant ce choix est arbitraire, d'où la nécessité d'effectuer une

étude complémentaire, pour voir si ce choix a une influence sur les résultats.

L'ACM qui suit a été réalisée en codant l'anomalie comme une rupture, il s'agit du seul

changement qui l'affecte par rapport à l'analyse précédente.

2- Analyse d~nnées :

L'inertie obtenue pour le premIer plan factoriel est relativement bonne, soit

24.79%.

La représentation des colonnes (années et variables pluviométriques) dans le premier plan

factoriel n'est pas modifiée, dans l'interprétation des deux axes, par rapport à la première analyse.

La notion d'anomalie ne concerne que 33 des 123 stations de l'étude.

Semes ces stations peuvent être soumises à un changement d'affectation dans un groupe, par

rapport à l'analyse précédente, mais quelques stations un peu tangentes dans leur positionnement

dans un groupe vont aussi être affectées différemment dans lesgroupes.

Pour la première analyse, l'anomalie est assimilée à une non-rupture, donc les stations

concernées par ce codage se trouvent pour la plupart dans le groupe 5 (groupe sans rupture) ou

dans le groupe 6 (groupe ayant peu réagi ou ayant une rupture antérieure à 65).

33

Page 52: Analyse multivariée de résultats de tests de détection de

Figure n019 ; A.C.M. avec J'Anomalie considérée comme rupture.

123 stations (lignes) et 28 variables (colonnes)deuxième saison des pluies

- Représentation des variables dans le plan factoriel 1-2 -

Inertie du plan factoriel: 24.79%.

a

69-71-60

Groupe2

52-65-40a

Groupe3

72-76-40a

58-65-10a

Groupe4

a

aa

a55-65-60

66-68-60

Groupe!

a66-68-10

a

66-68-40

P. S : le groupe A rassemble toutes les années n'ayant pas de rupture (codage non).

Page 53: Analyse multivariée de résultats de tests de détection de

Fi@re n 020 ; A.C.M. avec l'Anomalie considérée comme rupture.

123 stations (lignes) et 28 variables (colonnes)deuxième saison des pluies

- Représentation des stations dans le plan factoriel 1-2 -

Inertie du plan factoriel: 24.79%.

Groupe5

~P2 d6

A: plO c21. el5 cl9

e2 cl7

"d12 aIl

k5 hllael7

m7 k8 h9

h14a

m5 a ahl6il Groupel

akl

m6a

mll

a amlOpl7

a k3hl3a hl2

i4

aklO

.,b6hl

h8 a al3

h24 a a a6

el a e3alO

a

el a@e26 dld25ak7

p7 cl a

kl8 i bl2 d21

a a8d22

ab2

Groupe4

a

kl7C a

a aa23 m4

ae22

al7

Groupe2

hlO a

a

e24 akl6a a 26

b23a b9 a

k6 a

dl4

cl5a

h4aa7b4

bl6h6 a

k4a

d5aa~dlOp23 ilO a

pl k9

Groupe3 a bic6a a5 a am9

ab22

P.S : Toutes les stations n'étant pas affectées à un groupe seront rassemblées pour former legroupe 6.

34

Page 54: Analyse multivariée de résultats de tests de détection de

Figure n021 : cartographie de l'AtM avec l'Anomalie considérée comme rupture.

• Groupe1: rupture dans les années 66-68.• Groupe2: rupture dans les années 69-71.• Groupe3: rupture dans les années postérieures à 72... Groupe4: rupture dans les années postérieures à 72.o Groupe5: pas de rupture.o Groupe6: indécis.

---

)i!

)

Page 55: Analyse multivariée de résultats de tests de détection de

Ainsi ces deux groupes sont ceux qUl sont amenés à être les plus modifiés dans leur

composition.

Le groupe 5 n'est plus composé que de 10 stations, dont 5 dans le sud du Cameroun (3) et

le sud-est de la République de Centrafrique (2), les autres étant réparties entre le Bénin (1), le

Togo (2) et la Côte d'Ivoire (2).

Le groupe 1 est constitué des 20 stations initiales, plus une station supplémentaire au sud

du Togo (Lome ville).

Les groupes 3 et 4 sont soumis à peu de variation, la majorité des stations qui le

composent reste positionnée au Burkina Faso, avec quelques autres à l'ouest du Mali (3), et en

Côte d'Ivoire (3).

Les quelques stations qui ont quitté ces deux derniers groupes, par rapport à l'autre analyse,

sont remplacées par des stations du même pays, d'où la stabilité de ce "super-groupe".

Le groupe 2 est maintenant composé de 26 stations au lieu des 30 initiales.

Cependant, il garde sa répartition géographique uniforme sur l'ensemble de la zone d'étude, avec

un pôle en Guinée Bissau et au Sénégal.

Les stations du sud Bénin ne font plus partie de ce groupe, à l'exception de Cotonou ville.

Ces stations sont situées, dans le plan factoriel de la première analyse, aux limites extérieures du

groupe. Leur comportement est assimilable à celui du groupe mais il n'est pas exactement le

même, ce qui explique qu'elles ne soient plus affectées au groupe 2 lors de cette seconde analyse.

Par contre, une station du Cameroun (extrême ouest) est passé du groupe 5 au groupe 2 à cause

de ce nouveau codage. Cette station (Nkongsamba) a répondu en 1971 pour les deux premières

variables, mais sous forme d'anomalie, donc son affectation dans un groupe est difficile à décider

et donc à interpréter.

35

Page 56: Analyse multivariée de résultats de tests de détection de

3- Conclusion...;,

Cette analyse a pour but de vérifier l'incidence qu'a l'affectation de la réponse

anomalie à l'une des deux autres réponses, sur la cartographie des groupes de stations.

Bien que les groupes aient été modifiés dans leur composition, la cartographie n'est que

peu affectée, et son interprétation amène aux mêmes conclusions que l'étude initiale.

Donc il ne semble pas que le codage de l'anomalie en non-rupture ou en rupture, ait apporté un

changement important dans les structures de groupe créées par l'ACM.

Les groupes gardent leur noyau principal de stations constant, seules quelques stations varient

dans leur affectation, l'interprétation spatiale globale restant la même.

36

Page 57: Analyse multivariée de résultats de tests de détection de

Figure n022 ; TahJeau de données.

104 lignes et 15 colonnes

1 Variables 4

1

Stations •

104

Années Années50 . - - - _ .. - 80 _ ..... -. -_ ... -. - - _._ . 50 80

om non

louO 1 ou 0

louO 1 ou 0

Page 58: Analyse multivariée de résultats de tests de détection de

1- Intmductipn....:.

Une troisième analyse a été réalisée en considérant non plus trois mais quatre

variables pluviométriques, par l'ajout d'une variable supplémentaire, la durée de la saison des

pluies (point 2 du programme ICCARE modifié(l) ).

La base de l'analyse n'a en rien changé par rapport à la première analyse réalisée.

On effectue une ACM sur un tableau avec en lignes 104 stations (19 stations ont disparu à

cause de leur manque de données pour le point 2), et en colonnes le croisement entre les variables

(au nombre de 4) et les années, avec un dédoublement des colonnes pour la réponse aux tests de

rupture (oui ou non).

La variable 2 est prise en compte dans les calculs de l'ACM, ainsi elle n'est pas prise en tant que

variable supplémentaire(2) .

Peu de stations (13) ont une réponse positive (rupture) aux tests de détection de rupture

dans leur série chronologique pour cette nouvelle variable.

La rareté de cette réponse ne permet pas de faire un découpage de la période de réponse en laps

de 3 années, comme pour les autres variables, car il est important dans l'ACM que le poids des

colonnes soit voisin afin de ne pas fausser les résultats de l'analyse.

Donc, cette variable est juste divisée en deux modalités: oui-rupture (si cette rupture se situe

entre 1965 et 1975) et non-pas de rupture.

L'anomalie est considérée comme une réponse nulle aux tests de rupture.

(1) _ Le point 2 modifié correspond à la durée en nombre de jours de la saison des pluies. Elle a étécalculée en retranchant la date de début de la saison des pluies (caractère 1 de la variable 2) à ladate de fin de la saison des pluies (caractère 2 de cette même variable).(2) _La mise en variable supplémentaire dans l'ACM signifie que la variable considérée est rajoutéeà l'analyse sans que celle-ci ne rentre en compte dans les calculs de base de l'analyse.

37

Page 59: Analyse multivariée de résultats de tests de détection de

2- Analyse tks....données :

Cette ACM donne une inertie de 23.80% pour le premier plan factoriel,

pourcentage assez satisfaisant pour pennettre une interprétation de ce plan.

La représentation des variables sur l'axe 1 est la même que précédemment: opposition des

années 66-68 (groupe 1) aux années 73-80 pour la variable 1, 72-75 pour la 4 et 76-79 pour la

variable 6.

L'axe 2 est lui modifié dans son interprétation: il oppose les années 69-71 pour les trois

premières variables et la réponse positive de la variable 2 (groupe 2), aux années 76-83 pour la

variable 2 et 72-75 pour la variable 6 (groupe 4).

Par rapport à la première analyse, semes les interprétations des groupes 2 et 4 sont

modifiées, car ils ne correspondent plus aux mêmes années et aux mêmes variables.

Les groupes 1 et 3 ont gardé la même structure de stations.

Le groupe 2 garde son noyau principal de stations. TI n'a perdu que 4 stations : deux au

Mali, une au Sénégal et une au Burkina, mais sa répartition géographique n'en est que peu

affectée.

Donc l'ajout d'une variable dans l'explication de ce groupe n'a pas eu une forte influence sur sa

structure spatiale.

Le groupe 4 n'est plus expliqué que par les variables 4 (années 76-83) et 6 (années 72-75),

donc il a gagné en nombre de stations pour passer de 8 à 12 stations.

Le groupe est réparti aux frontières entre le Mali et le Burkina, mais aussi maintenant au sud du

Bénin et du Togo.

Ces changements dans le groupe 4 n'affectent pas la répartition spatiale du "super-groupe" qu'il

fonne avec le groupe 3 (super-groupe ayant réagi après l'année 72).

Ce super-groupe est toujours présent au Burkina Faso et à l'est du Mali, avec quelques stations

supplémentaires en Côte d'Ivoire, au sud du Bénin et du Togo.

38

Page 60: Analyse multivariée de résultats de tests de détection de

Figure n023 : A.C.M.avec une variable supplémentaire.

104 stations (lignes) et 30 variables (colonnes)deuxième saison des pluies

- Représentation des variables dans le plan factoriel 1-2 -

Inertie du plan factoriel : 23.80%.

a58-65-10

a

a

69-71-40a

72-75-60

Groupe4

Groupel

P. S : le groupe A rassemble toutes les années n'ayant pas de rupture (codage non).

Page 61: Analyse multivariée de résultats de tests de détection de

Figure 0°24 : A.C.M. avec uoe variable supplémentaire.

104 stations (lignes) et 30 variables (colonnes)deuxième saison des pluies

- Représentation des stations dans le plan factoriel 1-2 -

Inertie du plan factoriel: 23.80%.

a3 c2la8 h6

all p2

c7 pl

c17 d6

c19 e2

e15

GroupeS

A:

Groupe3

b5

a blle25

a12a2

k7a

d25 b12ap7 a cl e7p17 k18

d2l

@a

k9 a k16el

d22 a .fl23dl aa a18,c6 aa5 bl

d5 e26

ad20

Groupe4

a h7

k14 a4a

p19

klm6 a

a

Groupe!

h14

a m12

h~d7

h15

P. S : Le groupe 6 rassemble toutes les stations n'ayant pu être affectées àun groupe précis.

39

Page 62: Analyse multivariée de résultats de tests de détection de

,.J'

·able supplémentaire.Bimmll..fl~~..;.J~1Q9!Jl!D.!lilU~~~M...i!a!l!v~e!j;c,--uY~n~ev~a_r_I _canographie de l'ACMF· ure n025 : _1

9 re dans les années 66-~~. et pour la variable 2.o Groupe': rUP:~re dans les années 69~tér:eures à 72.o Groupe2: rUPture dans les années POstérieures à 72.

Groupe3. rup d s les années po• e4' rupture an.. Group - de rupture.Groupe5: pas .o e6- indécIS.Group _o

L_..... _

Page 63: Analyse multivariée de résultats de tests de détection de

3- Conclusion:

L'apport d'une quatrième variable a modifié la répartition des stations dans les

différents groupes, mais ils gardent leur définition par les modalités des variables, donc la

modification porte sur des stations qui s'écartaient légèrement de cette définition.

La variable supplémentaire rentre exclusivement dans l'explication du groupe de stations

ayant des ruptures dans les années 69-71, donc elle permet d'affiner l'interprétation de cette zone

vis à vis des variables, zone toujours répartie sur la Guinée Bissau et le Sénégal.

La cartographie des autres groupes n'a pas beaucoup évolué dans cette analyse par

rapport aux cartographies précédentes.

De plus, la réduction du nombre de stations considérées dans l'analyse, à cause de l'ajout d'une

variable, ne permet pas une aussi bonne interprétation spatiale que les autres études, de larges

zones ne sont plus couvertes par les 104 stations de cette étude : le nord de la Côte d'Ivoire, du

Bénin et du Togo, et une partie de la Guinée Conakry.

40

Page 64: Analyse multivariée de résultats de tests de détection de

1- Introdudion :

Une étude des données sur l'ensemble des variables pluviométriques a déjà été

effectuée, mais le codage de cette analyse ne tenait compte que de l'information binaire rupture­

pas rupture.

TI convient donc de réaliser une étude avec un codage sur l'année éventuelle des ruptures.

Cette nouvelle analyse des correspondances multiples est réalisée avec le même codage

que l'analyse précédente, avec simplement en plus les colonnes correspondant aux variables

supplémentaires.

Seille la variable 5, avec ses cinq modalités, est rajoutée aux variables déjà analysées, la variable

3 et la deuxième modalité de la variable 4 (centre de gravité de la saison sèche) étant

définitivement abandonnées de toute étude.

Les modalités de la variable 5 présentent peu de rupture dans leur série chronologique, si bien

qu'il est impossible de dissocier ces quelques dates de rupture en plusieurs laps d'années de

réponse comme pour les autres variables.

Tout comme la variable 2 de l'analyse précédente, les modalités de la variable 5 sont codées sur

l'ensemble de la durée des séries chronologiques par un codage binaire sous deux colonnes

(modalités) : oui pour une rupture entre 1965 et 1975, et non dans le cas inverse.

Donc le tableau regroupant les données soumises à cette ACM croise 100 stations en

lignes et 76 colonnes pour les variables découpées en laps d'années.

Seilles 100 stations possèdent l'ensemble des données pour toutes les variables considérées, les

autres ayant au moins une donnée manquante.

41

Page 65: Analyse multivariée de résultats de tests de détection de

2- Analyse lks...données :

Cette ACM donne une inertie de 30.89% pour le premier plan factoriel (10.99%

pour l'axe 1 et 9.90% pour le second). Ce pourcentage d'information expliquée par l'ACM est

suffisant pour permettre une interprétation des résultats.

Le premier axe factoriel isole deux groupes de variables : l'un regroupant les années 66-68

pour les variables 1, 4 et 6, ainsi que les deux modalités de la variable 5 (pluie modérée à forte :

notée 5-3, et pluie très forte: 5-5), l'autre groupe est formé des années 73-80 pour la variable 1 et

76-80 pour la variable 6.

L'axe 2 permet de distinguer deux groupes de variables: l'un formé des années 69-71 pour

les variables 1, 4 et 6, et de la variable 2, l'autre regroupe les trois dernières modalités de la

variable 5 (pluie faible: 5-1, pluie modérée: 5-2, pluie forte: 5-4), et les années 72-83 pour la

variable 4 et 72-75 pour la variable 6.

Toutes ces variables ont une forte contribution absolue sur l'un des deux axes qui forment

le premier plan factorie~ et sont bien représentées dans ce plan car elles ont aussi une forte

contribution relative.

Par contre, les années 56-65 pour les variables l, 4 et 6 ne sont pas interprétables dans ce plan

factoriel, car elles ont de faibles contributions relatives et absolues.

La représentation des stations dans le premier plan factoriel de l'analyse permet de faire

apparaître cinq groupes de stations.

L'axe 1 met en opposition deux groupes de stations, le premier (appelé groupe 1) est

formé de 14 stations, dont la plupart sont dans la partie ouest de la zone d'étude : 7 stations en

Guinée Bissau, 3 au Sénéga~ 1 en Guinée Conakry, 1 au Mali, les autres au Burkina Faso (1) et

en Centrafrique (1).

Ce groupe correspond à des stations qui ont une rupture dans les années 66-68 pour les

variables 1, 4 et 6, et pour les modalités 5-3, 5-5 de la variable 5.

Le second groupe (groupe 3) comprend 12 stations, centrées autour du Burkina Faso avec 7

stations dans ce pays, 2 en Côte d'Ivoire, 1 au Mali, 1 en Guinée Conakry, mais aussi une éloignée

en Centrafrique.

Ce groupe correspond à des ruptures aux années postérieures à 73, 73-80 pour la variable 1 et

76-80 pour la variable 6.

L'axe 2 oppose lui aussi deux groupes de stations. Le premier groupe (groupe 2 ) est

constitué de 14 stations, qui ont des ruptures dans les années 69-71 pour les variables 1, 4 et 6,

mais aussi une rupture pour la variable 2.

42

Page 66: Analyse multivariée de résultats de tests de détection de

Figure n026 ; A.C.M.ayec l'ensemble des yariables.

100 stations (lignes) et 37 variables (colonnes)deuxième saison des pluies

- Représentation des variables dans le plan factoriel 1-2 -

Inertie du plan factoriel: 20.90%.

50-80-0

D

66-68-40D

DD

D

D

D ....

DD D D

D

D D D

D

D 69-71-40D

69-72-10D

57-65-40

56-65-60D

58-65-10D

72-83-40

D

0-20-0D

80-95-072-75-60

D

Page 67: Analyse multivariée de résultats de tests de détection de

Figure n027 : A.C.M. sur l'ensemble des yariables.

100 stations (lignes) et 37 variables (colonnes)deuxième saison des pluies

- Représentation des stations dans le plan factoriel 1-2 -

Inertie du plan factoriel: 20.90%.

Groupe 3i4 a hl2

ah3

ad7 a a

h14 h5

Groupe 1

hl5a

a

ml2a

k4

a

a k3

ad2D b8 ahl3

ael5

el7....

hl

a a26bl7

ap2 akl3

h4a

bl9

~21 ~9

e3a

k7

dla a2

pl a b2a

Groupe 4

p7 a kl8

dp

hlq,h2 a,p4 d5 a

al8 a ctl D c2D

e2D a -d12 k~a kIl a ahll

a5 k5f!)pe5A ae26a

d2l a

a

b5 a

a3 cl9

a8 c21

aH d6

c7 e2cl7 h6

A:

43

Page 68: Analyse multivariée de résultats de tests de détection de

des variables.~~I'~e~n.IJse~mnJbllJl~e~!.!i!!_:z......::._avec _hie de l'ACM028 : cartograpFigure n ées 66-6S.

dans les ann 69-71.• G<oupe1: ruPt~~: dans les années les variables 1 et 4.

Groupe2: rupt prés 1972 pour 'ables 4 et 6.• pe3: rupture a 72 pour les van• Grou ture après

Groupe4: rup de rupture ... Groupe5: pas ,o pe6' indécIS.Grou ,o

,r·--

,),--

)>

CI.,/.\

/ ."/

l,

..•

,) .... 0

/

("'" "",

Page 69: Analyse multivariée de résultats de tests de détection de

Ces stations sont réparties sur l'ensemble de la zone d'étude à l'ouest du méridien 2° est de

longitude. Donc ce groupe possède 4 stations en Guinée Bissau, 3 au Bénin, 3 en Côte dlIvoire, 2

au Mali, 1 en Guinée Bissau et une dernière au Burkina.

Le deuxième groupe isolé sur cet axe (groupe 4), comporte 17 stations, qui sont réparties au

centre et à l'est de l'aire d'étude: 2 stations au Mali, 4 au Burkina Faso, une en Côte d'Ivoire, 3 au

Togo, 3 au Bénin, 2 au Cameroun et 2 en Centrafrique.

Ce groupe n'a donc pas une répartition spatiale très homogène. Ces stations possèdent une

rupture dans les années postérieures à 72 pour les variables 4 (années 72-83) et 6 (années 72-75),

et une rupture pour trois des modalités de la variable 5 (5-1, 5-2 et 5-4).

Certaines stations ne présentent aucune rupture dans leur série, quelle que soit la variable

considérée.

Ces stations, au nombre de 10, sont essentiellement localisées dans la zone sud de l'étude : au

Cameroun, avec 3 stations, au Bénin (3), et une station en Centrafrique, mais 2 stations sont

éloignées de cette zone : une en Côte dlIvoire et une en Guinée Bissau.

Donc on peut considérer que ce groupe a une répartition géographique relativement homogène,

même si la lacune formée par le Nigeria la coupe en deux (groupe 5).

Cette représentation dans le premier plan factoriel nia pas permis d'affecter toutes les

stations de l'étude dans un groupe, où ces stations ont un comportement similaire.

Ainsi les 33 dernières stations, qui ne font pas partie d'un des groupes décrits précédemment,

sont regroupées pour former un groupe (appelé groupe 6), bien sûr non homogène dans son

interprétation vis à vis des variables.

Ces stations n'ont qu'une rupture pour une variable donnée, quelle qu'en soit l'année, ou bien les

ruptures qui les caractérisent sont antérieures à 65, années n'étant pas interprétables dans le

premier plan factoriel.

3- Conclusion:

La considération de l'ensemble des variables mesurées ne bouleverse pas la

cartographie précédemment réalisée avec moins de variables, cependant si ces zones restent les

mêmes l'interprétation par les variables est modifiée.

44

Page 70: Analyse multivariée de résultats de tests de détection de

- La Guinée Bissau et le Sénégal restent encore une zone où les stations présentent une rupture

dans les années 66 à 71, cependant il semble que la zone côtière de la Guinée ait réagi entre 66 et

68, tandis que le reste aurait réagi plus tard entre 69 et 71.

De plus les stations ayant réagi entre 66 et 68, présentent une rupture pour la variable 5, pour

des pluies modérées à fortes ou très fortes, alors que les stations ayant réagi entre 69 et 71

possèdent une rupture pour la variable 2.

- L'interprétation de la zone formée par le Burkina Faso est améliorée par cette analyse.

Les stations de ce pays présentent toujours une rupture postérieure à l'année 72 pour les

variables 1 et 4.

Mais les stations autour de ce noyau du Burkina central ne réagissent pas exactement de la

même façon : elles présentent une rupture dans les mêmes années mais pour les variables 4 et 6,

et une rupture pour la variable 5, pour des pluies faibles, modérées, ou fortes.

Ce comportement ne se restreint pas à quelques stations aux frontières du Burkina Faso et à

l'est du Mali, un petit pôle de stations ayant ce profil de réponse est présent au sud du Bénin et

Togo, ce groupe de stations n'apparaissait pas aussi distinctement dans les analyses précédentes.

- Le Cameroun et la République de Centrafrique restent une zone où les stations ne semblent

pas présenter de rupture nette.

Cela semble plus vrai pour le Cameroun, si l'on excepte les deux stations ayant des ruptures

postérieures à 72, car la République de Centrafrique possède des stations au comportement plus

indécis, la majorité ne présente une rupture que pour l'une des variables considérées, les autres

situées à l'ouest présentent des ruptures pour l'ensemble des variables mais à des dates diverses.

- Toute une zone de l'étude reste toujours difficile à interpréter car elle englobe des stations

qui ont des comportements bien dissemblables, c'est le cas des stations du Mali, de l'est de la

Guinée Conakry et de la Côte d'Ivoire.

Le sud du Bénin et du Togo, précédemment non interprétables, semblent associer deux types de

stations, les unes ne présentant aucune rupture quelle que soit la variable donnée, les autres ayant

des ruptures pour les variables 4 et 6 postérieures à l'année 72, et pour quelques caractères de la

variable 5.

Cependant la réduction du nombre de stations gardées pour cette analyse ne permet pas

une interprétation plus approfondie de toute la zone étudiée.

45

Page 71: Analyse multivariée de résultats de tests de détection de

1- Introduction.....:.

Le test de Pettitt (Pettitt, 1979) associe à la date de rupture détectée dans la série

chronologique testée, une probabilité qui correspond à la probabilité Pk de dépassement de la

statistique k du test de Pettitt (cfAnnexe 2).

Cette probabilité Pk est comparée au risque a de première espèce donné, pour rejeter ou

accepter l'hypothèse de départ d'absence de rupture dans cette série.

Quand la probabilité Pk est inférieure à a l'hypothèse nulle d'absence de rupture dans la série

est rejetée.

Donc, plus la probabilité est faible, plus la date détectée est significative, et inversement.

Les analyses précédentes ne tenaient pas compte de cette probabilité, mais les dates de

rupture données par le test de Pettitt étaient jugées acceptables pour un seuil a de 10%.

Le but de cette analyse est donc l'étude des probabilités Pk sur les séries complètes(l) pour

les variables 1, 4 et 6.

L'analyse tient compte de deux paramètres différents: la date de rupture éventuelle et la

probabilité associée au test. Les deux types de données subissent un codage disjonctif complet.

Pour chaque variable, les années sont regroupées en classes de plus de trois ans, et les

probabilités Pk sont elles aussi réparties en classes: probabilité inférieure à 1%, de 1 à 5%, de 5 à

20 % et de 20 à 50%.

Donc, chaque variable possède deux caractères: la date de rupture, qui possède 5 modalités, et

la probabilité avec 4 modalités.

Le tableau à analyser croise donc 115 stations en lignes à 6 variables soit 54 modalités en

colonnes.

(1) _ Cette étude tient compte pour chaque station de la série chronologique la plus longuepossible, sous réserve d'un taux de lacunes de moins de 10%.

46

Page 72: Analyse multivariée de résultats de tests de détection de

2- Analyse des donntes :

L'ACM donne une inertie de 22.12 % pour le premier plan factoriel (13.98 % pour

l'axe 1 et 8.14 pour le second), ce pourcentage assez faible nécessite que l'on s'intéresse à l'axe 3

qui possède une inertie 7.46 %. Ainsi l'interprétation sur ces trois axes, avec une inertie de 29.57

%, peut permettre de bien restituer l'information contenue dans le tableau analysé.

Chaque date de rupture détectée est affectée d'une probabilité Pk.

L'axe 1 isole deux groupes de modalités: le premier correspond aux années 66-68 pour

les trois variables et à des probabilités inférieures à 1 % pour les variables 1 et 4, ce qui traduit

une rupture très significative.

Le deuxième groupe est lié aux années antérieures à 56 pour les variables 1 et 4, et à des

probabilités comprises entre 20 et 50 % pour l'ensemble des variables, et la probabilité 20 % pour

la variable 1 : on peut conclure à l'absence de rupture.

L'axe 2 oppose deux groupes de modalités : le premier regroupe les années antérieures à

56 pour la variable 6 et les années 57-65 pour les variable 1 et 4, seule la probabilité affectée à ce

groupe, inférieure à 1 % pour la variable 6 traduit la présence d'une rupture.

Le deuxième groupe est représenté par une rupture entre les années 69 à 71 pour l'ensemble des

trois variables, et par plusieurs modalités de probabilité: de 1 à 5 % pour les variables 1 et 6, de 5

à 20 % pour les variables 4 et 6, ce qui montre que la rupture est variablement significative.

L'axe 3 permet de distinguer les années postérieures à 72 pour toutes les variables, ainsi

que les probabilités comprises entre 1 et 5 % pour les variables 1 et 4.

La représentation des stations sur les différents axes factoriels permet de faire apparaître

plusieurs groupes au comportement distinct.

L'axe 1 oppose deux groupes de stations : le premier (groupe 1 ) est constitué de 20

stations, réparties majoritairement entre le Sénégal et la Guinée Bissau (12), les autres stations

sont situées à l'ouest du Mali (3), à l'ouest du Burkina Faso (3), ou au nord du Bénin

(Bembereke). Une station est un peu éloignée des autres, elle se situe au nord de la République de

Centrafique (Birao). Donc à l'exception de cette dernière station, ce groupe est surtout localisé à

l'ouest de la zone d'étude.

47

Page 73: Analyse multivariée de résultats de tests de détection de

Figure 0°29 : A.C.M. sur la date de rupture associée à sa probabilité.

115 stations (lignes) et 54 variables (colonnes)deuxième saison des pluies

- Représentation des variables dans le plan factoriel 1-2 -

Inertie du plan factoriel: 22.12%.

a

57-65.1a

-56.6

69-71. 6a

5%.6 a

69-71. 4a

a72+.1

72+.4 a

aa

aa

a • '10

a aa a aa

a a a5%.4 a a aa

a aa

57-65.6

aa

aa

Codage des variables:Exemple: 69-71.4

- période de rupture: 69-71.- code de la variable: variable 4.

Exemple: 20%.6~ probabilité comprise entre 5 et 20%.- code de la variable: 6.

Page 74: Analyse multivariée de résultats de tests de détection de

Figure DOJO; A,C,M, sur la date de rupture associée à sa probabilité.

115 stations (lignes) et 54 variables (colonnes)deuxième saison des pluies

- Représentation des stations dans le plan factoriel 1-2 -

Inertie du plan factoriel: 22.12%.

aa6

ae22 c12 b2a

b17a

aa a26

d25 a ab7

a k6dll

a

m4.a

aml

Groupe 2

a hlü

a b2l

Groupe 4e24.

a

ail

a e2ü

h9a

h8 a

a a clb5 k3 dl 4. a .... p23 a

h13 a d2l p7 Groupe 3aa a a aa

b19 a e15 e2 alüaak13 el4. c2l a c17a kl a b2ü aa hl4. k9 a

k4.il6 a4. a18a a a c19

klü ah12 bl a a3

d7 aa m6 p26 ah4. a b23 e16 a

a a ab4. ad22 a

hll h16 dl e17a

,p22 alla aila c15a a b8 a h6

a7 h2 mlü a el i8 aa

a a12a a e3 a

dlü aa9

ab16 e7

hl a m7 a a a24.a k7

d2üa a a23

48

Page 75: Analyse multivariée de résultats de tests de détection de

Figure 0°31 : A.C.M. sur la date de rupture associée à sa probabilité.

115 stations (lignes) et 54 variables (colonnes)deuxième saison des pluies

- Représentation des variables dans le plan factoriel 1-3 -

Inertie du plan factoriel: 21.44%.

a

72+.1

5%.1a

72+.6a

20%.4a

(J a aaa

1%.6a

aa

aIl

aD aa

a57-65.6

aaa

a57-65.1

a

a

-56.1aa

20%.1

50%.1 a 50%.6

50%.4

a

a- 5.,6.6a

20%.6

a

aa

5%.6a

69-71.1aDa

69-71.6 aa a

a

66-68.4

66-a68.1a

69-71.4

a

a1%.1

1%.4

66-68.6 57-65.4a

Codage des variables:Exemple: 69-71.4

- période de rupture : 69-71.- code de la variable: variable 4.

Exemple: 20%.6- probabilité comprise entre 5 et 20%.- code de la variable: 6.

Page 76: Analyse multivariée de résultats de tests de détection de

Fi~J[e 0°32 : A.C.M. sur la date de rupture associée à sa probllbjJité.

115 stations (lignes) et 54 variables (colonnes)deuxième saison des pluies

- Représentation des stations dans le plan factoriel 1-3 -

Inertie du plan factoriel: 21.44%.

Groupe 5

ela

a

b20

bla

a14

e16a

a12a

b5 aa23

a h12a

b17a

hlO d22m4 a c17klO a

a a k3 a e22 aa a a k7h16 m12 kl a e15

a a a k13 il6a a a b22k4 a bS a

k9a b4 ml

a ai4 a a dU a b7dlO a

c12a a7 a4a

a

hS a k5 b19h13 a aail

hll a h9 h2 a a m7a a mlO

h14 bl6"hl m9 'il3a a ah5 a h3 a b6 b2lh15 h4 a ad7 a

a a a m6 aa17kS h7 e20 m5

b12a

e14a d2l

ab9

iSa

a6a

ad20a

k6

a

d14

c6 p7a2 aa e2 aaalO a alS

a a ad6 26d25 a ilO aa

a5 a e17 apl ap17

a c7 :p23 a b2 aap26a El c20 9

a dl d5 a c13 aamll a a24 aD 21

h6 a cad12 plO

a

a aS

c15a

a

c19

a kllall

49

Page 77: Analyse multivariée de résultats de tests de détection de

Figure nO 33 : cartographie de l'AtM avec la date de rupture associée à sa probabilité..

• Groupe1: rupture entre 66 et 68 avec probabilité de 1%.• Groupe2: rupture entre 69 et 71 avec prob de 5 à 20%.o Groupe3: rupture avant 56 avec prob de 50%.'" Groupe4: rupture entre 57 et 65.• Groupe5: rupture après 72 avec prob de 5%.o Groupe6: indécis.

•o

(

)

i,'-.,

1

~..~

--_._./ .{0]

--

---.. ---_._._. __._----_... -._ .... _.._--

Page 78: Analyse multivariée de résultats de tests de détection de

Le deuxième groupe (groupe 3) est formé de 17 stations, localisées sur deux pôles : l'un au sud

du Bénin et du Togo (9 stations), l'autre au Cameroun et à l'ouest de la République de

Centrafrique (6) ; les deux dernières stations sont situées proches du premier pôle, une dans le

nord du Togo (Barkoissi) et une dans le sud de la Côte d'Ivoire (Banco).

La coupure géographique liée à l'absence de données au Nigeria ne permet pas de conclure à

l'existence d'une seule et même zone.

L'axe 2 permet de distinguer deux groupes de stations. Le premier, appelé groupe 2,

comporte 19 stations situées sur toute la zone d'étude: 3 en Guinée Bissau, 1 au Sénégal, 1 en

Guinée Conakry, toutes ces stations étant côtières, 2 en Côte d'Ivoire, 1 au Mali, 4 au Burkina, 4

au Bénin, 1 au Cameroun et 2 en Centrafrique. Donc ce groupe ne semble pas avoir une structure

spatiale bien définie.

Le deuxième groupe (groupe 4) est constitué de 16 stations réparties elles aussi sur l'ensemble

de la zone d'étude : 1 station à l'est de la Guinée Bissau, 2 au sud du Sénégal, 2 au Mali, 1 au

nord de la Côte d'Ivoire, 2 au Burkina Faso, 4 au Bénin (2 au sud et 2 au nord), 1 au Cameroun

et 3 en Centrafrique. Donc ce groupe ne semble pas avoir une répartition spatiale clairement

établie.

L'axe 3 permet de faire apparaître un dernier groupe de stations (groupe 6). TI est formé

de 8 stations, dont la majorité est située à l'est du Burkina Faso (4), 3 stations du sud de la Côte

d'Ivoire appartiennent aussi à ce groupe, tout comme une station au Cameroun (Abong Mbang).

Donc à l'exception de cette dernière station, ce groupe est localisé entre les méridiens 7° ouest

et 2° est de longitude.

Certaines stations n'appartiennent à aucun des groupes définis sur les trois premiers axes

factoriels. Ces 35 stations sont situées sur un peu toute la zone d'étude: 4 stations au Sénégal, 2

en Guinée Conakry, 4 en Guinée Conakry, 5 au Mali, 4 en Côte d'Ivoire, 4 au Burkina Faso, 3 au

Togo, 2 au Bénin, 2 au Cameroun et 5 en Centrafrique.

La cartographie de ces différents groupes permet de faire apparaître des zones distinctes.

- La première zone couvre le Sénégal et la Guinée Bissau où les stations côtières ont une

rupture jugée significative (Pk compris entre 5 et 20 %) dans les années 69 à 71, tandis que les

autres stations ont une rupture très significative (Pk inférieur à 1 %) entre 66 et 68.

- Le Burkina Faso présente une rupture dans les années postérieures à 72 (Pk comrpis entre 1 et

5 %).

La lacune formée par le Ghana ne permet pas de savoir s'il est possible de rattacher cette zone

du Burkina aux quelques stations du sud est de la Côte d'Ivoire.

50

Page 79: Analyse multivariée de résultats de tests de détection de

- Le sud du Togo et du Bénin constitue une zone sans rupture.

Le Cameroun possède des stations qui ont le même comportement. TI est donc possible que ces

deux zones n'en forment en réalité qu'une seule, mais la lacune liée au Nigeria empêche toute

conclusion.

- Le Mali, la Guinée Conakry, la Côte d'Ivoire, le nord du Togo et du Bénin, et la République

de Centrafrique ne semblent pas affectés par un comportement particulier, des ruptures plus ou

moins significatives peuvent être décelées, de même que des absences de rupture.

51

Page 80: Analyse multivariée de résultats de tests de détection de

La démarche initiale d'analyse des résultats des tests de rupture sur les séries

chronologiques, par des méthodes univariées et site par site, nia pas donné la possibilité d'une

interprétation spatiale aisée des variations pluviométriques.

Les analyses présentées précédemment, Analyses des Correspondances Multiples, ont

permis de regrouper des stations par leur comportement (réponse aux tests de rupture) vis à vis

des variables (analyse multivariée), et ainsi de cartographier les résultats des tests de rupture.

La zone d'étude couvrant 16 pays peut se découper en quatre zones au comportement

distinct vis à vis des trois variables retenues : hauteur annuelle des précipitations, hauteur des

précipitations durant la saison sèche, et nombre de jours pluvieux dans l'année.

- Une première zone regroupe le Sénégal, la Guinée Bissau, l'ouest de la Guinée Conakry et

une partie du Mali. Les stations de cette région présentent une rupture dans les années 66-71.

Elles correspondent aux groupes 1 (rupture en 66-68) et 2 (rupture en 69-71) des analyses, la

distinction géographique entre les deux groupes étant difficile, car les stations sont très

mélangées, même si les stations côtières semblent présenter les ruptures les plus précoces.

- Le Burkina Faso semble se détacher des autres régions de l'étude, il présente une rupture

dans les années postérieures à 72. Cette zone centrée au Burkina semble s'étendre à l'est du Mali

et au nord du Bénin, et peut être à une partie de la Côte d'Ivoire.

- Le Cameroun et la République de Centrafrique forment une troisième zone, qui n'aurait pas

réagi aux tests de détection de rupture. En effet, la grande majorité des stations de ces deux pays

appartiennent quelle que soit l'ACM, aux groupes 5 et 6, groupes représentés par les variables de

réponse négative aux tests de rupture.

- Le sud du Bénin et du Togo, l'est de la Guinée Conakry, l'est et le centre du Mali peuvent

être regroupés dans une dernière zone, qui correspond à une région intermédiaire par rapport aux

autres zones. Les stations qui la composent, n'ont pas réagi ou ont réagi à des dates diverses, et

différemment selon les variables, les stations d'un même pays ayant donné des réponses de

rupture à toutes les dates de la série chronologique. Cette zone ressemble à un panachage de

stations qui appartiennent à des groupes différents dans les diverses analyses.

L'interprétation des résultats des analyses est difficile à effectuer, car la zone d'étude

présente une forte discontinuité géographique. L'absence de données au Ghana, au Liberia, au

52

Page 81: Analyse multivariée de résultats de tests de détection de

Nigeria, en Sierra Leone, au Tchad, au nord de la Côte d'Ivoire, à l'est de la Guinée Conakry est

très préjudiciable.

Le Nigeria coupe la zone d'étude en deux, et tend donc à isoler le Cameroun et la

République de Centrafrique. C'est pourquoi il est difficile de savoir si ces deux pays ont un

comportement bien distinct par rapport à toute l'autre partie de l'étude.

La zone formée par le Burkina doit probablement s'étendre au Ghana et au nord de la

Côte d'Ivoire, mais en l'absence de données on ne peut pas conclure.

Un plus large panel de stations serait nécessaire pour interpréter correctement l'ensemble

des variations pluviométriques survenues sur toute la zone d'Afrique de l'ouest non Sahélienne.

fi faut noter aussi que la base de données de départ décrivait les stations par 6 variables

pluviométriques. Les analyses présentées précédemment ne tiennent compte que de trois, voire

quatre d'entre elles. Les autres ont été écartées, d'une part parce que peu de stations présentent

une rupture sur ces variables et d'autre part car le nombre de stations échantillonnées est faible si

l'on considère l'ensemble des variables, ce qui nuit à toute interprétation spatiale.

Les analyses multivariées ont été effectuées à partir des résultats de tests statistiques de

détection de rupture sur des séries chronologiques.

Donc les résultats de ces analyses sont dépendants d'une part des données pluviométriques

récoltées dans les divers pays de la zone d'étude, d'autre part des résultats engendrés par les tests

de détection de rupture.

Les données pluviométriques ont été récoltées dans divers pays, par des organismes différents,

il est donc fort probable que de nombreux biais d'échantillonnage affectent ces données.

Les tests de détection de rupture présentent toujours un risque d'erreur dans la prise en compte

des résultats, risque lié à la statistique de chaque test et au seuil d'acceptation pris par l'utilisateur

du test. De plus l'utilisation de plusieurs tests sur les mêmes données a engendré des difficultés

dans l'analyse des résultats, les tests n'apportant pas toujours les mêmes résultats pour une série

donnée.

Donc, cette double dépendance doit engendrer un biais important dans la qualité de

l'interprétation des résultats des analyses.

53

Page 82: Analyse multivariée de résultats de tests de détection de

Bouroche, J.M. & Saporta, G. (1992). L'analyse des données. PUF, Paris, 127 p.

Ceresta (Centre d'Enseignement et de Recherche de Statistique Appliquée). (1986). Aide­

mémoire pratique des techniques statistiques pour ingénieurs et techniciens supérieurs. Ceresta,

Paris, 287 p.

Chesse~ D. & Dolédec, S. (1995). ADE Version 4.0 : Hypercard © Stacks and

QuickBasic Microsoft © library for the Analysis ofEnvironmental Data. User 's manual. 1-150.

Fiches pratiques, 200 p. Université Lyon 1, 69622 Villeurbanne cédex.

Delattre, M.O. (1996). Evolution climatique en Afrique de l'ouest et centrale non

sahelienne. Rapport de DEA, ORSTOM, Montpellier, 54p.

Diday, E. & Lemaire, l & Pouget, l & Testu, F. (1982). Eléments d'analyse de données.

Ed. Dunod, Bordas, Paris, 462 p.

Hubert, P. & Carbonne~ IP. & Chaouche, A (1989). Segmentation des séries

hydrométéorologiques. Application à des séries de précipitations et de débits de l'Afrique de

l'Ouest. Journal ofHydrology, vol. 110, pp 349-367.

Khodja, H. (1996). Etude spatio-temporelle de données pluviométriques. Recherche d'une

rupture. Rapport de DEA, ORSTOM, Montpellier, 31p.

Lebart, L. & Morineau, A. & Tabard, N. (1977). Techniques de la description statistique.

Méthodes et logiciels pour l'analyse des grands tableaux. Ed. Dunod, Bordas, Paris, 352 p.

Lee, AF.S.& Heghinian S.M. (1977). A shift Of The Mean Level In A Sequence Of

Independent Normal random Variables-A Bayesian Approach-. Technometrics, vol. 19, n04, pp

503-506.

Lubes, H. & Masson, IM.& SelVat, E. & Pature~ lE. & Kouame, B. & Boyer, IF.

(1994). Caractérisation de fluctuations dans une série chronologique par application de tests

statistiques. Etude bibliographique. Rapport ICCARE n03. ORSTOM UR 2,21 p.

Pettitt, A.N. (1979). A non-parametric approach to the change-point problem. Applied

Statistics, 28, n02, pp 126-135.

SelVat, E. (1994). ICCARE Identification et Conséquences d'une variabilité du Climat en

AfRique de l'ouest non sahElienne. Présentation du programme, ORSTOM DEC, 23p.

Page 83: Analyse multivariée de résultats de tests de détection de
Page 84: Analyse multivariée de résultats de tests de détection de

LISTE DES ANNEXES;

- Annexe nO 1 : Calcul matriciel de l'Analyse des Correspondances Multiples.

- Annexe n02 : Test de Pettitt.

- Annexe n03 : Tableau récapitulatif des variables traitées par pays.

- Annexe n04 : Résultats de l'ACM réduite à certaines variables (première saison des pluies).

- Annexe nOS: Résultats de l'ACM réduite à certaines variables (deuxième saison des pluies).

- Annexe n06 : Résultats de l'ACM tenant compte des dates de rupture.

- Annexe nO? : Résultats de l'ACM avec l'Anomalie considérée comme rupture.

- Annexe n08 : Résultats de l'ACM avec une variable supplémentaire.

- Annexe nog : Résultats de l'ACM avec l'ensemble des variables.

- Annexe n° 10 : Résultats de l'ACM sur la date de rupture associée à sa probabilité.

Page 85: Analyse multivariée de résultats de tests de détection de

Annexe D°l ; Calcul matriciel de l'A.C,M.

Soit un tableau U à q variables en colonnes et à n individus en lignes.

q varie de 1 à Q

Jq est le nombre de modalités de la variable q.

J est le nombre total de modalités :

QJ = :LJq

q=l

u q. est l'effectif de la modalité j de la variable q..J

J Q

avec L L U1 =nQj=l q=l

Ui. = Q est la somme en ligne

Le tableau U ainsi constitué est un tableau disjonctif complet.

L'analyse des Correspondances Multiples du tableau U correspond à une Analyse

Factorielle des Correspondances du tableau R, soit une Analyse en Composantes Principales du

tableau X.

R est le tableau issu du produit entre la matrice issue du tableau U et le vecteur (n~'

avec X = DI-1RDJ-1

où DI est la métrique des individus (matrice diagonale lin), et D J métrique des variables

(matrice diagonale des effectifs de chaque modalité).

L'ACP du triplet (X, DI, DJ) revient à chercher les vecteurs propres de la matrice WDI

pour obtenir la représentation des individus, et les vecteurs propres de la matrice VDJ pour la

représentation des variables.

V est la matrice des variances :

West la matrice des produits scalaires (distances entre individus) : W = DI-1RDJ-1RtDI-1

Page 86: Analyse multivariée de résultats de tests de détection de

les composantes principales C sont les vecteurs propres de WDI:

WDI =DI-1RDJ-IR1DI-IDI = DI-IRDJ-IR 1

donc Ck Â-k = Ck (D(IRDJ-IR 1) le vecteur Ck est le vecteur propre de WDI associé à la valeur propre Â-k.

les axes principaux asont les vecteurs propres de VDJ :

VDJ =DJ-IR 1DI-IRDJ-IDJ = DJ-IRln -IR

donc ak Â-k = ak (Th-IR ITh-IR) le vecteur ak est le vecteur propre de VOJ associé à la valeur propre Â-k.

Donc, l'ACM d'un tableau disjonctif complet se résume à réaliser une double ACP, l'une

associée aux profil-lignes (individus) et l'autre aux profil-colonnes (variables).

Page 87: Analyse multivariée de résultats de tests de détection de

Annexe 0°2 : Test de PettiU.

Le test de Pettitt a pour but de détecter une date de rupture dans une série chronologique.

Une rupture est définie comme une variation brutale de la série chronologique à une date

précise, qui est inconnue.

Le test de Pettitt ne détecte qu'une seme rupture, dans une même série chronologique.

La série chronologique est divisée en deux pour former deux parties, dont les valeurs de

chacune sont classées par ordre croissant.

Le calcu1 de la somme des rangs des éléments de chaque partie dans un échantillon total permet

de définir une statistique. Cette statistique est testée sous l'hypothèse nulle d'appartenance des

deux parties à une même série chronologique.

L'hypothèse nulle du test est donc l'absence de rupture dans la série.

Pour un instant t variant de 1 à N (N étant l'effectif de la série), on suppose que:

les séries (Xi), i = 1 à t, et (Xi), i = t+1 à N, appartiennent à la même population.

Soit Dij = sgn (Xi-Xj), avec sgn (x) = 1 si x > 0

Osix=O

-1 si x < 0

On considère la variable Ut,N telle que:

t N

Ut,N = L LDiji=l j=t+l

Soit KNla variable définie par le maximum (en valeur absolue) de Ut,N , pour t variant de 1

àN-l.

Si k correspond à la valeur de KNprise sur la série étudiée, sous l'hypothèse nulle, la

probabilité Pk de dépassement de la valeur k est donnée approximativement par:

Pour un risque a de première espèce donné, si Pk est inférieure à a, l'hypothèse nulle est rejetée.

Page 88: Analyse multivariée de résultats de tests de détection de

Annexe n03 : Récapitulatif des variables traitées par pays.

Point 1

Togo ....< ..••..••..• baisse légère

changementpeu notable

rien

rien de netni de général

baisse vers 1970saufrégion Tabou etfrontière llhaniéënne

baisse au sudet au nordautour de 1970

baisse importante

baisse notableau centre-ouest

1Cavant 1970)

nen baisse importantesur les déc. 60et 70

nen chute brutalevers fin déc. 60

nen chute brutalesur les déc. 50et 60

nen

nen nen

léger nenchangementen + ouen-rien nen

rien rien

nen nen

rien rien

nen nen

nen nen nen nen

nen nen

Point 5 ... ~oint s Poii'lts ···PôUrt6 .fliiblesà .·ntodérees(Jr~:et»·· •..........mc)dérees .·.Jc)rt~ tijSJc).rteS>

nen riennen

nen

nen

>.... .... ..P!.Iint S. .. ·······plUieS

»>.•. ra(l>les

Point 4.zone à

2 slii.stiïiS

rien de net nen

1ère : baisse sur le nen rienlittoral est (déc. 70)2ème : baisse (1970)

rien rien

1ère : baisse nen nen2ème : baisse

1ère: rien léger nen2ème : baisse changement

en + ouen-1ère: rien nen nen2ème : baisse faibleau sud

nen nen

léger nenchangementplutôt en +

Point 2 Pointl· Point 3 Point 4zone à

......tl)n~li·· ... zôneà)

[saison :n.iii(ins . 1 saisonItmplus nen b81sseprécoce importantevers 1960 (déc. 60 et 70)rien de net nen baisse notable

à partir de lafin déc. 60

rien de net nen baisse notablemoindre prèsdeRCI

nen rien de net baisseimportante

fin plus légère tendance nen ~aisse

précoce à être plusdéc. 70 courtesrien de net rien de net baisseparfois fin importanteplus précoce (déc. 70)rien 1ère : fin plus nen baisse

précoce vers 1975 d'homogène2ème: rien

fin plus 1ère: plus courte zone à baisseprécoce 2ème : début et fin 2 saisons: (déc. 70)vers 1960 plus précoces rééquilibragedébut plus 1ère: rien nen baisseprécoce 2ème : fin plus d'exploitable surtout

Iprécoce (déc. 60) au sudnen

saison plus nen baissecourte dès 1960

•.•. > bai~se générale... momdre au centre

autour de 1970

BéiIin

Burkina Faso forte baisse partout." .. ::. .... .. ":; "::;.:.;::: autour de 1970-75............< > ........••

Cameroun ••• baisse générale

peu intense

Güiniéë .•.. • baisse globale

94#alU-y •.•••.••••••••••• ::::~~:;: ;~70

Cei'lfrafriqi.le baisse importante.... aunord

(;uill~< baisse globale etBissa... •..... intense autour

............ de 1967

Tchad •.. .••.. baisse en tendancenon en rupture

c;atêcNVclife·. baisse saufaunord-est

lSéne&all b81sse généraleGambie importante autour

.••••••••.•.. .••. ..... de 1967

M~Ii; ... ..• . ......••.. baisse générale

.....> .» autour de 1967-70.......... .

Page 89: Analyse multivariée de résultats de tests de détection de

Annexe 0°4 ; Résultats de l'A.C.M. réduite à certaines variables.

première saison des pluies

ADE-4 * Metrowerks CodeWarrior C * CNRS-Lyonl * JT & DCMCA: Multiple Correspondence Analysis

Uniform row weights.

File tab.cmpl contains the row weights.It has 83 rows and 1 column.

File tab.cmpc contains the column weights (IN)*DM.It has 16 rows and 1 column.

File tab.cmta contains the tabled processed by MCAIt has 83 rows and 16 columns (categories).

DiagoRC: General program for two diagonal inner product analysis.Input file: tab.cmta.--- Number ofrows: 83, columns: 16.

- Total inertia: 1

Num. Eigenval. 1 RIner. 1 RSum Num. Eigenval. 1 RIner. 1 RSum01 3.7128E-Ol 0.3713 0.3713 02 1.8921E-Ol 0.1892 0.560503 1.7402E-Ol 0.1740 0.7345 04 1.5258E-Ol 0.1526 0.887105 1.1291E-Ol 0.1129 1.0000 06 O.OOOOE+OO 0.0000 1.0000

Histogramme des valeurs propres (Eigenvalue) :

0.40 -r----------------------,0.35

0.300.25

0.20

0.15

0.10

0.05

0.00

1 2 3 4 5 6

Page 90: Analyse multivariée de résultats de tests de détection de

Annexe nOS: Résultats de l'A,C.M. réduites à certaines yariables.

Deuxième saison des pluies.

ADE-4 * Metrowerks CodeWarrior C * CNRS-Lyonl * JT & DCMCA: Multiple Correspondence Analysis

Unifonn row weights.

File tab.cmpl contains the row weights.It has 83 rows and 1 column.

File tab.cmpc contains the column weights (IN)*DM.It has 16 rows and 1 column

File tab.cmta contains the tabled processed by MCAIt has 83 rows and 16 columns (categories).

DiagoRC: General program for two diagonal inner product analysis.Input file: tabI2.cmta.--- Number ofrows: 83, columns: 16.

- Total inertia: 1

Num. Eigenval. 1 RIner. 1 RSum Num. Eigenval. 1 RIner. 1 RSum01 3.3933E-Ol 0.3393 0.3393 02 2.2611E-Ol 0.2261 0.565403 1.9230E-Ol 0.1923 0.7577 04 1.5147E-Ol 0.1515 0.909205 9.0789E-02 0.0908 1.0000 06 O.OOOOE+OO 0..0000 1.0000

Histogramme des valeurs propres (Eigenvalue) :

0.35 ~----------------------.

0.30

0.25

0.20

0.15

0.10

0.05

0.00

1 2 3 4 5 6

Page 91: Analyse multivariée de résultats de tests de détection de

Annexe n06 : Résultats de l'A.C.M. tenant compte de la date de rupture.

ADE-4 * Metrowerks CodeWarrior C * CNRS-Lyonl * JT & DCMCA: Multiple Correspondence Analysis

Uniform row weights.

File acm.cmpl contains the row weights.It has 123 rows and 1 column.

File acm.cmpc contains the column weights (IN)*DM.It has 56 rows and 1 column

File acm.cmta contains the tabled processed by MCA.It has 123 rows and 56 columns (categories).

DiagoRC: General program for two diagonal inner product analysis.Input file: acm.cmta.--- Number ofrows: 123, columns: 56.

- Total inertia: 1

Num. Eigenval. 1 R.Iner. 1 R.Sum Num. Eigenval. 1 R.Iner. 1 R.Sum01 3.3933E-Ol 0.1338 0.1338 02 1. 1191E-Ol 0.1119 0.245703 1.0124E-Ol 0.1012 0.3469 04 9.4604E-02 0.0946 0.441505 8.6466E-02 0.0865 0.5280 06 8.404E-02 0.0840 0.612007 7. 1803E-02 0.0718 0.6838 08 7. 1115E-02 0.0711 0.754909 6. 1208E-02 0.0612 0.8162 10 5.7413E-02 0.0574 0.873611 5.0004E-02 0.0500 0.9236 12 4. 1817E-02 0.0418 0.965413 2. 1255E-02 0.0213 0.9866 14 1.3361E-02 0.0134 1.0000

Histogramme des valeurs propres (Eigenvalue) :

0.14 .,.------------------------,

0.12

0.10

0.08

0.06

0.04

0.02

0.00

1 2 3 4 5 6 7 8 9 10 11 12 13 14

Page 92: Analyse multivariée de résultats de tests de détection de

Annexe n07 ; Résultats djÙ'A.c'M. avec J'Anomalie comme rupture.

ADE-4 * Metrowerks CodeWarrior C * CNRS-Lyonl * JT & DCMCA: Multiple Correspondence Analysis

Uniform row weights.

File acm. cmpl contains the row weights.It has 123 rows and 1 column.

File acm.cmpc contains the column weights (IN)*DM.It has 56 rows and 1 column.

File acm.cmta contains the tabled processed by MCA.It has 123 rows and 56 columns (categories).

DiagoRC: General program for two diagonal inner product analysis.Input file: acm.cmta.--- Number ofrows: 123, columns: 56.

- Total inertia: 1

Num. Eigenva1. 1 R.Iner. 1 RSum Num. Eigenva1. 1 R.Iner. 1 R.Sum01 1.3480E-Ol 0.1348 0.1348 02 1.1315E-Ol 0.1131 0.247903 1.0631E-Ol 0.1063 0.3543 04 1.0068E-01 0.1007 0.454905 9.0820E-02 0.0908 0.5458 06 8.5635E-02 0.0856 0.631407 8.0320E-02 0.0803 0.7117 08 6.5665E-02 0.0657 0.777409 6. 1388E-02 0.0614 0.8388 10 5.4775E-02 0.0548 0.893511 5.0086E-02 0.0501 0.9436 12 3.2897E-02 0.0329 0.976513 1.4599E-02 0.0146 0.9911 14 8.8761E-03 0.0089 1.0000

Histogramme des valeurs propres (Eigenvalue) :

0.14.--------------------...,

0.12

0.10

0.08

0.06

0.04

0.02

0.00

1 2 3 4 5 6 7 8 9 10 11 12 13 14

Page 93: Analyse multivariée de résultats de tests de détection de

Annexe n08 ; Résultats de l'A.C.M.ayec une variable supplémentaire.

ADE-4 * Metrowerks CodeWarrior C * CNRS-Lyon1 * JT & DCMCA: Multiple Correspondence Analysis

Uniform row weights.

File acm.cmpl contains the row weights.It has 104 rows and 1 column.

File acm.cmpc contains the column weights (lN)*DM.It has 60 rows and 1 column.

File acm.cmta contains the tabled processed by MCA.It has 104 rows and 60 columns (categories).

DiagoRC: General program for two diagonal inner product analysis.Input file: acm. cmta.--- Number ofrows: 104, columns: 60.

- Total inertia: 1

Num. Eigenval. 1 R.Iner. 1 R.Sum Num. Eigenval. 1 R.Iner. 1 R.Sum01 1.3378E-Ol 0.1338 0.1338 02 1.0426E-Ol 0.1043 0.238003 9.6965E-02 0.0970 0.3350 04 9.0698E-02 0.0907 0.425705 8.4885E-02 0.0849 0.5106 06 7.9315E-02 0.0793 0.589907 7.0929E-02 0.0709 0.6608 08 6. 8604E-02 0.0686 0.729409 6.3307E-02 0.0633 0.7927 10 5.3139E-02 0.0531 0.845911 4.7629E-02 0.0476 0.8935 12 4.2327E-02 0.0423 0.935813 3.3451E-02 0.0335 0.9693 14 1.8790E-02 0.0188 0.988115 1.1920E-02 0.0119 1.0000 16 O.OOOOE+OO 0.0000 1.0000

Histogramme des valeurs propres (Eigenvalue) :

0.14

0.12

0.10

0.08

0.06

0.04

0.02

0.00 1 •1 2 3 4 5 6 7 8 9 10 Il 12 13 14 15 16

Page 94: Analyse multivariée de résultats de tests de détection de

Annexe n09 ; Résultats d~ l'A.C.M. avec l'ensemble des yariab~

ADE-4 * Metrowerks CodeWanior C * CNRS-Lyon1 * JT & DCMCA: Multiple Correspondence Analysis

Uniform row weights.

File acm.cmp1 contains the row weights.It has 100 rows and 1 column.

File acm.cmpc contains the co1umn weights (lN)*DM.It has 76 rows and 1 column.

File acm.cmta contains the tabled processed by MCAIt has 100 rows and 76 columns (categories).

DiagoRC: General program for two diagonal inner product analysis.Input file: acm.cmta.--- Number ofrows: 100, columns: 76.

- Total inertia: 1

Num. Eigenval. 1 RIner. 1 RSum Num. Eigenval. 1 RIner. 1 RSum01 1.0992E-01 0.1099 0.1099 02 9.9043E-02 0.0990 0.209003 8.0336E-02 0.0803 0.2893 04 7.7440E-02 0.0774 0.366705 6.9100E-02 0.0691 0.4358 06 6.5638E-02 0.0656 0.501507 6.5544E-02 0.0655 0.5670 08 6. 1436E-02 0.0614 0.628509 5.6616E-02 0.0566 0.6851 10 4.9134E-02 0.0491 0.734211 4.4459E-02 0.0445 0.7787 12 4. 1120E-02 0.0411 0.819813 3.9424E-02 0.0394 0.8592 14 3.7713E-02 0.0377 0.896915 3.4134E-02 0.0341 0.9311 16 2.3390E-02 0.0234 0.954417 2.2176E-02 0.0222 0.9766 18 1.4466E-02 0.0145 0.991119 8.9143E-03 0.0089 1.0000 20 O.OOOOE+OO 0.0000 1.0000

Histogramme des valeurs propres (Eigenvalue) :

0.12

0.10

0.08

0.06

0.04

0.02

0.00 III.1 3 5 7 9 11 13 15 17 19

Page 95: Analyse multivariée de résultats de tests de détection de

L'anâlyse multivariée des résultats de tests de détection de rupture sur les séries

chronologiques de données pluviométriques, a pour but de représenter spatio-temporellement la

variation climatique éventuelle que semble subir la région de l'Afrique de l'ouest non sahélienne

depuis une vingtaine d'années.

Plusieurs Analyses des Correspondances Multiples ont permis de former des groupes de

stations au comportement voisin, vis à vis des variables pluviométriques retenues : hauteur

annuelle des précipitations, hauteur des précipitations pendant la saison sèche et nombre de jours

pluvieux dans l'année.

La représentation spatiale des résultats issus de ces analyses, montre la présence de

différentes zones qui se distinguent vis à vis des variables par l'absence, ou la présence en des

dates diverses, d'une rupture.

Mots clés:

- Analyse des Correspondances Multiples.

- Tests de détection de rupture.

- Séries chronologiques pluviométriques.