doktori ÉrtekezÉs - · doktori ÉrtekezÉs wantuchnÉ dobi ildikÓ 2002 . 2 napi meteorolÓgiai...
TRANSCRIPT
1
DOKTORI ÉRTEKEZÉS
WANTUCHNÉ DOBI ILDIKÓ
2002
2
NAPI METEOROLÓGIAI ID İSOROK TÖBBDIMENZIÓS
SZTOCHASZTIKUS MODELLEZÉSE
MATEMATIKA DOKTORI ISKOLA
ALKALMAZOTT MATEMATIKA PROGRAM
EÖTVÖS LORÁND TUDOMÁNYEGYETEM
TERMÉSZETTUDOMÁNYI KAR
Témavezetı:
Dr. Szeidl László
Meteorológus konzulens:
Dr. Mika János
ORSZÁGOS METEOROLÓGIAI SZOLGÁLAT
3
Tartalomjegyzék
A disszertáció tézisei
I. Célkitőzés 1
II. Módszerek és adatok 2
III. Eredmények 3
IV. A hasznosítás lehetıségei 5
V. Az értekezéshez kapcsolódó publikációk 6
Bevezetés 8
1. Szakirodalmi elızmények 11
1. 1. Sztochasztikus idıjárás generátor modellek 11
1. 2. Csapadék állapot modellek 16
1.3. A klímaváltozás leskálázása 18
2. A disszertációban felhasznált meteorológiai adatok 22
3. Száraz és csapadékos tartamok elemzése, modellezése 24
3. 1. Függetlenség vizsgálat 25
3.2. Eloszlásillesztés 29
4. Elıkészítı lépések 34
4. 1. Transzformációk 34
4.1.1. Sokéves napi átlag és szórás számítása száraz és csapadékos napok szerint 35
4.1.2. Fourier sorfejtés alkalmazása a sokéves feltételes statisztikákra 35
4.1.3. Simított sorok elıállítása Inverz Fourier Transzformációval 36
4.1.4. Rezidum sorok elıállítása a simított sorok felhasználásával 38
4. 2. Idıjárási paraméterek néhány jellemzıje 46
4.3. Faktoranalízis 47
4.4. Normalitás vizsgálat 49
4.5. Feltételes korreláció, autokorreláció 52
4
5. Modellfejlesztés lépései 57
5.1. Kísérlet együttes autoregresszív modellezésre 57
5.2. Modellezés Johnson eloszlással 59
6. Idıjárás generátor modell és szimuláció 60
7. Verifikáció 62
Függelékek 65
Hivatkozások 71
Köszönetnyilvánítás 78
Összefoglaló 79
Summary 80
5
I. CÉLKITŐZÉS
A meteorológia a statisztika és a sztochasztikus folyamatok egyre bıvülı
eszközrendszerét alkalmazza az idıjárás-elırejelzés és az éghajlatkutatás különféle területein.
A matematikai módszertan és a számítástechnika fejlıdése mellett ebben az is szerepet
játszik, hogy a hidro-termodinamika determinisztikus egyenletrendszernek egyre kisebb tér-
és idıbeli léptékben lehetséges megoldása, továbbá az új környezeti problémák, és adat-
rendszerek megjelenése korábban nem ismert feladatokat fogalmaz meg az alkalmazott
matematika számára. Jelen dolgozatban a feladat egy adott pont napi idıjárásának a kezdeti-
értékektıl független, vagyis a determinisztikus kezelhetıség maximum 2-3 hetes idıtávján
túli szimulációja. Ennek érdekében olyan többdimenziós statisztikai modellt fejlesztettünk ki,
amely lehetıvé teszi a tényleges meteorológiai idısorokkal statisztikai értelemben azonos,
belsıleg konzisztens adatsorok szimulációját. Az ilyen eljárásokat a szakirodalomban
(Sztochasztikus) Idıjárás Generátor Modelleknek (IGM) nevezik.
A modell felépítését elsısorban a leggyakoribb alkalmazás, a globális klímaváltozás
regionális kockázatait vizsgáló különféle (agrometeorológiai, hidrológiai, stb.) hatásvizsgálati
modellek éghajlati adat szükséglete határozta meg, ami az e folyamatokat befolyásoló napi
idıjárási elemek tetszıleges hosszúságú adatsorainak elıállítását jelentette. Az alkalmazások
adatigényének együttes kielégítése érdekében kilenc meteorológiai elem párhuzamos
modellezését tőztük ki célul, ami többszöröse az eddig közzétett IGM-ek dimenziószámának.
A nemzetközi szakirodalomban elérhetı IGM modellek áttekintése után a Racskó és
mtsai (1991) által publikált háromváltozós (napi középhımérséklet, csapadék, napfénytartam)
modelljének továbbfejlesztése mellett döntöttünk. Megıriztük ennek az alapkoncepcióját, az
új modell is az egymás utáni napok száraz/csapadékos állapotából indul ki, vagyis az egymást
követı száraz és csapadékos szériák hosszának, mint önálló sztochasztikus folyamatnak a
statisztikus tulajdonságaira épül. E diszkrét folyamat kisebb általánosításán, s az elemek
számának bıvítésén túl meghaladtuk – a klímaváltozás hatásvizsgálataiban világszerte
gyakran hivatkozott – dolgozat eredményeit abban is, hogy a változók egymástól független
elıállítása helyett többváltozós folyamattal végeztük a szimulációt, felhasználva a nem
normális eloszlások esetén ajánlott Johnson transzformációt.
6
A fenti fı alkalmazás érdekében a modell paraméterei változtathatók, ami lehetıvé
teszi a generátor alkalmazását más, a regionális éghajlati forgatókönyvek által elırevetített,
jövıbeli klíma értékre is. A modell paraméterek becslését 45 év hosszúságú bázis–idıszakra
végeztük el, ennek során a szimulált és a tényleges idısorok közötti megfelelés alatt a
feltételes átlag, szórás, ferdeség, lapultság, korreláció és autokorreláció értékek statisztikai
értelemben vett megegyezését követeltük meg.
II. MÓDSZEREK ÉS ADATOK
A dolgozatban a valószínőségelméleti fogalmak, statisztikai módszerek és a
sztochasztikus folyamatok elméletének széles körő alkalmazására törekedtünk.
A meteorológiai elemek idısorainak elemzése során felhasználtuk a becsléselmélet
(pl. legkisebb négyzetek) és a hipotézis vizsgálat különféle módszereit (Komogorov–
Szmirnov próba, t, u, χ2, Mann–Whitney teszt), továbbá a faktoranalízis, a többdimenziós
normális eloszlás, valamint a különféle alap és keverék eloszlások illesztésére és a regressziós
becslésekre vonatkozó ismereteket. Az évszakos menet kiszőréséhez, valamint a gyengén
stacionárius idısorok becslésénél az idısor analízis egyes elemeit, pl. Fourier transzformációt,
kovariancia becslést, az elsırendő autoregresszív folyamatot alkalmaztunk. A többdimenziós
folyamat modellezésének egyik fontos eleme a többváltozós Johnson eloszlás felhasználása.
Az elemzéseknél felhasznált egyes próbák és módszerek részletes leírását az Értekezés
Függelékként tartalmazza.
A modell szerkezeti felépítéséhez és parametrizálásához tanuló adatbázisként az
OMSZ két eltérı éghajlatú fıállomásán Szegeden és Szombathelyen 1951 és 1995 közötti,
napi közép-, valamint maximum- és minimum-hımérséklet, csapadékösszeg, napfénytartam,
relatív nedvesség, felhızet, szélsebesség és légnyomás értékeit használtuk fel. Az állomások
kiválasztását az éghajlati sajátosságoknak az ország területén belül viszonylag nagy eltérése,
valamint a megfigyelések kellı minıségbiztosítottsága indokolta.
A számításokhoz elsısorban a Statistica for Windows 5.1, esetenként az SPSS for
Windows 6.1, valamint a Statgraphics 5.1 software csomagokat alkalmaztuk. Több vizsgálat
adatkezelése C program megírását és futtatását tette szükségessé.
7
III. EREDMÉNYEK
1. A modell vezérparaméterének az egymást követı száraz ill. csapadékos napokból álló,
egynemő szakaszok sorozatát választottuk. Egy-egy ilyen szakaszt az állapot típusa, kezdı
napja (éven belüli elhelyezkedése) és hossza (tartama) jellemez. Az egymást követı
szakaszok hosszára vonatkozóan igazoltuk, hogy azok függetlenek tekinthetık mind az
ellentétes típusú (elsı rendő), mind a megelızı azonos típusú (másodrendő) szériák
hosszától.
2. A száraz ill. nedves idıszakok hosszának modellezése érdekében, az év minden hónapjára
nézve eloszlásokat illesztettünk a szériákból számított tartamgyakoriságokra.
E számítások szerint a keverék eloszlások pontosabb eredményeket biztosítanak, mint a
klasszikus geometriai eloszlás. Két geometriai eloszlás összege csak a csapadékmentes
szakaszok esetén javítja az illeszkedést, ugyanakkor a geometriai és Poisson eloszlás
keveréke mind a száraz, mind a csapadékos tartamokra minden hónapban egyaránt magas
megbízhatósági szinten illeszkedik a Magyarországon éghajlatát jellemzı, viszonylag
rövid csapadékos és a jóval hosszabb száraz szakaszokra.
3. A meteorológiai elemek idısoraiból a sokévi átlagok és szórások éves menetét a Fourier
felbontás elsı három komponensének felhasználásával eltávolítottuk. A fennmaradó,
immár zérus várható értékő és 1 szórású, reziduum sorokban az egynemő szakaszokon
belüli, további összefüggéseket kerestünk. Megállapítottuk, hogy a tartamok hossza
szerint nem szükséges megkülönböztetés, ellenben lényeges eltérés adódott a vizsgált
összes elem havonkénti átlagai között aszerint, hogy a szakasz hányadik napjáról van szó.
A csapadékos idıszakon belül az elsı napokon az átlagértékek jellemzı eltérést mutatnak
az idıszak többi napjához viszonyítva. A száraz tartamokon belül ugyanez a helyzet, sıt
itt további csoportosítást is kell tenni. Nevezetesen, a második és a harmadik nap együtt
kezelhetı, míg az elsı és a legalább negyedik nap feltételes átlagai külön átlagolandók.
Ezeket a meteorológiai szempontból is értelmezhetı tulajdonságokat az éves menetnél
leírt standardizálást kiegészítı, újabb transzformáció formájában építettük be a modellbe.
4. A változók lineáris összefüggése alapján, megkíséreltük a kilenc elem csoportosítását ez
által bizonyos további vizsgálatok számát szándékoztunk redukálni (5. és a 6. tézisnél).
Ennek érdekében faktoranalízist végeztünk száraz és a csapadékos napokra külön-külön.
8
Az eredmények szerint három faktorcsoport különíthetı el, az elsıbe tartozik a maximum,
minimum- és középhımérséklet, a másodikba a relatív nedvesség, a felhızet és a
napfénytartam, míg a harmadikba a szélsebesség és a légnyomás. A csapadék mennyisége
- a fenti három közül - havonta más-más csoportba sorolható.
5. A változók normalitását számos teszt és folyamat feltételezi, ezért a perem eloszlásokat
elemenként és együttesen a Kolmogorv – Szmirnov valamint a Mardia-féle együtthatókon
alapuló próbák segítségével vizsgáltuk. Egyváltozós esetben a
3. tézispontban ismertetett transzformációkat követıen a maximum, minimum és átlag
hımérséklet, a relatív nedvesség és a légnyomás az év folyamán normális eloszlásúnak
adódott száraz ill. csapadékos esetben egyaránt. Az elızı tézispontban felsorolt
faktorcsoportokból találtunk egy-egy elemet (maximum hımérséklet, relatív nedvesség és
légnyomás), amelyek perem és együttes eloszlása egyaránt normálisnak adódott.
6. A 3. tézispontban ismertetett módon transzformált meteorológiai elemek egymást követı
értékei közötti korrelációkat száraz és csapadékos szériákon belül, valamint a
típusváltásokra havonta külön u próbával teszteltük. Az elızı tézispontban felsorolt
három elemre igazoltuk, hogy az egy napos eltolással kapott idısorok korrelációja
szempontjából nincs jelentısége annak, hogy az egymást követı napok közül melyik
párost tekintjük. Más szóval, az adott száraz ill. nedves tartamon belül a vizsgált elemek
sorozata, mint sztochasztikus folyamat, gyengén stacionáriusnak tekinthetı.
7. További tesztekkel megmutattuk, hogy mind a 9 standardizált változó Johnson eloszlásba
sorolható, amely magába foglalja a normális, lognormális, korlátos és korlátlan nem
normális eloszlásokat. A többváltozós Johnson eloszlás módosításának felhasználásával
standard normális eloszlású véletlen számokból adott statisztikai jellemzıkkel rendelkezı,
szimulált idısorokat állítottunk elı. A feltételes autoregresszív folyamatot kibıvítettük az
összes elemre oly módon, hogy a véletlen tagot többváltozós Johnson eloszlással állítottuk
elı. Ezek az összefüggések biztosítják a szimulált sorok ferdeség, lapultság, korreláció és
autokorrelációis értékeinek reprodukálhatóságát. Az átlagokat és a szórásokat a 3.
tézispontban felsorolt transzformációk inverz mőveletei, a gyakoriságokat csonkítással
állítottuk be a megfelelı értékekre. A mintaszámítások szerint a modell megırzi a kívánt
statisztikai tulajdonságokat a mesterséges sorokban.
9
IV. A HASZNOSÍTÁS LEHETİSÉGEI
A kifejlesztett modell leggyakoribb felhasználási területe a klímaváltozási szcenáriók
regionális hatásának kockázati analízise. Ennek során a hatásvizsgálati számítások idıjárási
bemenı adatait az IGM szolgáltatja, amelynek paramétereit a jelenkori értékekre beállítva
elıáll a kontrollfutás. Ezt követıen a globális klímamodellek eredmény-mezıinek térbeli és
idıbeli “leskálázását” végzı valamilyen mőveletsor nyomán az IGM paraméterei megfelelı
beállításával lehetıvé válik, hogy adott területen, pl. egy adott szántóföldi növény
produktivitásában bekövetkezı változásokat megbecsüljük.
Magyarországon egyetemeken és kutató intézetekben nagy számban készítenek ill.
alkalmaznak hatásvizsgálati modell-számításokat, amelyek éghajlati adatokkal történı ellátása
jelenleg csak részben megoldott. Az alkalmazott eljárások ugyanis általában a szükségesnél
kevesebb - legfeljebb három – idıjárási elem szimulációját teszik lehetıvé.
A dolgozatunk tárgyát képezı modell elsısorban ezt a hiányosságot hivatott pótolni, ami a
modell általános jellege, azaz a kevés megszorító feltétele miatt –legalább az országon belül-
minden bizonnyal változatlan szerkezetben, a helyi adottságokhoz igazító paraméter
beállítással megoldható. A száraz/csapadékos szériákra vonatkozó eredmény önmagában is
fontos annak meteorológiai jelentısége miatt.
A kifejlesztett idıjárás-generátor további hasznosítása más alkalmazott klimatológiai
feladatokban is lehetséges. Ennek azonban a szimulált számadatokhoz, még inkább magához
a generátor számítógépes realizációjához való hozzáférés is egyik alapfeltétele. A dolgozat
leírásban arra törekedtünk, hogy a képletek alapján könnyen algoritmizálható legyen az
eljárás, így jól felhasználható legyen programcsomag készítésére.
********
A disszertáció 80 számozott oldalt, ezen belül 14 ábrát, 14 táblázatot valamint 86 irodalmi
hivatkozást tartalmaz.
10
V. ÉRTEKEZÉS TÉMAKÖRÉHEZ KAPCSOLÓDÓ PUBLIKÁCIÓK
Bálint G., Dobi I . and Mika J., 1996: Runoff simulation assuming global warming scenarios.
In: Proc.18th Conf. Danube Countries, 25-30 August, 1996, Graz, Austria, 131-136.
Bálint G., Gauzer B., Dobi I. and Mika J., 1995: The use of global warming scenarios for low
flow simulation. In: Drought in the Carpathians’ Region (ed. Vermes L.), 3-5 May, 1995,
Göd, Hungary, 65-77.
Dobi I., 1987: Csapadék idısorok analízise Markov-láncok felhasználásával. Szakdolgozat,
Témavezetı: Dr. Matyasovszky István)
Dobi-Wantuch I., Mika J. and Szeidl L., 2000: Modelling wet and dry spells with mixture
distributions. Meteorology and Atmos. Phys.,Vol. 73, 245-256.
Dobi I., Mika J. and Szeidl L., 1996: On modelling daily rainfall occurrences. In: Proc. 17th
Intern. Conf. on Carpathian Meteorology, 14-18 Oct. 1996, Visegrád, Hungary,
46-51.
Dobi I., Mika J., Bálint G. and Gauzer B., 1995: Runoff simulation assuming global warming
scenarios. In Proc. 2nd. Intern. Conf. on "Hydrological Processes in the Catchment" , (ed.
Wieznik, B.), 23-26 April, 1995, Cracow , Poland, 391-399.
Dobi I., Mika J., Pröhle T. and Szeidl L., 1996: On improvement of weather generators: Non-
sinusoidal features in the annual cycles of daily means and inter-annual variability.
In: Regional WS on Climate Variability, Climate Change Vulnerability and Adaptation ,
(ed. I. Nemesova, R. Huth), 11-16 Sept., 1995, Prague, Czech Rep., 315-320.
Kovács-Láng E., Kröel-Dulay Gy., Kertész M., Fekete G., Mika J., Dobi-Wantuch I., Rédei
T., Rajkai K., Hahn I. and Bartha S., 2000: Changes in the composition of sand grasslands
along a climatic gradient in Hungary and implications for climate change. Phytocoenologia
30, 385-407.
Matyasovszky I., Dobi I., 1989: Csapadék idısorok vizsgálatának módszerei Markov láncok
alkalmazásával. (Methods for analysis of time series of precipitation data using Markov
chains) Idıjárás, 93 (5), 276-288.
11
Mika J. és Wantuchné Dobi I., 1998: Kis globális változások térbeli és idıbeli leskálázása
hatásvizsgálati célokra. In: Az éghajlatváltozás következményei (szerk. Dunkel Z.)
Meteorológiai Tudományos Napok, 1997 nov. 20-21, Budapest, 105-116.
Nagy J., Huzsvai J., Mika J., Dobi I., Fodor N. and Kovács G.J., 1999: A method to link
general circulation model to weather generator and crop models for long term decisions.
MODSS'99 Conference, Brisbane, Australia, 1-6 August, 1999.
Wantuchné Dobi I., 1997: Analysis and simulation of daily meteorological time series,
In Statistics at Universities: Impact for Society, 22- 23 May, 1997, Budapest, Hungary,
115-120.
Wantuchné Dobi I., 1997: Napi meteorológiai adatsorok sztochasztikus modellezése
idıjárásgenerátorokkal, Egyetemi Meteorológiai Füzetek 9, 26-31.
Wantuchné Dobi I., 1998: Napi meteorológiai idısorok vizsgálata és sztochasztikus
modellezésének lehetıségei. II Erd ı és klíma konferencia. 1997 jún. 4-6, Sopron, 57-61.
12
Bevezetés
A valószínőségszámítás és a matematikai statisztika a klímakutatásban alapvetı
eszköz. Az éghajlat tanulmányozásánál a nagyszámú megfigyelési adatból álló idısorok
statisztikai elemzésére és modellezésére alkalmazzák. Az éghajlat mőködését vezérlı fizikai
folyamatokat általában dinamikai módszerekkel modellezik, tapasztalatok szerint azonban
ezek az eljárások a klímára jellemzı változékonyságot (Storch és Zwiers, 1998) nem
mindenben tudják “utánozni”. Például a külsı éghajlati kényszerek okozta hosszabb-rövidebb
ingadozásokat (változásokat) csak akkor, ha ezen kényszerek idıbeli alakulása ismert.
A matematikai módszertan és a számítógépes megvalósítás fejlıdése mellett a sztochasztikus
modellek elterjedésében szerepet játszik, hogy a hidro-termodinamika determinisztikus
egyenletrendszernek egyre kisebb tér- és idıbeli léptékben lehetséges megoldása, továbbá az
új környezeti problémák, és adat-rendszerek megjelenése korábban nem ismert feladatokat
fogalmaz meg az alkalmazott matematika számára.
Hasselmann ˙(1976) javasolta elsıként, hogy ún. Sztochasztikus Klíma Modellt (SCM)
alkalmazzanak a klímakutatásra. Elmélete szerint a rövid ideig tartó fluktuációk, zajok
alakítják ki az éghajlati rendszer alacsony frekvenciás változékonyságát, vagyis e fluktuációk
integrált értékei hatással vannak a lassú változásokra. Ebbıl adódóan az SCM-ek kezdetben
fontos szerepet játszottak a klíma belsı összefüggéseinek, természetes ingadozásának ill. az
antropogén levegıszennyezés következtében valószínősíthetı megváltozásának
megértésében. Megfelelı paraméter-választással ugyanis képesek voltak visszaadni a földi
éghajlat ingadozásainak a paleoklíma rekonstrukciókból többé-kevésbé ismert idıbeli
spektrumát.
Az SCM modellekkel rokon a dolgozat témáját képezı, a jelen ill. a feltételezett
jövıbeli klímára jellemzı napi, lokális meteorológiai adatok elıállítására alkalmas
többváltozós Sztochasztikus Idıjárás Generátor Modellek (IGM). Jelen dolgozatban a feladat
egy adott pont napi idıjárásának a kezdeti-értékektıl független, vagyis a determinisztikus
kezelhetıség maximum 2-3 hetes idıtávján túli szimulációja. Ahhoz, hogy az ilyen típusú
modelleket el tudjuk helyezni a globális klímaváltozás kapcsolatos kutatások között,
szükséges a témakör rövid áttekintésére. Azonban, hogy ne törjük meg a jelen bevezetı
fonalát és belsı arányait ezt az 1.3 pontban, az IGM-ek szakirodalmi elızményei után tesszük
meg.
13
Magyarországon az elmúlt években fokozódott az igény a klímaváltozás
mezıgazdasági, hidrológiai és egyéb ökológiai következményeinek vizsgálata iránt (Mika,
2000; Harnos, 1998; Kovács és Dunkel, 1998; Kröel-Dulay és mtsai, 1998; Kertész és mtsai,
1998; Gilyénné és Nováky, 1998). Az ELTE Meteorológiai Tanszék a csapadék
makrocirkulációs típusokra épülı szemi-empirikus leskálázási modelljének fejlesztésében vett
részt (Matyasovszky és Bogárdi, 1994, 1996). A módszert többek között a Balaton
vízgyőjtıjére vonatkozó tanulmányokban alkalmazták.
Mika (1991) a térbeli leskálázáshoz a múltban végbement hazai és a földgömbi
léptékő változások közötti összefüggéseket feltáró regressziós eljárást dolgozott ki, amely
szeletelés néven terjedt el a hazai és a nemzetközi szakirodalomban. A módszer sokoldalú
felhasználását a disszertáció (Mika, 2000) táblázatai foglalják össze.
Hantel és Ács (1995) az ellentétes irány, a kis léptékekben megfigyelt viselkedés
általánosítása érdekében dolgozott ki eljárást, amely kis idı és tér skálán a felszíni hı és
csapadék fluxus modellezésére alkalmaz determinisztikus fizikai összefüggéseket.
Feltételezése szerint a lokálisról a globális szintre történı “felskálázás” lehetıvé teszi az
eltérı idı és térskálák közötti közvetlen kapcsolat megteremtését.
Dolgozatunk szempontjából alapvetı fontosságú az idıbeli leskálázást végzı
sztochasztikus idıjárás generátor modell, melyet Racskó, Szeidl és Semenov 1991-ben
publikáltak. A modell a csapadékos szériákon alapul, a paraméterek megfelelı módosításával
alkalmas az átlaghımérséklet, csapadék és napfénytartam megváltozott klímára jellemzı napi
idısorainak szimulációjára.
Disszertációnkban olyan napi sztochasztikus idıjárás generátor modellek tárgyalására
szorítkozunk, melyek vezérparamétere a csapadékállapot. A választás egyik indoka az, hogy a
csapadék elıfordulása ill. hiánya esetén a többi változónál szignifikáns eltérés tapasztalható.
Másfelıl a csapadék becslése a fizikai és numerikus modellekben nem kielégítı. Az irodalom
tapasztalatai alapján azonban az ilyen típusú modell lehetıséget nyújt a kiemelt szempontként
kezelt aszályos periódusok megfelelı elıállítására (Racskó és mtsai, 1991). További
meghatározó szempont, hogy a rendelkezésünkre álló adatbázis és számítástechnikai
lehetıségek elegendıek a számítások elvégzéséhez. Tekintettel a hatásvizsgálatok
adatigényére (l. 2. fejezet 1. táblázat), valamint arra, hogy az IGM több meteorológiai adat
14
generálására alkalmas, mint a többi eljárás, valamint figyelembe véve az irodalmi
áttekintésben (1. 1. fejezet) felvázolt tapasztalatokat, mindezek arra a következtetésre
vezettek, hogy célszerő a jelen klíma reprodukálására alkalmas sztochasztikus idıjárás
generátor modell továbbfejlesztése mellett dönteni. Mika (1998, 2000) táblázatban foglalta
össze a napi sztochasztikus idıjárás generátorok különféle hazai hatásvizsgálatokban történı
alkalmazásait. Az ilyen típusú modelleket fıként a növényfejlıdési és a hidrológiai
modellekben alkalmazzák, de felhasználhatók a klíma természetes változékonyságának
elemzésére, az extrém értékek vizsgálatára valamint az idısorban lévı adathiány esetén
pótlásra is (Guenni és mtsai, 1990 a,b)
A következı fejezetben áttekintjük a csapadék állapoton alapuló napi sztochasztikus
idıjárás generátor modellek típusait, a különféle modellek elınyeit és korlátjait. Ezt követıen
sorra vesszük a Racskó és mtsai (1991) modellhez képest történı változtatásokat.
A meteorológiai elemek számát a hatástanulmányok adat igényeibıl kiindulva maximálisan
kilenc elemre kívántuk bıvíteni. A csapadék tartamok modellezése különösen nagy súllyal
bír, ezért külön fejezetben foglalkozunk vele (3. fejezet). Az idısorok alkalmasan választott
transzformációt és elemzést a 4. fejezet tartalmazza. Sorra vesszük azokat az irodalomban
elfogadott eljárásokat is melyek esetünkben nem vezettek kielégítı eredményre az 5.
fejezetben. A többdimenziós modellt a 6. fejezetben mutatjuk be, az ezt követı fejezetben a
modell jóságát teszteljük.
15
1. Szakirodalmi elızmények
Az idıjárás generátorok tulajdonképpen az idıjárási változók megfigyelt sorainak
statisztikai modelljei, melyeket adott helyre vonatkozó napi idıjárási adatokat elıállító
speciális véletlen szám generátoroknak is tekinthetünk. A csapadék állapotán alapuló napi
SWG modelleknek alapvetıen két típusa van (Storch és mtsai, 2000) a különbözı rendő
Markov láncokat alkalmazó valamint a tartam-hossz összefüggéseken alapuló
megközelítések. A kétállapotú elsırendő Markov lánc alkalmazását a száraz és csapadékos
napok sorozatainak szimulációjára Gabriel és Neumann (1962) ajánlotta elsıként. A véletlen
folyamatot oly módon állították elı, hogy adott nap csapadék állapotára csak az elızı nap van
hatással, a csapadékos napokon a napi összeget pedig valószínőség eloszlással képezték.
A többi elem statisztikái a nap száraz ill. csapadékos állapotának függvényében szimulálták.
A szerzık feltételezték, hogy a paraméterek évszakonként állandók.
1. 1. Sztochasztikus idıjárás generátor modellek
Ezen koncepció alapján Jones és mtsai (1970) szimulációs eljárást dolgoztak ki
gabonanövekedési modellek számára, amelyben a napi csapadék állapotát vették figyelembe.
A mennyiségét csonkított gamma eloszlással állították elı, a párolgást és a hımérsékleteket
pedig negyedrendő polinomokkal közelítették. A számítások tapasztalatai alapján a
hımérsékletek elıállítására normális eloszlást ajánlottak. Bruhn és mtsai (1980) a paradicsom
tanulmányozása céljából továbbfejlesztették a modellt. A Markov lánc optimális rendjét az
Akaike féle információs kritériummal ellenırizték New York és Geneva 10 év hosszúságú
adatain. A szerzık feltételezték, hogy a hımérsékletek eloszlása szignifikánsan különbözik az
elızı napi csapadékállapottól függıen, továbbá a maximumot az elızı napi, a minimumot az
aznapi maximum hımérséklet befolyásolja. Kolmogorov-Szmirnov teszttel igazolta hogy az
aktuális nap minimum és maximum hımérséklete valamint az elızı napi maximum a
háromváltozós normális eloszlással közelíthetı. A sugárzásról és a relatív nedvességrıl
szintén normális eloszlást feltételeztek. Ez utóbbi két elemre a ferdeség tesztelés során
jelentıs eltérés adódott, az éves keresztkorrelációkban is elıfordult szignifikáns különbség.
A témakörben a legtöbbet hivatkozott cikk Richardson korai publikációja (1981).
A csapadék mennyiségének szimulációjához a számítás egyszerősége miatt exponenciális
eloszlást használt, azzal a megjegyzéssel, hogy a kétparaméteres gamma illetve a
16
háromparaméteres kevert exponenciális eloszlást valószínőleg jobb illeszkedést biztosít. A
paraméterek számának csökkentése érdekében maximum-, minimum-hımérséklet és a
sugárzás feltételes átlagainak és szórásainak idısoraiból maximum likelihood módszerrel 14
napos intervallumokra becsült, majd Fourier soruk elsı két harmonikusának figyelembe
vételével eltávolította az éves menetet, ezt követıen pedig standardizálta a változók
reziduumait. Mindhárom elem feltételes soraira a Matalas (1967) által ajánlott elsırendő
lineáris autoregresszív folyamatot alkalmazta. Néhány amerikai város (Temple, Atlanta és
Spokane) 20 éves csapadék adata valamint a többi változóra 5 éves adatsor képezte a tanuló
adatbázist. A csapadékküszöb 0,01 inch (0,254 mm) volt.
Wilks a Richardson féle modell klímaváltozásra történı alkalmazhatóságát illusztrálta
1992-ben publikált cikkében. Mindössze annyi módosítást hajtott végre, hogy a napi
csapadékösszeg elıállításához gamma eloszlást használt. A valódi és a megnövekedett CO2
szintre vonatkozó havi GCM outputok felhasználásával eljárást dolgozott ki a klímaváltozást
tükrözı átlagok és szórások kiszámítására. Mearns és mtsai (1997) szerint ez a módszer a
hımérséklet autokorrelációját és a csapadék éven belüli változékonyságát alulbecsli, ezzel
együtt a CERES – búza modell érzékenységi vizsgálatára számára jól használhatónak ítélte.
Tekintettel arra, hogy a modell könnyen algoritmizálható számos programcsomag
készült. Az eredeti cikk alapján íródott a WGEN (Richardson, 1981, Richardson és Wright,
1984) és több módosított, tovább fejlesztett változat, melyekrıl az alábbiakban adunk
áttekintést. A gabonanövekedési és ökológiai modellek különféle formátumban igénylik az
adatokat, a WeatherMan nevő programcsomag (Pickering és mtsai, 1994) ennek a technikai
problémának a megoldására készült egyesítve az említett és a SIMMETEO (Geng és mtsai,
1986) nevő programokat, és kibıvítve az elemek sorát a fotoszintetikusan aktív sugárzással.
Kisebb módosításokkal készült a WXGEN (Sharpley és Williams, 1990) speciálisan az EPIC
(Erosion & Productivity Impact Calculator) számára. Ezzel a modellel elıállított sorokat
tesztelte Wallis (1993) öt texasi állomásra, szerinte az extrém hımérsékletek, valamint a
különféle tartamú csapadékos ill. a hosszú száraz idıszakok gyakorisága a valóditól eltérı,
ami pedig a környezeti károk becslésénél igen jelentıs hibaforrás.
Az Euro Weather Generator nemzetközi program részeként alkalmazták a WTHGEN
programcsomagot, amely gamma eloszlással elıállított szélsebesség és a minimum
hımérsékletekbıl számított telítési gıznyomás értékekkel bıvült (Voet és mtsai, 1996).
17
A ClimGen (Stöckle és mtsai, 1998) a csapadékmennyiséghez és a szélsebességhez Weibull
eloszlást illeszt, Fourier sor helyett kvadratikus spline-t használ és a páranyomás hiányt
számol. A szél és a harmatpont elıállításával bıvített változat a GEM (Hanson és Johnson,
1998). Parlange és Katz (2000) ez utóbbit és a WXGEN verziókat alkalmazta módosításokkal.
Lényegében a nem-normális eloszlású változókat, nevezetesen a “nyers” szél és a harmatpont
adatokat transzformálták, továbbá a program felügyeli, hogy a szimulált maximum és
minimum hımérséklet valóban rendezett mintát alkosson. Megállapították, hogy a
hımérséklet és csapadék szórásnégyzetét erısen alulbecsüli az eljárás. Továbbá hátrány, hogy
más éghajlatú helyeken eltérı típusú transzformáció szükséges.
Egymástól függetlenül fejlesztették a hidrológiai alkalmazások igényeihez igazodó
USECLIMATE (Hanson, 1993), a CLIGEN (Nicks és Gander, 1993). Lényeges különbség,
hogy az elıbbinél Fourier illesztést használtak, a csapadék állapotok sorozatinak
szimulációjához kevert exponenciális eloszlást alkalmaztak, valamint figyelembe vették a
változók közötti keresztkorrelációkat is. Ebbıl adódóan egyértelmően jobb eredményeket
adott a havi és évi tesztek alapján (Johnson és mtsai, 1996), mint a diszkrét havi
parametrizációt, ferde normális eloszlást valamint kizárólag csapadék állapottól való függést
figyelembe vevı CLIGEN. Mindkettınél elıfordult, hogy a napi minimum meghaladta a
minimumot (Semenov és mtsai, 1998; Hayhoe, 2000), a hımérsékletek és a sugárzás
szórásánál szintén megemlítik a szerzık az alulbecslést.
Alapvetıen a Wilks féle (1992) modellen alapszik a Met&Roll (Dubrovsky, 1995),
annyi a különbséggel, hogy az éves menet simítására robosztus lokálisan súlyozott regressziót
alkalmaz, és nem használ empirikus paraméter formulákat. Dubrovsky (1997) 17 csehországi
állomás 30 éves adatsorán végzett összehasonlító vizsgálatai képezték a további fejlesztések
kiindulópontját. E vizsgálatok tapasztalatai a következık:
1. A sugárzás, maximum és minimum hımérsékletek közötti kereszt- és autokorreláció éven
belül változását figyelembe kell venni.
2. A hosszú száraz idıszakok, eloszlását alulbecsüli a kétállapotú elsırendő Markov lánc.
3. A sugárzás havi átlagának és a csapadék havi összegének változékonysága egész évben
alulbecsült. Az extrém hımérsékletek havi átlagának változékonysága nyáron felül-, télen
alulbecsült.
18
A további fejlesztések fıként ez utóbbi pontatlanságok elkerülését célozták (Dubrovsky
mtsai 2000):
1. A kereszt és autokorrelációk éves menete bekerült a programba,
2. Harmadrendő Markov láncot alkalmaztak elsırendő helyett,
3. Havi generátorral reprodukálták a hónapon belüli változékonyságot.
A fejlesztés minden fázisában tesztelték az alkalmazásokra gyakorolt következményeket a
CERES-búza valamint a SAC-SMA lefolyás modelleken. Tapasztalataik szerint a
meteorológiai adatok szimulációjának javulása a hatásvizsgálatok eredményét kevéssé
befolyásolta.
Racskó és társai (1991) magyarországi állomások, Kompolt és Iregszemcse 1951-1985
csapadék, középhımérséklet és napfénytartam adataira végzett vizsgálatokat. Az extrém
hosszúságú száraz idıszakok tartamának alulbecslése motiválta a szerzıket a másik típus, a
száraz nedves idıszakok hosszát is figyelembe vevı modell megalkotására. Ezzel
összefüggésben vizsgálták az elemek tartam-hossztól, (száraz v. csapadékos) típusától ill.
tartamon belüli elhelyezkedésétıl való függését. A tartamon belül az elsı nap és a többi
között feltételes eloszlásoknál tapasztalt szignifikáns eltérés kivételével a legtöbb ilyen
kapcsolatot elhanyagolhatónak találták.
A száraz illetve csapadékos szériákat függetlennek tekintve az adott kezdıpontú
tetszıleges hosszúságú csapadékos szakaszok hosszát geometriai, a szárazakét pedig a
hossztól függıen kevert geometriai eloszlásokkal állították elı, eltérı paramétereket választva
a rövid (legfeljebb 7 napos) ill. hosszú csapadékmentes szakaszokra. A paramétereket az
eltérı hosszúságú tartamok gyakoriságaiból becsülték és minden elemnél Fourier simítást
alkalmaztak az éves menet eltávolításához
A csapadék összeg kevert exponenciális eloszlásúnak adódott. A 4 mm-nél kisebb
csapadékú napokat egyenletes eloszlással, a 20 mm meghaladó mennyiségeket – tekintettel
arra, hogy a napok száma nem elegendı a megfelelı eloszlás kiválasztásához – az átlaggal
becsülték, a közepes mennyiségő csapadékhoz pedig exponenciális eloszlást illesztettek.
Az átlaghımérséklet sorozatoknál figyelembe vették az említett szérián belüli eltérést, ennek
megfelelıen különbözı paraméterő normális eloszlást alkalmaztak. Télen, csapadékos
napokon a nulla napfénytartam valószínősége igen nagy, ami elrontja az eloszlás normalitását.
Ezért a teljesen borult napok valószínőségeit a mintából számították, a többire pedig normális
19
eloszlást alkalmaztak (Semenov, 1991). A modellhez programcsomag készült, amelyet
LARS_WG (Long Ashton Research Station Weather Generator) néven klímaváltozási
szcenáriók vizsgálatainál elsısorban termésbecslı modellekben alkalmaznak (Semenov és
Borow, 1997, 1999). A LARS_WG és a WGEN produktumainak összehasonlítását ázsiai,
európai és orosz adatokon Semenov és társai (1998) végezték el. Az elıbbinél alkalmazott
flexibilis fél- empirikus eloszlások a különféle klímákon végzett tesztek szerint jobb
illeszkedést tettek lehetıvé, mint a WGEN-ben felhasznált standard eloszlások. Mindkét
generátornál a napi és havi változékonyság egyaránt pontatlannak adódott.
A két modellre vonatkozó, a szakirodalomban elérhetı összes kritikai felvetést Hayhoe
(2000) foglalta össze. Következtetése, hogy a Racskó és mtsai (1991) által kidolgozott modell
fél-empirikus eloszlásokat használ fel, emiatt általános tapasztalat, hogy jobb illeszkedést
biztosít, mint a WGEN. Ezzel együtt azonban több paraméter becslését igényli, emiatt a
szerzı a WXGEN korábban idézett pontatlanságainak korrigálása mellett döntött. Az alábbi
módosításokat hajtotta végre:
1. gyakoriságokat kéthavi adatokból számította, növelve ez által a becslések
megbízhatóságát,
2. elsırendő Markov lánc helyett másodrendőt használt,
3. spline interpolációt alkalmaz Fourier transzformáció helyett,
4. csapadék-mennyiség logaritmusával, szimulációnál exponenciális transzformációval
számolt,
5. a maximum és minimum hımérsékletek rendezettségéthez külön feltételt vett figyelembe,
6. havi átlagokat és szórásokkal további korrekciót hajtott végre,
7. az éven belül kéthavonta különbözı korrelációikat alkalmazott.
Kanadai állomások 20 év maximum, minimum hımérséklet, csapadék és sugárzás valamint
30 év mesterséges sorainak összehasonlítása a szélsı értékek, a kis valószínőségő események
és a fagymentes napok számának tesztelésére is kiterjedt. Az eredmények egyértelmően
javulást bizonyítanak minden tesztnél.
Hayhoe (2000) véleménye szerint megfigyelt és szimulált adatok közötti eltérés egy
része a folyamatok véletlenszerő jellegébıl adódik, ez a hiba elkerülhetetlen még az elvileg
tökéletes modellnél is. Az eltérés másik része a modellválasztás és az ezzel járó
egyszerősítések következménye. Az illeszkedés jóságának elvi korlátot szab tehát a rendszer
természetes belsı változékonysága, a statisztikai szempontból rendszerint nem elegendıen
20
nagy véges mintaszám, a becslési és interpolációs eljárások pontossága. További hibaforrás
hogy az elemek eloszlása általában ferdébb a normálisnál. Ez utóbbi probléma kiküszöbölhetı
a Johnson által kidolgozott ún. normál score transzformációval. Az idıjárás generátor további
fejlesztésénél a megfelelı illeszkedésen túl tehát arra kell törekedni, hogy a fizikai
kényszereket a lehetı legnagyobb mértékben vegye figyelembe a modell. Az SWG a
légkörben lezajló fizikai folyamatokat csak részben tudja visszaadni. Az általunk vizsgált
modell típusnál a vezérparaméter, azaz a csapadék értékei szerinti feltételes eloszlásokkal
számolnak, amely behatárolja a légköri elemek között figyelembe vehetı kölcsönhatásokat.
Mindezek ismeretében felmerül a kérdés, hogy milyen további összefüggéseket lehet
még beépíteni a generátorba?
1. Amennyiben a tartamokon alapuló modellt választjuk, a száraz illetve csapadékos
idıszakon belüli kapcsolatok feltárásával újabb tulajdonságok megırzésére nyílik
lehetıség.
2. Nagyon fontos a tartamok pontos reprodukálása, hiszen ennek a résznek a modellezése
meghatározza a többi elem szimulációját, ezért ezzel a témával külön is foglalkozunk.
3. Szükség van arra, hogy kibıvítsük az elemek körét, figyelembe véve a hatásvizsgálatok
maximális adatigényét és a rendelkezésre álló klíma adatokat.
4. A nem normális eloszlások transzformációja szintén tovább javíthatja az eredményeket.
5. Törekedni kell továbbá arra, hogy lehetıleg minél több kiválasztott meteorológiai elemet
együttesen, többváltozós folyamatként modellezzük, megırizve ezáltal a köztük lévı
kapcsolatokat.
1.2 Csapadék-állapot modellek
A csapadékos és száraz idıszakok hosszának diszkrét modellezésével fıként a
hidrológiai szakirodalom foglalkozik. Mivel a tartam modell meghatározó része a dolgozatnak
ki kell térnünk a témakörnek áttekintésére. Az egymást követı száraz és csapadékos napok
sorozatainak legelterjedtebb modellje az elızı fejezetben említett homogén, kétállapotú,
elsırendő Markov lánc (Gabriel és Neumann, 1962). A számítások viszonylagos
egyszerősége miatt igen elterjedt ez a módszer (Katz, 1974; 1981; Bruhn mtsai, 1980;
Richardson, 1981; Geng és Auburn, 1986; Wilks, 1992; Dubrovsky, 1995). Korábbi
számításaink szerint (Matyasovszky és Dobi, 1986) legfeljebb 10 napos tartamokra az
elsırendő Markov lánc jól illeszkedik.
21
Ismeretes, hogy adott kezdıpontú tetszıleges hosszúságú száraz ill. csapadékos
idıszak bekövetkezésének valószínőségét leíró eloszlás ebben a modellben geometriai, amely
a tapasztalatok szerint a hosszú száraz periódusokat jelentıs mértékben alul-, a rövideket
pedig felülbecsüli (Berger és Goossens, 1983; Foufoula-Georgiou és Lettenmaier, 1987;
Bárdossy, 1993; Lana és Burgueňo 1998). Racskó mtsai (1991) számításai szerint
Magyarországon, Kompolton (1951-85) a 19 napot meghaladó aszályos idıszakok elsırendő
Markov lánccal elıállított valószínősége egy nagyságrenddel alulbecsülte a megfigyelt relatív
gyakorisági értékeket.
A Markov lánc rendjének növelése tőnne a legkézenfekvıbb megoldásnak az említett
hiba kiküszöbölésére. Gates és Tong (1976) véleménye szerint legalább másodrendő Markov
lánc szükséges az említett Gabriel és Neumann (1962) cikkben felhasznált adatsorra. Stern
(1982) nigériai adatokra (Samaru, 48 év) elsı- ill. másodrendő Markov láncot illesztett 20
mm-es csapadékküszöb mellett. Magashegyi adatokra (Sonnblick, Alpok 3100 m, 1901-70)
másodrendő lánccal jó illeszkedést kapott Cehak és Withalm(1980), trópusi területen
(Guatemala, Columbia, Niger) pedig a 9 napnál rövidebb idıszakokra harmad-rendő Markov
láncot találtak megfelelınek (Jones és Thornton, 1993). Mimioku (1984) görögországi
állomásokon (13-20 év) havonta más (0 -tól 3-ad) rendő Markov láncot alkalmazott. A fenti
vizsgálatok azt mutatják, hogy az optimális rend megválasztása erısen függ a megfigyelt
adatsortól. Chin (1977) 100 Egyesült Államokbeli állomás 25 évnyi adatsorán végzett
számításai szerint hely és idıszak, azaz klíma és évszakfüggı. További lényeges szempont a
becsülendı paraméterek száma, ami kétállapotú, k-ad rendő Markov lánc esetén 2k-al
egyenlı. Tapasztalat szerint a rend növelése alapvetıen nem küszöböli ki az elsırendő
Markov láncnál említett illeszkedési hibákat, ugyanakkor a rendszámmal együtt
exponenciálisan növekvı paraméterszám valamint a vizsgált idıszakra vonatkozó relatíve kis
megfigyelésszám miatt a paraméterek becslésének a bizonytalanságát erısen növelik.
Berger és Goossens (1983) belgiumi adatokra (Uccle, 1901-1975) 1-4 rendő Markov
lánccal elıállított száraz és csapadékos tartamgyakoriságokat hasonlította össze geometriai,
logaritmikus, illetve Eggenberger-Pólya eloszlással kapott eredményekkel. A χ2 próbák
szerint a száraz és a rövid csapadékos tartamokra a 4-ed rendő Markov, a hosszú
csapadékosakra pedig az Eggenberger-Pólya eloszlás illeszkedett legjobban. Ez utóbbi a
negatív binomiális eloszlás, amely független geometriai eloszlások konvolúciójaként állítható
elı, elsırendő esetben pedig azonos a geometriai eloszlással.
22
Bárdossy (1993) a csapadék idıbeli és térbeli modelljeit összefoglaló tanulmányában a
diszkrét modellek összehasonlításánál egy németországi (Essen-Steele) állomás adatsorai
alapján (1952-87) arra a következtetésre jutott, hogy Markov felújítási folyamat
feltételezésével, maximum likelihood becsléssel kapott száraz ill. csapadékos sorok
illeszkedése jobb, mint az 1-3 rendő Markov lánccal, illetve a DMA(2), DARMA(1,1)
folyamat alkalmazásával kapott eredmények. Ebben a modellben (Foufoula-Georgiou és
Lettenmaier, 1987) az egymást követı napok helyett tartamokat, nevezetesen a csapadékos
napok között eltelt idıt állítják elı két geometriai eloszlás súlyozott összegével. Az elv
hasonló a Racskó és mtsai cikkben (1991), ahol szintén jó eredménnyel modellezik a száraz
ill. nedves napokból álló sorozatokat eltérı paraméterő geometriai eloszlásokkal. Ezeknek a
referenciáknak az eredményei azt sugallják, hogy a tartamok geometriai eloszlás valamiféle
keverékével történı elıállítása ígéretes megoldás a hosszú periódusok kielégítı reprodukálása
szempontjából.
Ugyanakkor Lana és Burgueňo (1998) spanyolországi vizsgálatai szerint (Catalonia 69
mérıhely, 13-58 év) az extrém hosszúságú (22-50 napot meghaladó) száraz idıszakokra jól
illeszkedik a Poisson eloszlás, amely elvileg akár az elıforduló másod-maximumok
megjelenítésére is alkalmas lehet. Megjegyezzük, hogy a Poisson eloszlás bizonyos feltételek
teljesülése esetén a Poisson folyamatot alkalmazó folytonos csapadék modellek kiindulásául
is szolgál. Mielıtt rátérünk a fent ismertetett tapasztalatok figyelembe vételével megválasztott
csapadék tartam modell leírására, röviden áttekintjük a kitőzıtt feladat alkalmazásához
szükséges klímaváltozással kapcsolatos ismereteket.
1.3 A klímaváltozás leskálázása
Az utóbbi évtizedekben egyértelmő igazolást nyert, hogy növekszik az antropogén
eredető légköri üvegházgázok koncentrációja. A Klímaváltozás Kormányközi Bizottsága
(IPCC – Intergovernmental Panel on Climate Change) rendszeresen jelentéseket készít,
melyek a CO2 növekedésének mértékében a lehetséges és a kívánatos jövıre vonatkozó
globális tendenciákat (szcenáriókat) prognosztizálnak elsısorban a Föld átlaghımérsékletére
vonatkozóan.
23
Bizonyos, hogy a klímaváltozás jövıben valószínősíthetı hatása régiónként, sıt
ökológiai rendszerenként eltérı lesz. Bár a feladat nagyon összetett és vitatott, ennek ellenére
nagyon fontos a globális éghajlati tendenciák regionális (lokális) lebonthatóságának
vizsgálata, a gazdasági, hidrológiai és ökológiai következmények becslése (Bartholy és
Matyasovszky, 1998, Harnos, 1998). A változásra való felkészüléshez szükséges különféle
gazdaságpolitikai stratégiák kidolgozása céljából ún. hatásvizsgálati másnéven impakt
modellek segítségével elemzik a kis térségekre vonatkozó kockázati tényezıket.
Mint ismeretes a globális változások várható mértékét, az Általános Cirkulációs
Modellek ( GCM - General Circulation Models) prognosztizálják. A GCM-ek az éghajlati
rendszer legfontosabb, determinisztikusan leírható fizikai folyamatait veszik figyelembe, ezért
számításigényük rendkívül nagy, az eredmények idıbeli és térbeli felbontását a számítógépek
mindenkori teljesítıképessége határozza meg. A jelenlegi GCM-ek a CO2 növekedése
következtében beálló általános cirkuláció jellemzıit évszakos átlagokban és kb. kontinentális
térskálán megfelelıen tükrözik, azonban a 2-300 km-es rácstávolság miatt szükségszerően
figyelmen kívül hagyják az idıjárást közvetlenül kialakító mezo skálájú folyamatok,
pl. frontok, ciklonok vagy anticiklonok hatását (Semenov és Barrow, 1997). Ez a felbontás
nyilvánvalóan nem elegendı, pl. a gabonanövekedés elemzésénél használatos talaj – növény –
klíma, ill. a lefolyást vizsgáló vízháztartás – klíma ill. más, ehhez hasonló kapcsolatokat
vizsgáló modellek számára. Ezek a vizsgálatok a különféle globális alternatíváknak megfelelı
(rendszerint lokális, napi skálájú) ún. regionális éghajlati forgatókönyveket igényelnek
(Giorgi és Mearns, 1991; Wilks, 1992). Következésképpen szükség van olyan módszerekre,
amelyek segítségével kisebb régiókban is becsülhetık a feltételezett változások.
A GCM-ekbıl származó rácsponti (grid-) adatokat a megfelelı regionális ill. lokális
tér valamint megfelelı idıbeli léptékre “leskálázó” (angolul: down-scaling) eljárásoknak
különféle típusai különböztethetık meg (Dubrovsky, 2000).
1) a direkt, növekményszerő módosítás (Bacsi és Hunkár, 1994),
2) a dinamikai csatolt vagy beágyazott módszerek (Giorgi és Mearns, 1991),
3) a sztochasztikus leskálázó eljárások (Matyasovszky és Bogárdy, 1994,1996; ),
4) az empirikus és félempirikus modellek (Semenov és Borrow, 1997)
5) Idıjárás Generátorok.
A módszerekrıl részletes áttekintést nyújt Giorgi és Mearns (1991), valamint Bartholy és
mtsai (1994, 2001) munkája.
24
Kezdetben népszerő volt a direkt módszer alkalmazása is, amelynél a megváltozott
klímára jellemzı idısorokat a GCM szcenárióknak megfelelıen adott grid cellára vonatkozó
értékek közvetlen felhasználásával módosították. A hımérsékletekre additív, a csapadék és
sugárzás értékekre multiplikatív összefüggéseket alkalmaztak. Az eljárás korlátja
természetesen a modellek pontatlansága, vagyis a felbontás korlátozott voltából, vagyis
számos fontos fizikai folyamat figyelmen kívül maradásából fakadó hiba.
A második megközelítési mód esetében, a GCM eredményeket a rövid távú
elırejelzésben is használatos, finom felbontású mezo-skálájú (LAM - Limited Area Models)
modellekbe alkalmazzák bemenı adatként, ezek nagy számításigényő módszerek.
Elıreláthatólag a csatolt ill. beágyazott modellek idıvel alkalmassá válnak majd a
hatásvizsgálatok céljára, jelenleg azonban még csak a lényegesen kisebb számításigényő
statisztikai módszerekkel kombinált modellekhez hasonló eredményeket képesek elıállítani.
A sztochasztikus leskálázó modellek a nagytérségő cirkuláció és a regionális, lokális
meteorológiai változók közötti statisztikai kapcsolatokon alapulnak (Bartholy és mtsai, 2001).
Elsı lépésként a felszíni és a közép troposzférikus légnyomás eloszlás figyelembe vételével
makrocirkulációs típusokat (CP - Circulation Pattern) hoznak létre, és minden napot
besorolnak egy típusba. A sztochasztikus modell a lokális változó típusok szerinti feltételes
eloszlásait állítja elı. A klímaváltozás hatását a GCM-bıl nyert cirkulációs állapotra
vonatkozó számítással nyerik. Ez az alkalmazás tipikusan a csapadékot és a
középhımérsékletet felhasználó hidrológiai modellekben fordul elı (Bartholy és
Matyasovszky, 2001; Katz, 1982). Semenov és Barow (1997, 1999) szerint túl sokféle
kapcsolat megırzıdését kívánja ez a megközelítés, mivel pl. feltételezi, hogy a GCM-ek
képesek pontosan szimulálni a CP típusok gyakoriságait, továbbá a csapadék és
hımérséklettel való kapcsolat is megmarad. Az említett elemek és az adott hely cirkulációs
típusai közötti kapcsolatok lokális jellege miatt valamely országra kidolgozott módszer másutt
nem használható.
Mindegyik downscaling módszernek vannak elınyei és korlátai közülük a
félempirikus modellek képviselik talán a legjobb kompromisszumot (Bartholy és
Matyasovszky, 1998). Az empirikus és szemi-empirikus modellek közös vonása, hogy
rendszerint felszíni ill. felszín közeli adatokkal dolgoznak, a bemenı adataik a vizsgált
területet lefedı rácspontra esı kevés számú GCM grid outputok, a kimenı adatok pedig
25
lokális léptékőek, ennek következtében a számítások rendszerint PC környezetben
elvégezhetık. Ezen módszereknek is megvan az említett hiányossága miszerint az elemek
között a jelenben feltárt kapcsolatok a jövıben is fennmaradnak (Dubrovsky és mtsai, 2000).
A felsorolt elınyök miatt mégis széles körben elterjedt a félempirikus módszerek
alkalmazása.
A direkt módszernél említettük, hogy nem célszerő a GCM-ek rácsponti értékeit
közvetlenül, vagy azok interpolációjával származtatni. Ehelyett célszerő a durva felontású
megváltozás mezıket valamilyen módon térben leskálázni a hatásvizsgálatokhoz szükséges
léptékre, az idıbeli leskálázáshoz pedig sztochasztikus idıjárás generátort alkalmazni (Mika
és Wantuchné, 1998). Az SWG kiküszöböli a direkt módszer hibáit, azáltal, hogy a modellek
ill. algoritmusok képesek az idıjárási elemek sztochasztikus és dinamikus sajátosságait
egyaránt megırzı idısorok elıállítására. A szimulált sorok statisztikai értelemben
konzisztensek, azaz momentumaiknak, korreláció struktúrájuknak azonosnak kell lennie a
valódi sorokéval valamint az átlagra és varianciára vonatkozó paraméterei egyaránt
változtathatók kell hogy legyenek. Ez utóbbi tulajdonság teszi lehetıvé, hogy a megváltozott
klímára jellemzı adatsorokat állításunk elı, ehhez azonban tudnunk kell, hogy a globális
változások a lokális terülten milyen mértékben módosítják a modell paramétereit. A térbeli
leskálázás problémaköre azonban túlmutat jelen dolgozat keretein.
26
2. A disszertációban felhasznált meteorológiai adatok
Az idıjárás generátorokkal kapcsolatos nemzetközi kutatások összehangolása
érdekében a BAHC (Biospheric Aspects of the Hidrological Cycle) "the Weather Generator
Projet" elnevezéső 4 sz. munkacsoportot hozott létre (IGBP Report, 1993). Felmérésük
alapján készült a hatásvizsgálati modellek meteorológiai adatszükségletét tartalmazó
1. táblázat (Bass, 1993). Néhány a bevezetıben említett magyarországi alkalmazás: GAPI
lefolyás modell (Bálint és mtsai, 1995), CERES gabonanövekedési modell (Bacsi és Hunkár,
1994; Kovács és Dunkel, 1998), ARCHWEAT búza modell (Harnos, 1998;), homoki
gyepekre alkalmazott modell (Kröel-Dulay mtsai, 1998)- jelenlegi meteorológiai adatigényét
aláhúzással jelöljük a táblázatban.
Ökológiai modellek Hidrológiai modellek
Minimális halmaz csapadékösszeg & forma
max & min hımérséklet
globál és nettó sugárzás
vdp
szélsebesség
csapadékösszeg
átlag hımérséklet
globálsugárzás
specifikus nedvesség v. vdp
További halmaz nedves hımérséklet
légnyomás
par
max & min hımérséklet
szélsebesség
légnyomás
relatív nedvesség
napfénytartam
felhızet
rövid és hosszúhullámú
sugárzás
1.táblázat
A klímaváltozás ökológiai és hidrológiai következményeit szimuláló modellek
meteorológiai adatigénye napi idı- és 10 km-es térskálán.
Rövidítések: VDP – vízgız telítési hiány, azaz az adott hımérséklethez tartozó telítési páranyomás és az aktuális páranyomás különbsége ("Vapour Pressure Deficit"); PAR – fotoszintetikusan aktív sugárzás, azaz a globálsugárzásnak a növények által felhasználható hullámhosszak közés esı része ("Photosynthetically Active Radiation")
27
Az állomások kiválasztásánál figyelembe vettük Mika és mtsai (1994) eredményét,
amely szerint 16 magyarországi állomás adatainak faktoranalízise alapján a Palmer-féle
aszályindex (PDSI) Z-komponense - a PDSI havi változásának háromszorosa - az ország
területét két régióra bontja. E régiók centrumainak tekinthetı a melegebb, mediterrán hatás
alatt álló Szeged és az Alpok miatt hővösebb, csapadékosabb Szombathely. Mindkettı ún.
elsırendő WMO állomás, megfigyelési sorozatukból olyan idıszakot választottunk, amelyre
feltételezhetı, hogy az adatsoruk homogén.
Az Országos Meteorológiai Szolgálat rendelkezésünkre bocsátotta Szeged (46o 15' N,
20o 06' E, 82 m) és Szombathely (47o 16' N, 16o 38' E, 224 m) 1951-1995 napi értékeit az
alábbi meteorológiai elemekre:
- csapadékösszeg (mm)
- maximum hımérséklet ( oC),
- átlag hımérséklet (oC),
- minimum hımérséklet (oC),
- napfénytartam (óra),
- felhızet (1-8 okta),
- relatív nedvesség (%),
- szélsebesség (m/s),
- légnyomás (hPa).
A meteorológiai adatok napi három – helyi középidıben 7, 14 és 21 órakor végzett
mérések – átlagolásával készültek. Kivételt képeznek a napi csapadékösszegek, amelyeket a
reggel 7 órás észlelések szolgáltatnak. Ebbıl következik, hogy a hajnalban hullott csapadék az
elızı napi összeget növeli. A 0,1 mm-nél kevesebb csapadék az ún. nyom. A csapadékküszöb
megválasztására vonatkozó elemzéseinket a következı fejezetben részletezzük. A
szökınapokat a számítások egyszerősítése érdekében figyelmen kívül hagytuk.
28
3. Száraz és csapadékos tartamok elemzése, modellezése
A továbbiakban a napi csapadékösszegek sorozatait diszkrét idejő sztochasztikus
folyamatnak tekintjük és {Rt}-vel jelöljük, ahol t = 1,2,...365,...,N⋅365 a megfigyelt nap
sorszáma a teljes idıszakban, N = 45 a megfigyelt évek száma. Megadott K küszöbértéktıl
függıen Rt < K esetén a napot száraznak (d), különben pedig csapadékosnak, ill. rövidebben
nedvesnek (w) nevezzük .
A szakirodalomban eltérı csapadékküszöb értékeket alkalmaznak. Erre vonatkozó
tapasztalatainkat valamint a továbbiakban ismertetésre kerülı saját vizsgálatainkat publikáltuk
[Dobi és mtsai, 1996, 2000; Wantuchné 1997, 1998]. A küszöb-választás három gyakorlati
kritérium egyidejő teljesülése miatt végül a csapadék megfigyelés mennyiségi küszöbét is
jelentı 0,1 mm-t választottuk. E határmennyiség ugyanis ugyanolyan jól szétválasztja a többi
meteorológiai elemet, mint az alternatívaként végigszámolt 0,3 mm ill. 1,0 mm (napi átlag).
Ugyanakkor a csapadékos napoknak a magyarországi nagytérségő cirkulációt reprezentáló
Péczely - típusok (Péczely, 1957) közötti, feltételes gyakoriságai alig különböznek a három
küszöbérték esetén. A fı döntési szempont tehát végül az volt, hogy a legalacsonyabb érték
adja a leginkább szimmetrikus gyakorisági eloszlást a (kisebbségben lévı) csapadékos és a
(többséget alkotó) száraz napok között.
A választott 0,1 mm küszöb szerint az {Rt} adatsort kétállapotú d és w jelekbıl álló
jelsorozattá redukáltuk. Ezután a jelen szakaszban a napok sorozatai helyett elıállítottuk a
csapadékost követı, ill. azt megelızı, száraz napok egymásutánjaiból képezett idıszakokat,
az ún. száraz napokból álló szériákat, valamint analóg módon a csapadékos szériákat (1. ábra).
Jelölje Zn = (tn, Xn),n = 0, 1, 2,..., az {Rt} folyamatból származó tartam folyamatot, ahol
1 ≤ tn ≤ 365 jelenti azt, hogy az egymást követı szériák közül az n-edik sorszámú
kezdıpontja az év hányadik napjára esik, míg Xn írja le a széria hosszát és annak száraz vagy
nedves állapotát. Ekkor a Zn, n=0,1,2,... folyamat lehetséges értékeinek halmaza (állapottere):
Z= {1,2,...,365}×X , ahol a különbözı hosszúságú száraz ill. nedves szériák lehetséges
halmazát jelölje D = {di, 1≤ i≤P}, ill. W = {wj , 1 ≤ j ≤ M}. Itt P ill. M jelöli a reálisan
elıfordulható száraz ill. nedves szériák hosszának maximális értékeit és legyen X = {D ∪ W}.
29
1. ábra
A száraz (D) / nedves (W) szériák értelmezése.
3.1 Függetlenség vizsgálat
A modellezés számára alapvetı kérdés, hogy amennyiben egyedi napok helyett az ily
módon definiált szériákat vizsgáljuk – melyek akár több ciklon, anticiklon átvonulást is
lefedhetnek – milyen függıségi kapcsolatokat találhatunk e szakaszok hossza között?
Hasonlóan az egymást követı napokra elvégzett rend vizsgálatokhoz esetünkben elıször az
egymást követı, ellentétes jellegő szakaszok (pl. szárazat követı csapadékos ill. csapadékosat
követı száraz, azaz dw és wd, ahol d ∈ D és w ∈ W) között elsırendőnek nevezhetı
kapcsolatot elemeztük. Másrészt azt sem tartottuk kizártnak, hogy létezhet másodrendőnek
nevezhetı függés az azonos jellegő idıszakok, pl. egy néhány napos csapadékos tartamot
megelızı és azt követı száraz idıszakok közt (dwd ill. wdw). Ezeknek az összefüggéseknek a
tisztázására többféle jól ismert elméleti megközelítés lehetséges. Például ellenırizhetı a
függetlenséget megfogalmazó nullhipotézis a Markov-függıséget jelentı ellenhipotézissel
szemben (pl. Cox és Hinkley, 1978); vizsgálható a függetlenségi hipotézis, pl. a Kendall-féle
rangkorrelációk segítségével, vagy más módszerekkel is.
Ellentétben az egymást követı napokra vonatkozó vizsgálatokkal, itt eleve a szériákra
vonatkozó megfigyelésszám majdnem egy nagyságrenddel kisebb, az állapottér pedig
lényegesen nagyobb. Az itt elmondottakon kívül a következı körülményeket is figyelembe
kell venni. A számításokhoz rendelkezésre álló mintaszámokat a közös részmintához tartozás
kritériumául választott idıintervallum behatárolja. Bár az évszak a mintaszám alakulása
szempontjából kedvezı lenne, tapasztalatunk szerint ez a bontás még részben elfedi az éves
menet jellemzıit. A természetes évszakok kiválasztására irányuló számításaink nem vezettek
sikerre, mivel a homogenizálási módszerrel (Szentimrey, 1996) elemenként eltérı hosszúságú
W W D W D D W D W D D
w2
d4
w1
d1 d1
w1
30
idıszakok adódtak. A gyakran alkalmazott 10 napos periódusokra a hisztogrammok alakja
erısen változik a dekád kezdıpont eltolásának hatására. E megfontolások alapján a havi
bontást választottuk és a vizsgálatokat ezekre az idıszakokra végeztük el.
A 2. ábra érzékelteti, hogy a függetlenségi vizsgálatokhoz - az adott hónapra
vonatkozó kis mintaszámok miatt – állapot összevonások nélkül nem tudjuk figyelembe venni
az összes eltérı hosszúságú tartamot. Elsı közelítésben az állapotteret rövid és hosszú száraz,
ill. csapadékos tartamokra szőkítettük le. Ekkor a Zn*= (tn, Xn
*) módosított folyamat
állapottere Z*= {1,2,...,365}×X* ahol X* = {dS, dL, wS, w L}. Itt dS ill. wS jelöli a rövid száraz
ill. csapadékos szériát, dL ill. wL pedig a hosszú szárazat ill. csapadékosat, továbbá H és J a
rövid és hosszú tartamok határait. Feltételeztük, hogy a Zn* folyamat egy adott hónapon belül
idıben közelítıen homogénnek tekinthetı, vagyis az Xn* sorozat együttes eloszlása nem függ
a tn idıpontoktól, ezért elegendı vizsgálni önmagában az Xn* folyamatot, melynek lehetséges
állapotai ebben az esetben:
X
d ha S H
d ha H L P
w ha S J
w ha J S M
n
S
L
S
L
* =
≤ ≤< ≤
≤ ≤< ≤
1
1
Amennyiben az így leszőkített állapottér esetén kimutatható függıségi kapcsolat az Xn*
sorozatra, úgy érdemes tovább finomítani ezt a felbontást. A határokat variáltuk,
megválasztásuknál figyelembe vettük a tartamok havonkénti gyakorisági eloszlásait és az
egyes kategóriákba jutó esetszámokat. H-t 4 napnak, J-t pedig a kevés hosszú csapadékos
szakaszra való tekintettel, 2 napnak vettük.
Az Xn* folyamat közvetlenül egymást követı állapotai között feltételezett
függetlenséget az alábbi módon ellenıriztük. Minden hónapra kiszámítottuk az (Xn'*, Xn'+1
*)
tartampárok gyakoriságait olymódon, hogy a száraz szériát követı csapadékos párok (dw)
esetén Xn'* = dS vagy dL és Xn'+1
* = wS ill. wL ahol n', (1<= n' <= N*365) azokat az indexeket
jelöli, amelyekre a tn' és tn'+1 idıpontok mindegyike a megadott hónapba esik. Ez esetben a
kérdéses mullhipotézis:
P d w P d P wj i j i( ) ( ) ( )X ,X X Xn*
n +1*
n*
n +1*
′ ′ ′ ′= = = = = ,
ahol értelemszerően i,j = S,L. Fordított helyzetekre, azaz a csapadékossal kezdıdı tartam
párokra (wd ) analóg módon végeztük a számítást.
31
2. ábra
A 15 napnál hoszabb száraz tartamok gyakorisága 0.1 mm (piros) és 1.0 mm (kék)
küszöbválasztás esetén.
A függetlenség - vizsgálatra χ2 próbát alkalmaztunk, melynek részeredményeit (J = 1
és H = 1,2,3,4 határokra) a megfelelı esetekre a 2. táblázatban közöljük. A próba egy
szabadsági fokú, a 0,95 szinthez tartozó kritikus értéket meghaladó statisztikát vastaggal
szedtük. A χ2 próba szerint a hipotézist elfogadhatjuk, tehát beláttuk hogy a rövid és hosszú
száraz és csapadékos idıszakokat (egy kivételtıl eltekintve) függetlennek tekinthetık.
Az Xn* folyamat egymást követı azonos jellegő állapotai közötti másodrendő
kapcsolatokat hasonló gondolatmenet alapján vizsgáltuk. Képeztük a váltakozó jellegő szériák
sorozataiból álló (Xn'*, Xn'+1
*, Xn'+2*) hármasok gyakoriságait, amelyeket pl. a száraz
kezdıállapot (dwd) esetén az Xn'* = dS, dL , Xn'+1
* = wS, wL és Xn'+2* = dS, dL események
alapján értelmeztünk. A nullhipotézis ekkor:
P d w d P d P w P dj i k j i k( , ) ( ) ( ) ( )X , X X X X Xn*
n +1*
n +2*
n*
n +1*
n +2*
′ ′ ′ ′ ′ ′= = = = = = = ,
ahol i, j, k = S, L. A számításokat az egymást követı csapadékos (wdw) szériákra is
elvégeztük az elsırendő vizsgálattal megegyezı feltételekkel. A χ2-próba ez esetben három
szabadsági fokú. A 0,95 megbízhatósági szinthez tartozó értékeket szintén a 2. táblázat
mutatja. Az eredmények szerint az egymás utáni azonos jellegő szériák is függetlennek
tekinthetık.
32
wd (df = 1) Wet =1 nap
Dry 1 2 3 4
Jan 0.2 0.1 2.1 1.4
Feb 0.5 1.0 0.0 0.1
Már 0.3 0.2 0.1 0.3
Ápr 1.1 0.0 0.4 0.0
Máj 0.2 1.0 2.5 2.7
Jún 0.1 0.1 0.2 0.2
Júl 0.1 1.7 3.5 4.1
Aug 3.2 2.3 2.3 1.4
Sept 0.7 1.2 1.8 0.0
Okt 0.8 0.0 0.2 0.1
Nov 0.0 0.1 0.8 2.7
Dec 1.5 0.2 0.0 0.0
dw (df = 1) Wet =1 nap
Dry 1 2 3 4
Jan 0.4 0.5 0.1 0.4
Feb 0.3 0.1 0.1 0.4
Már 0.4 1.0 0.5 0.6
Ápr 0.0 0.0 0.4 0.0
Máj 0.9 2.9 2.7 0.5
Jún 0.3 2.1 3.6 3.5
Júl 0.0 1.4 3.5 1.7
Aug 0.1 0.5 1.1 0.7
Sept 0.0 1.1 0.0 0.1
Okt 0.4 0.2 1.2 1.1
Nov 1.5 0.8 0.0 0.1
Dec 0.2 1.9 9.2 1.0
wdw (df = 3) Wet =1 nap
Dry 1 2 3 4
Jan 1.1 0.8 0.6 1.0
Feb 3.1 3.5 1.7 1.6
Már 1.3 2.3 3.6 2.9
Ápr 1.8 2.0 2.3 2.3
Máj 5.0 5.1 4.8 1.9
Jún 5.4 7.1 8.3 8.5
Júl 0.3 2.3 4.6 2.1
Aug 1.6 2.1 3.7 2.6
Sept 0.8 2.2 1.9 1.1
Okt 0.5 0.3 1.3 1.1
Nov 5.0 1.2 0.3 0.3
Dec 2.6 3.5 11.4 2.7
dwd (df = 3) Wet =1 nap
Dry 1 2 3 4
Jan 0.7 2.0 4.6 5.9
Feb 1.2 3.1 2.5 2.0
Már 1.4 2.0 0.2 1.8
Ápr 4.0 3.0 1.9 3.6
Máj 2.2 3.5 3.2 2.8
Jún 0.6 3.1 6.2 8.3
Júl 0.9 6.9 7.8 9.4
Aug 6.4 2.3 5.6 3.1
Sept 2.5 1.4 2.8 1.3
Okt 2.2 0.1 1.1 0.1
Nov 1.2 3.4 1.0 5.2
Dec 2.8 0.5 1.2 2.4
2. táblázat
χ2 próba eredményei az elsırendő (balra) és másodrendő (jobbra) függetlenség vizsgálatok esetén
(J=1 nap) Szegeden 1951-1990. Vastagon szedtük a 0,95 szignifikancia szintet meghaladó értékeket.
3.2 Eloszlásillesztés
Ezt követıen, az elızı fejezetben összefoglalt szakirodalom tapasztalatait figyelembe
véve, illeszkedés vizsgálatot végeztünk. Egymástól független havi száraz és csapadékos
szériákra geometriai (1) és kevert eloszlásokat illesztettünk az alábbi módon. Egyrészt vettük
két geometriai eloszlás súlyozott összegét (GG) a (2) képlet szerint, másrészt geometriai és
Poisson eloszlások súlyozott összegével (PG) számoltunk (3) alapján.
P k p p k( ) ( )ξ = = ⋅ ⋅ − −1 1, k = 1,2,... (1)
1k22
1k111 p1pr1p1prkP −− −⋅⋅−+−⋅⋅== )()()()(ξξξξ , k = 1,2,... (2)
λλλλλλλλξξξξ −−
−
−⋅−+−⋅⋅== e
1ks1q1qskP
1k1k
2 )!()()()( , k = 1,2,... (3)
ahol r és s a keverék eloszlások súlytényezıi. A korábban használt P és M praktikusan
megválasztott konstansok, melyek mellett az ezeknél hosszabb szériák megjelenésének
valószínősége gyakorlatilag már nullának tekinthetı. Az eloszlások paramétereit és a
súlytényezıket kvázi-Newton módszerrel becsültük a négyzetes eltérést minimalizáló
veszteség-függvény mellett. A számítások eredményeit a 3. ábra mutatják havonta a száraz
(felül) ill. csapadékos tartamokra (alul). A szemléletesség kedvéért mindegyik ábrán
feltüntettük a geometriai eloszláshoz tartozó, gyenge éves menetet mutató p értékeket is.
Szembetőnı, hogy a súlytényezık a különbözı klímájú állomásokra az év folyamán eltérı
mértékben ingadoznak.
A száraz tartamoknál r és p2 szabályos éves menetet mutat Szegedre, Szombathelyre
azonban – a két állomás eltérı klímájának (gyakorisági eloszlásának) egyik sajátosságaként -
hektikus. A jellemzıen rövid csapadékos esetekben a nullához közeli súlytényezık (néhány
kivételtıl eltekintve) eliminálják a második tagot. Ilyenkor az egyszerő geometriai eloszlás
gyakorlatilag megegyezik a (2) alapján kevert geometriaival.
A Poisson eloszlás figyelembevételével kapott s és λ görbék minden esetben markánsan
eltérnek. A száraz tartamokra vonatkozó 3. ábra felsı részén látszik, hogy a súlytényezık
értéke rendszerint magas, sıt néhány hónapban közelítıleg egy, ami arra utal, hogy a
geometriai tag dominál a keverék eloszlásban. A Poisson eloszlás hozzájárulása elsısorban a
hosszú tartamoknál érzékelhetı. Csapadékos esetben (3. ábra alsó része) az alacsonyabb s
értékek mellett - fıként Szombathelyre - a Poisson eloszlás hatása hatékonyabbá válik.
34
Rp1p2p
0.0
0.2
0.4
0.6
0.8
1.0
1 2 3 4 5 6 7 8 9 10 11 12
Rp1p2p
0.0
0.2
0.4
0.6
0.8
1.0
1 2 3 4 5 6 7 8 9 10 11 12
Sqlp
0.0
0.2
0.4
0.6
0.8
1.0
1 2 3 4 5 6 7 8 9 10 11 12
Sqlp
0.0
0.2
0.4
0.6
0.8
1.0
1 2 3 4 5 6 7 8 9 10 11 12
GG
PG
Szeged (1951-95) Szombathely (1951-95)
3. ábra
Felül: A száraz tartamokra illesztett eloszlások paraméterei és a súlytényezıi havonta: felül a két
geometriai, alul a geometriai és Poisson eloszlások súlyozott összegére.
A bal oldali ábrák Szegedre, a jobb oldaliak Szombathelyre vonatkoznak. (Jelölés: λ = l).
Alul: ua. csapadékos tartamokra.
Rp1p2p
0.0
0.2
0.4
0.6
0.8
1.0
1 2 3 4 5 6 7 8 9 10 11 12
Rp1p2p
0.0
0.2
0.4
0.6
0.8
1.0
1 2 3 4 5 6 7 8 9 10 11 12
sqlp
0.0
0.2
0.4
0.6
0.8
1.0
1 2 3 4 5 6 7 8 9 10 11 12
sqlp
0.0
0.2
0.4
0.6
0.8
1.0
1 2 3 4 5 6 7 8 9 10 11 12
Szeged (1951-95) Szombathely (1951-95)
GG
PG
35
Szeged Szombathely
DRY G MG PG G MG PG
Jan 25.1 (9) 9.2 (11) 8.5 (11) 11.5 (10) 9.2 (10) 9.2 (10)
Feb 21.1 (8) 3.7 (10) 11.1 (9) 12.0 (8) 4.4 (9) 4.4 (9)
Márc 8.7 (10) 5.8 (11) 6.1 (10) 7.9 (10) 6.5 (10) 8.3 (10)
Ápr 12.9 (9) 9.8 (9) 10.2 (10) 11.7 (9) 5.3 (10) 5.4 (10)
Máj 5.3 (9) 5.0 (9) 5.4 (9) 8.2 (9) 6.9 (10) 7.1 (10)
Jún 18.9 (7) 2.3 (9) 2.7 (9) 9.9 (7) 5.5 (8) 4.6 (8)
Júl 26.2 (10) 6.8 (12) 6.6 (12) 5.4 (9) 5.4 (9) 4.6 (9)
Aug 25.1 (11) 15.9 (12) 13.3 (12) 15.3 (9) 13.8 (9) 11.7 (10)
Szept 15.3 (10) 5.8 (12) 5.9 (12) 12,0 (9) 9.1 (11) 9.1 (11)
Okt 51.9 (9) 12.3 (12) 9.5 (13) 35.4 (9) 7.6 (12) 9.3 (11)
Nov 17.4 (8) 4.5 (10) 5.0 (9) 19.9 (9) 15.6 (9) 18.7 (9)
Dec 13.8 (7) 8.5 (8) 9.3 (9) 19.7 (8) 5.6 (9) 1.9 (10)
WET G MG PG G MG PG
Jan 4.9 (6) 5.0 (6) 2.5 (5) 3.4 (5) 3.4 (5) 0.7 (5)
Feb 5.2 (6) 5.2 (6) 6.1 (6) 9.9 (5) 10.0 (5) 12.6 (5)
Márc 0.5 (5) 0.5 (5) 0.4 (5) 16.1 (6) 16.5 (6) 3.3 (5)
Ápr 7.0 (6) 7.1 (6) 6.9 (6) 6.0 (6) 6.0 (6) 0.9 (5)
Máj 6.6 (6) 6.6 (6) 6.6 (6) 6.1 (6) 7.4 (7) 6.2 (6)
Jún 1.9 (5) 1.9 (5) 2.3 (5) 1.1 (6) 1.1 (6) 0.7 (6)
Júl 0.8 (4) 0.8 (4) 1.1 (5) 6.6 (6) 6.7 (6) 1.8 (5)
Aug 0.3 (4) 0.3 (4) 0.3 (4) 2.6 (5) 2.7 (5) 2.3 (5)
Szept 5.8 (4) 5.9 (4) 3.3 (4) 8.9 (5) 8.9 (5) 2.3 (5)
Okt 5.2 (5) 5.3 (5) 5.1 (5) 1.0 (5) 1.1 (5) 0.7 (5)
Nov 0.8 (6) 0.8 (6) 0.5 (6) 6.7 (6) 5.7 (6) 3.7 (6)
Dec 10.0 (6) 10.0 (6) 4.0 (5) 2.8 (6) 2.8 (6) 2.8 (6)
3. táblázat
Az illeszkedésvizsgálat eredményei: χ2 értékek (szabadsági fokuk) havonta száraz és nedves
idıszakokra Szegeden és Szombathelyen. A vastagított értékek a megfigyelt eloszlástól vett
szignifikáns eltérést jelezik, 95% megbízhatósági szinten. Rövidítések: G - geometriai, GG - két
geometriai súlyozott összege, PG - Poisson és geometriai súlyozott összege.
36
A fenti eloszlások illeszkedését χ2 próbával teszteltük, a 3. táblázatban vastaggal szedtük a
0,95 szinten szignifikáns eltérést mutató értékeket. Zárójelben tőntettük fel a szabadsági fokok
számát, amelyek különbségeit a száraz és csapadékos szériák havonta eltérı hossza - emiatt
eltérı darabszáma - és a kis gyakoriságok szükséges összevonása indokolja.
A száraz tartamoknál a keverék eloszlások eredménye hasonló: egyetlen kivétellel
(Szombathely november) az illeszkedés lényegesen jobb, mint a geometriai eloszlásé.
Csapadékos tartamokra az egyszerő geometriai eloszlás is megbízható, a PG eloszlás azonban,
néhány kivételtıl (pl. február) eltekintve, – fıként Szombathelyre – sokkal kisebb hibával
közelíti a mintát. A PG eloszlás tehát mindkét esetben egyértelmően jobb, mint a G.
A 4. ábrán olyan hónapokat mutatunk be, melyeknél a Poisson eloszlás alkalmazása
"látványosan" javít az illeszkedésen. Korrigálja a geometriai eloszlás jellegébıl adódó
jellegzetes hibákat, nevezetesen a bal oldali hisztogrammnál a kis valószínőségő részeket, a
jobb oldalinál pedig az 1-2 napos csapadékos szériák túlbecslését.
DRY
0
10
20
30
40
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33
OBSGPGGG
WET
0
20
40
60
80
100
1 3 5 7 9
4. ábra
A száraz tartamokra illesztett eloszlások Szegeden októberben (bal), és csapadékos tartamokra
Szombathelyen márciusban (jobb). Rövidítések: OBS - megfigyelés, G - geometriai, GG - két
geometriai, PG-kevert Poisson és geometriai eloszlás keveréke.
A keverék eloszlások módosító hatása fıként nagy k értékek esetén, az extrém száraz
tartományban jelentkezik. Ennek érzékeltetésére összehasonlítottuk a három eloszlásból
adódó kis valószínőségő - az aszályok megfelelı modellezése szempontjából azonban döntı
fontosságú - tartamok számát. A 0.98-ad rendő kvantilist meghaladó ill. a 45 év alatt
37
elıfordult leghosszabb tartamok alapján számított elméleti és a valódi mintaszámok eltérését
Szegedre a 5. ábrán tőntettük fel. Látható az ábrán, hogy a keverék eloszlások kevésbé térnek
el a tapasztalati gyakoriságoktól, mint az egyszerő geometriai eloszlás. Februárban és
októberben a PG, augusztusban az GG-vel kapott extrém tartamgyakoriságok száma az adott
intervallumban igen jó egyezést mutat a szegedi mintáéval. További három hónapban
valamivel több (lásd az ábrán a pozitív tartományba esést), rendszerint azonban csak
legfeljebb néhány darab mutat kevesebbet hosszú tartamok esetén a várható számnál.
Num
ber
of c
ases
-8
-6
-4
-2
0
2
4
6
1 2 3 4 5 6 7 8 9 10 11 12
GGGPG
5. ábra
A geometriai és a keverék eloszlásokkal elıállított extrém hosszú száraz (0,98-ad rendő kvantilist
meghaladó) tartamok számának eltérése a tapasztalati gyakoriságoktól Szegeden, 1951-95.
(Minél rövidebb az oszlop, annál jobb az illeszkedés.)
A Szegedre és Szombathelyre kapott eredmények egyaránt azt igazolják, hogy a
száraz és csapadékos tartamok modellezésére alkalmas a geometriai és Poisson eloszlás
súlyozott összege, amely a Magyarországon jellemzı hosszú száraz és jellegzetesen rövid
csapadékos tartamokra minden hónapban magas megbízhatósági szinten illeszkedik.
38
4. Elıkészítı lépések
Ismert, hogy a meteorológiai paraméterek idısoraiban az évszakos változásoknak
megfelelıen éves menet jelentkezik. Ennek kiküszöbölésére szokás használni additív (illetve
multiplikatív) modelleket. Ezt követve a meteorológiai idısorokat felbontjuk determinisztikus
és sztochasztikus tagok összegére (ill. szorzatára). Korábbi vizsgálataink szerint az egymást
követı száraz / csapadékos szériák hossza független valószínőségi változóknak tekinthetık
(az eloszlásokkal összefüggı becslési kérdésekre részletesen kitértünk). Ez a felismerés
vezetett ahhoz a gondolathoz, hogy a különbözı meteorológiai paramétereket megvizsgáljuk
külön - külön a száraz / csapadékos napokból álló szakaszokon.
Dolgozatunkban a csapadék állapotától függı feltételes idısor modellt dolgoztunk ki.
Elsı lépésként a mérések sorozatáról a 4. 1. fejezetben megmutattuk, hogy a vizsgált változók
állapotterét a csapadék állapota kettéválasztja és szignifikánsan eltérı statisztikai mutatókkal
rendelkezı mintákat eredményez. Ennek értelmében a száraz illetıleg csapadékos napok
szerint kettéválasztott mintákból elıször a determinisztikus tagokat távolítottuk el oly módon,
hogy az adott hely éghajlatára jellemzı átlagok és szórások periodikus éves menetét
kiküszöböltük a feltételes sorokból. Ezt követıen ebben a fejezetben a maradék rezidum sor
jellemzıit tanulmányoztuk. A hasonló elven nyugvó modellekhez képest sokkal részletesebb
vizsgálatokat végeztünk az összes általunk vizsgált meteorológiai változónak a csapadékos ill.
száraz tartamok hossza szerinti valamint a tartamokon belül a sorszámok szerinti
összefüggések megismerésére (4. 1. 4. fejezet). A fejezet további részében ( 4.2, 4.3, 4.4) az
idısor analízis standard eljárásainak felhasználásával tártuk fel a modell kialakításához
szükséges információkat. Az eredményekre épülı modell fejlesztési lépéseit az 5. fejezetben
kerülnek ismertetésre.
4.1 Transzformációk
A szakirodalomban az éves periódus eltávolítására leggyakrabban alkalmazott eljárás
a Fourier transzformáció (Amed et al., 1986; Dévényi és Gulyás, 1988; Panofsky és mtsai,
1958), amely a gyakorlatban néhány együttható segítségével lehetıvé teszi az idısor "jó"
közelítését. A paraméterek száma nem elhanyagolható szempont a modell kiválasztásnál,
hiszen a paraméterek változtatása teszi lehetıvé a klímaváltozással összefüggı alkalmazást.
39
A Fourier transzformáció számításigénye mindkét módszer esetén N2 nagyságrendő,
ezért célszerő nagy mintaszám esetén a gyors Fourier transzformációt alkalmazni (FFT).
Ezáltal N⋅ln(N) szorzóval arányos lesz azon mőveletek száma, melyek elıállítják az
együtthatókat, illetve inverz FFT esetén a közelítı sort. Az alábbi négy pontban ismertetjük az
alkalmazott számítás algoritmusát.
4.1.1 Sokéves napi átlag és szórás számítása száraz és csapadékos napok szerint
A ξj(h,t) valószínőségi változó értékét a j-edik meteorológiai elemre (j=1,…,8) a
h-adik év (h=1,…,N; N=45) t-edik napján (t=1…,365) jelölje xj(h,t). Adott napon a
feltételes várhatóértéket csapadékos esetben a következıképpen értelmezzük
E[ξj(h,t) | R(h,t)>0] ahol R(h,t) a napi csapadékösszeg, illetıleg E[ξj(h,t) | R(h,t)=0]
csapadékmentes napokon. Az átlaggal történı becsléseket az alábbi módon végeztük el:
)t,h(xn
1)t(x
n
}0)t,h(R{1i
j,iWj ∑
>=
= és )t,h(xm
1)t(x
m
}0)t,h(R{1i
j,iDj ∑
==
=
ahol j = 1,…,8 és n = n(t) a csapadékos, m = m(t) a száraz napok száma az év t-ik napján és
minden t = 1,…,365 esetén n + m = N. Az empirikus szórások számítása:
n
))t(x)t,h(x(
)t(s
n
}0)t,h(R{1i
Wjj,i
Wj
j
∑>
=−
= ill. m
))t(x)t,h(x(
)t(s
m
}0)t,h(R{1i
Djj,i
Dj
j
∑=
=−
=
4.1.2 Fourier sorfejtés alkalmazása a sokéves feltételes statisztikákra
A sokéves feltételes átlagok és szórások diszkrét értékeit periodikus függvénnyel
közelíthetjük, ezért a vizsgált statisztikák simítására célszerő alkalmazni a Diszkrét Fourier
Transzformáltat (DFT) (Richardson, 1981; Racskó és mtsai 1991). A közelítı függvény
komplex alakját Székely (1994) nyomán a Függelékben közöljük. Jelölje fi, i = 1,...M, M=365
diszkrét, valós értékő minta elemeket. Ekkor a DFT komplex együtthatói az alábbi módon
állíthatók elı:
∑−
=−=
π−=1M
0kkn 1M,...0n,nk
M
2iexpf
M
1D .
40
A transzformált elemek között szimmetria összefüggések állnak fenn, nevezetesen DM-n = Dn*
ahol a D-n = Dn* komplex konjugált és D0 jelöli a stacionárius tagot, valamint D0 és DN/2
valósak. Az n-edik harmonikus megmagyarázza a szórásnégyzet Cn2/ 2s2 százalékát, ahol az
n-edik harmonikus amplitúdója Cn2 = An
2 + Bn2 és s2 pedig a teljes szórásnégyzet.
Tapasztalatok szerint meteorológiai idısoroknál az N/2 számú harmonikus helyett az elsı
néhány tag kielégítı pontosságú közelítést eredményez (Panofsky, 1958; Richardson, 1981).
A komplex együtthatók valós és képzetes részét Szegedre a 4. táblázat tartalmazza.
SZÁRAZ CSAPADÉKOS
D 0 Re
(D 1) Im
(D 1) Re
(D 2) Im
(D 2)
D 0 Re
(D 1) Im
(D 1) Re
(D 2) Im
(D 2) Max. hım. Átlag 16,6 -6,4 1,6 -0,9 -0,1 15,3 -5,8 1,7 -0,5 -0,0
Szórás 4,4 0,4 -0,3 -0,0 -0,1 4,5 0,2 -0,1 -0,1 -0,1 Átl. H ım. Átlag 10,7 -5,7 1,4 -0,4 0,0 10,5 -4,9 1,6 -0,3 0,1
Szórás 3,8 0,4 -0,2 0,1 -0,1 3,6 0,3 -0,1 0,1 -0,1 Min. hım. Átlag 5,3 -4,7 1,3 -0,1 0,1 6,7 -4,3 1,5 -0,2 0,1
Szórás 3,9 0,9 -0,1 0,10 -0,1 3,5 0,6 -0,1 0,1 -0,1 Rel. Nedv. Átlag 72,2 5,9 0,7 1,8 0,1 80,3 4,1 0,1 0,7 0,2
Szórás 8,2 -0,2 -0,3 -0,9 0,1 8,6 -0,9 0,1 -0,6 0,0 Napf. Tart. Átlag 6,9 -2,1 0,0 -0,2 -0,1 3,2 -1,4 0,1 0,2 -0,1
Szórás 3,1 -0,1 -0,2 -0,1 0,1 2,8 -0,7 -0,0 -0,0 -0,0 Felhızet Átlag 3,8 0,5 -0,2 0,2 0,2 6,2 0,5 -0,1 -0,0 0,1
Szórás 2,1 0,1 -0,0 -0,0 0,0 1,5 -0,1 0,0 -0,0 -0,0 Szél Átlag 3,2 0,1 -0,3 -0,1 0,0 3,7 0,2 -0,2 -0,1 0,0
Szórás 1,5 0,1 -0,1 -0,0 -0,0 1,5 0,2 -0,1 -0,0 0,0 Légnyomás Átlag 1019,0 2,1 0,6 0,2 0,0 1012,9 0,4 0,5 0,3 -0,1
Szórás 6,2 1,5 -0,4 0,2 -0,1 6,3 -1,4 -0,3 0,1 0,1
4. táblázat
Fourier együtthatók száraz (bal) és csapadékos (jobb) napokon (Szeged 1951-95).
4.1.3 Simított sokéves feltételes átlagok elıállítása Inverz Fourier Transzformációval
A táblázatban szereplı transzformáltak ismeretében adott elem Inverz Diszkrét Fourier
Transzformációval a következıképpen állítható elı:
∑=
π=2
0kkn )nk
M
2iexp(Df
41
Az fn függvényt a hullámmal jelölt, simított feltételes átlagok ill. szórások:
)t(x~Wj , )t(x~D
j , )t(s~Wj és )t(s~D
j elıállítására alkalmazzuk. Az 6. ábra illusztrálja, hogy a
simított sokéves átlagok és szórások a tanulmányozott elemek mindegyikénél szignifikánsan
különböznek a csapadék állapotától függıen, valamint markáns éves menetet mutatnak
csapadékos és száraz napokon egyaránt.
HÕMÉRSÉKLETEK
-10
-5
0
5
10
15
20
25
30
35
0 30 60 90 120 150 180 210 240 270 300 330 360
DMAXM
WMAXM
DTEMPM
WTEMPM
DMINM
WMINM
NAPFÉNYTARTAM
0
2
4
6
8
10
12
0 30 60 90 120 150 180 210 240 270 300 330 360
RELATÍV NEDVESSÉG
60
64
68
72
76
80
84
88
92
0 30 60 90 120 150 180 210 240 270 300 330 360
FELHÕZET
2
3
4
5
6
7
8
0 30 60 90 120 150 180 210 240 270 300 330 360
SZÉLSEBESSÉG
2.4
2.8
3.2
3.6
4.0
4.4
4.8
0 30 60 90 120 150 180 210 240 270 300 330 360
LÉGNYOMÁS
1008
1010
1012
1014
1016
1018
1020
1022
1024
0 30 60 90 120 150 180 210 240 270 300 330 360
DRY
WET
6. ábra
Meteorológiai elemek sokévi feltételes átlagainak éves menete Fourier sorral simított
száraz (piros) és csapadékos (kék) napokon.
42
4.1.4 Rezidum sorok elıállítása a simított sorok felhasználásával
A napi idısorban lévı átlagos éves menet eltávolítására érdekében a simított feltételes
átlagok és szórások felhasználásával standardizáltuk a különbözı elemek napi értékit,
figyelembe véve a nap száraz ill. csapadékos állapotát:
=−
>−
=
0)t,h(Rha)t(s~
)t(x~)t,h(x
0)t,h(Rha)t(s~
)t(x~)t,h(x
)t,h(y
Dj
Djj
Wj
Wjj
j
Ez a lineáris transzformáció nagy pontossággal nulla átlagúvá és egy szórásúvá alakítja az
{y j(h,t); j=1,..8; h=1…45, t=1…365) mintákat, ugyanakkor az eredeti sorokra jellemzı
ferdeséget, lapultságot és korrelációkat megırzi. Így a periodikus függvénnyel leírható
komponenseket eltávolítottuk az adatsorokból, s a továbbiakban a reziduum tagok
modellezésére törekszünk. Az 7. ábra illusztrálja a számítás fıbb lépéseit. NAPFÉNYTARTAM
ÁT
LAG
-2
2
6
10
14
18
Száraz
Csapadékos
1951
SZ
ÓR
ÁS
1.0
1.6
2.2
2.8
3.4
4.0
4.6
RE
ZID
UM
-4
-3
-2
-1
0
1
2
3
4
0 30 60 90 120 150 180 210 240 270 300 330 360 7. ábra
A napfénytartam napi menete 1955-ben, a sokéves napi átlagok (felül) és szórások (középen)
csapadékos és száraz napokon, valamint a rezidum sor(alul). (Szeged 1951-1995).
43
A felsı grafikon a napfénytartam feltétel nélküli napi összegeit mutatja egy adott
évben (1955-ben: folytonos szürke görbe). A Fourier sorral simított 45 éves feltételes átlagot
(felül) és szórást (középen) a folytonos piros görbe ábrázolja csapadékos, a kék pedig a száraz
napok átlagaként. A napfénytartam átlagos értéke száraz napokon lényegesen magasabb, mint
csapadékos esetekben. A szórás csapadékos napok szerinti éves menetét nagyobb éves ingás
jellemzi, mint a szárazét. Alul a standardizálással elıállított maradék sor látható.
További próbákra van szükség annak ellenırzésére, hogy található-e szignifikáns
különbség az elemek feltételes statisztikáiban tetszıleges hosszúságú száraz (csapadékos)
idıszakon belül. Amennyiben az 1, 2, 3, ≥4 napjaira vonatkozó átlagok és szórások között
találunk eltéréseket, akkor nem elegendı csak csapadékos és száraz napok szerint
szétválasztani az adatokat, hanem az eredményeknek megfelelıen a szériákon belül további
megkülönböztetés szükséges.
A kérdés megválaszolásához elıször kiszámítottuk a feltételeknek megfelelı
statisztikákat, melyek közül a maximum hımérsékletre, a relatív nedvességre és a
légnyomásra vonatkozó átlagokat és szórásokat a tartamon belüli sorszámuk szerint a 8. és 9.
ábrákon tőntettük fel. A megközelítıleg nulla várható értéket ill. egységnyi szórást jelzı
(piros) vonal körül eltérı mértékben szóródnak a szakaszon belüli sorszámra utaló jelek.
Különösen szembetőnı az elsı napok elkülönülése a többitıl (8. ábra). A piros pontok,
a száraz ill. csapadékos feltételtıl függıen, rendszerint ellentétes elıjelőek. Példaként a relatív
nedvességnél maradva, száraz szériákban az elsı napra vonatkozó átlagok lényegesen
nagyobbak, mint késıbb, hiszen a levegı a következı napokon a hımérséklet emelkedésével
párhuzamosan, relatíve kiszárad.
Mindez a tartamokon belül az elsı napok szisztematikus megkülönböztetésére utal.
Ahhoz, hogy az elsı, második, stb. napokra vonatkozó átlagok (szórások) azonosságának
hipotézisét konkrét valószínőségi szinten el tudjuk dönteni a normalitás feltételezése mellett,
az átlagok összehasonlítására páronként u, a szórásokra pedig F próbát alkalmaztuk
(5. táblázat). Amennyiben az egy dimenziós normalitási teszt szerint valamely elem nem volt
normális eloszlásúnak tekinthetı, akkor a Mann-Whitney teszt szerint jártunk el.
44
Max. hım. Átl. hım Min. hım Rel. nedv. Napf. tart. Felhızet Szél Nyomás
D W D W D W D W D W D W D W D W
Jan. 0.7 1.1 0.2 1.7 0.1 2.6 0.9 2.3 0.2 -1.7 0.4 0.5 -0.1 -1.1 -2.2 1.2
Febr. 1.0 -0.6 1.6 -0.3 1.7 0.1 0.2 0.9 0.2 -0.4 0.3 0.5 -0.5 -0.1 -1.2 2.3
Márc. 1.4 0.2 1.6 0.4 1.3 1.2 0.0 -0.3 -0.7 -1.1 1.1 0.8 -0.6 -0.3 -2.5 1.5
Ápr. 1.5 0.1 1.9 0.1 1.1 0.6 2.3 0.4 -0.5 0.9 0.1 -0.9 -2.6 -0.5 -3.8 2.4
Máj. 1.1 0.4 1.6 -0.1 1.8 0.3 1.0 0.1 -0.5 -0.3 0.8 0.2 -0.7 0.0 -2.6 1.5
Jún. 0.8 -0.2 1.0 -0.7 0.5 -1.0 1.5 0.2 -1.6 0.4 1.6 -0.6 -2.8 -0.8 -2.7 3.1
Júl. -0.6 -0.6 -0.6 -1.1 -0.3 0.2 0.8 0.7 0.8 -0.7 0.9 1.3 -0.2 0.9 -2.3 1.4
Aug. 0.8 0.0 0.5 -0.9 -0.1 -0.4 0.3 1.5 0.4 -0.3 0.1 -0.8 -3.1 0.3 -2.0 0.2
Szept. 0.1 -0.9 0.6 -0.7 1.1 2.5 0.9 3.1 -0.2 -1.4 0.7 0.4 0.7 0.0 -4.6 1.4
Okt. 2.4 -0.8 2.4 0.1 0.7 1.3 -1.2 1.9 0.1 -2.8 -0.0 2.2 1.7 -0.9 -3.3 1.0
Nov. 1.3 -0.0 1.3 0.2 0.9 0.5 0.6 1.0 -0.5 -1.7 1.8 0.4 0.4 -1.8 -3.7 3.3
Dec. -0.6 -0.1 -0.3 -0.1 -0.3 -0.5 2.3 -0.2 -1.4 0.1 1.4 -0.1 -0.3 -1.4 -2.8 0.6
5. táblázat
Két mintás u próbával számított próbastatisztikák. H0: az egy napos szériákra és a több napos tartamok
elsı napjaira számított átlagok megegyeznek. Kiemeltük az N (0,1) eloszlás 0,95 szignifikancia
szinthez tartozó 1,64 értéket meghaladó u statisztikákat. (D - csapadékos, W - száraz)
A számítást havonként minden elemre a csapadékos szériák elsı és második
(W1 & W2), második és harmadik (W2 & W3), harmadik és legalább negyedik (W3 & W4)
napjára elvégeztük. Az 6. táblázatban a 0,95 szinthez tartozó szignifikáns eltéréseket jelöltük
(csillaggal az átlag, körrel a szórás esetén). A szürke háttérszínezés jelzi azokat az átlépéseket
és hónapokat, amikor a Kolmogorov - Szmirnov próba szerint nem normális az eloszlás.
A legtöbb eltérést az elsı és a második napok feltételes átlagai között tapasztaltuk, amik
csaknem minden elemre legalább az év felében szignifikánsnak adódtak. Szintén nem
hagyható figyelmen kívül a 3. és a 4. tartam-kategória (3 illetve legalább 4 nap) közötti
különbség, különösen a gyakran igen hosszú száraz szériák maximum-, minimum- és átlag-
hımérsékleténél.
A szériákon belül tehát mindenképpen meg kell különböztetnünk az elsı napokat. Ezt
is lehet azonban tovább “bontani” egy napos tartamokra, illetve a legalább két napos tartamok
elsı napjaira. Kérdés, hogy ezek átlagai között van-e különbség? Ennek megválaszolására a
45
szórások és a mintaszámok ismeretében, a normális eloszlás feltételezése mellett, u próbát
végeztünk. A teszt értékeket száraz és csapadékos szériákra a 6.a. és b. táblázat tartalmazza.
A standard normális eloszlás 0,95 szinthez tartozó 1,6-et meghaladó érték jelzi. Csaknem
mindegyik elemnél csupán néhány (0-4) hónapban találtunk szignifikáns eltérést, ami nem
indokolja, hogy a legalább két napos tartamokon belül további megkülönböztetést tegyünk.
Kivételt képez a légnyomás, amely szoros összefüggésben áll a légköri cirkulációs
folyamatokkal (frontok áthaladásával, stb.), ezért másként viselkedik csapadékos idıszakba
ágyazott száraz nap esetén, mint egy valódi száraz periódus kezdetén.
Összefoglalva a grafikus ábrázolások és a különféle próbák tapasztalatait, a
transzformált sorokat havonta az alábbi csoportok szerint választottuk szét: A csapadékos
idıszakokon belül az elsı napok elkülönülnek a többitıl. A száraz tartamokon belül három
kategóriát célszerő megkülönböztetni: elsı napok, második és harmadik napok, valamint
negyedik és ezt követı sorszámú napok. Ezt követıen havonta csoportonként kiátlagoltuk,
majd kivontuk az yj(h,t) értékekbıl. Képletekkel leírva az alábbi módon hajtottuk végre a
centrálást:
=≥
=≤≤
==
=>
==
−=
)..,|),((
)..,|),((
)..,|),((
)..,|),((
)..,|),((
),(),(
121k5DthyE
121k4D2thyE
121k1DthyE
121k1WthyE
121k1WthyE
thythz
j
j
j
j
j
jj
ahol W a csapadékos, D pedig a száraz nap tetszıleges hosszúságú tartamon belüli sorszámát
jelöli. A havi feltételes átlagok eltávolítása után a keletkezett zj(h,t) sorok átlaga 10-17
pontosságig zéró, másrészt a szimuláció során ezen átlagok hozzáadása a generált adatokhoz
lehetıvé teszi a tartamon belüli változékonyság jellemzıinek reprodukálását. Reziduum
sorokként fogunk hivatkozni a fenti módon elıállított mintákra és a továbbiakban ezek
képezik majd számításaink alapját.
46
ÁTLAG SZÓRÁSS
td. m
axim
um h
õmér
sékl
et
-1.0
-0.8
-0.6
-0.4
-0.2
0.0
0.2
0.4
0.6
0.8
1.0
1 2 3 4 5 6 7 8 9 10 11 12
W 1
W 2
W 3
W 4
Std
. rel
atív
ned
vess
ég á
tlaga
-1.0
-0.8
-0.6
-0.4
-0.2
0.0
0.2
0.4
0.6
0.8
1.0
1 2 3 4 5 6 7 8 9 10 11 12
Std
. lég
nyom
ás
-1.0
-0.8
-0.6
-0.4
-0.2
0.0
0.2
0.4
0.6
0.8
1.0
1 2 3 4 5 6 7 8 9 10 11 12
Std
. max
imum
hõm
érsé
klet
0.5
0.6
0.7
0.8
0.9
1.0
1.1
1.2
1 2 3 4 5 6 7 8 9 10 11 12
W 1
W 2
W 3
W 4
Std
. rel
atív
ned
vess
ég
0.5
0.6
0.7
0.8
0.9
1.0
1.1
1.2
1 2 3 4 5 6 7 8 9 10 11 12
Std
. lég
nyom
ás
0.5
0.6
0.7
0.8
0.9
1.0
1.1
1.2
1 2 3 4 5 6 7 8 9 10 11 12
8. ábra
Három meteorológiai elem feltételes havi átlagai a nedves szériák elsı (W1), második (W2),
harmadik (W3) és legalább negyedik (W4) napján.
47
ÁTLAG SZÓRÁSS
td. m
axim
um h
õmér
sékl
et
-1.0
-0.8
-0.6
-0.4
-0.2
0.0
0.2
0.4
0.6
0.8
1.0
1 2 3 4 5 6 7 8 9 10 11 12
D 1
D 2
D 3
D 4
Std
. rel
atív
ned
vess
ég
-1.0
-0.8
-0.6
-0.4
-0.2
0.0
0.2
0.4
0.6
0.8
1.0
1 2 3 4 5 6 7 8 9 10 11 12
Std
. lég
nyom
ás
-1.0
-0.8
-0.6
-0.4
-0.2
0.0
0.2
0.4
0.6
0.8
1.0
1 2 3 4 5 6 7 8 9 10 11 12
Std
. max
imum
hõm
érsé
klet
0.5
0.6
0.7
0.8
0.9
1.0
1.1
1.2
1 2 3 4 5 6 7 8 9 10 11 12
D 1
D 2
D 3
D 4
Std
. rel
atív
ned
vess
ég
0.5
0.6
0.7
0.8
0.9
1.0
1.1
1.2
1 2 3 4 5 6 7 8 9 10 11 12
Std
. lég
nyom
ás
0.5
0.6
0.7
0.8
0.9
1.0
1.1
1.2
1 2 3 4 5 6 7 8 9 10 11 12
9. ábra
Három meteorológiai elem feltételes havi átlagai száraz szériák elsı (D1), második (D2),
harmadik (D3) és legalább negyedik (D4) napján.
48
WET
SMAX SMEAN SMIN SSUN
W1 &
W2
W2 &
W3
W3 &
W4
W1 &
W2
W2 &
W3
W3 &
W4
W1 &
W2
W2 &
W3
W3 &
W4
W1 &
W2
W2 &
W3
W3 &
W4 m s m s m s m s m s m s m s m s m s m s m s m s I * • II • * * • * • III * * * • * * • * * • IV * * * * * * * * • V * * * • • • * VI * * • * * * • * VII * * * * * * VIII * * * * * * IX * * • * * • * • X * * * * • * • * * • XI • * • * • * XII * • •
SREL SCLOUD SWIND SPRES W1
& W2
W2 &
W3
W3 &
W4
W1 &
W2
W2 &
W3
W3 &
W4
W1 &
W2
W2 &
W3
W3 &
W4
W1 &
W2
W2 &
W3
W3 &
W4 m s m s m s m s m s m s m s m s m s m s m s m s I * • * * • * II * • * • * • * III * * * • * * IV * • * * • V * * * VI * * * * • VII * * * * • VIII * * * IX * • * • * X * • * * • • * XI * * • * XII * • * • • * *
6.a. táblázat
Csapadékos széria 1, 2, 3, ≥4 napjaira számított átlagok és szórások
(lásd. 8. és 9. ábra) összehasonlítása.
* u próba szerint 0,95 szinten az átlagok eltérnek
• F próba szerint 0,95 szinten a szórások eltérnek
Szürke háttér azt jelzi, hogy nem normális eloszlásokat hasonlítunk össze.
49
DRY
SMAX SMEAN SMIN SSUN
D1 & D2
D2 & D3
D3 & D4
D1 & D2
D2 & D3
D3 & D4
D1 & D2
D2 & D3
D3 & D4
D1 & D2
D2 & D3
D3 & D4
m s m s m s m s m s m s m s m s m s m s m s m s I * * * II * * * * III * * * * * * IV * * * * * * * V * * * * * * * * * • VI * * * * * * * * * * • VII * * * * * * * * * VIII * * * * * * * * * • * • IX * * * * * * * * X * * * * * * XI * * * * XII * • * •
SREL SCLOUD SDIND SPRES D1
& D2
D2 & D3
D3 & D4
D1 & D2
D2 & D3
D3 & D4
D1 & D2
D2 & D3
D3 & D4
D1 & D2
D2 & D3
D3 & D4
m s m s m s m s m s m s m s m s m s m s m s m s I * * • * * • * II * * • * • * * III * * * * * IV * * * * • * • V * * * * * • * * * VI * * * * * * VII * * * * * * * * VIII * * * * • * * • * IX * * * • * * • * X * * * * • * XI * * • * • * * XII * * * * *
6.b. táblázat
ua. mint 6.a. ábra száraz szériákra.
50
4.2 Idıjárási paraméterek néhány jellemzıje
Adott (havi) idıszakban az egymást követı száraz ill. csapadékos szériák hossza
független valószínőségi változóknak tekinthetı. Ezen idıszakon belül a száraz / csapadékos
széria hosszak külön - külön azonos eloszlást követnek (Erre vonatkozóan ld. korábbi
vizsgálatainkat.) Ez vetette fel annak gondolatát, hogy az idıjárási paraméterek sorozatát az
adott idıszakra vonatkozóan külön vizsgáljuk a száraz / csapadékos szakaszokon.
Az egymást követı napok idıjárási paramétereinek modellezése a következık szerint
történik. Az egymást követı száraz vagy nedves állapotát megadja a száraz/nedves szériák
modellje (3.2 fejezet). A többi meteorológiai paraméter az így adottnak tekinthetı
száraz/csapadékos napok sorozatára épül, mintegy a száraz/csapadékos állapottól függı
valószínőségi modell. Vizsgálataink alátámasztják, hogy adott hónapban a száraz/nedves
napokból álló szakaszok a saját centrálás és normalizálás után gyengén stacionárius
sorozatnak tekinthetık. Ez kínálja annak a lehetıségét, hogy a modellezés fázisában elsırendő
autoregresszív modellt használjunk.
A korábbiakban alkalmazott jelölések kibıvítésével az alábbiakban adjuk meg a
modellt. Jelölje:
a nap száraz /nedves állapotát a({t}), ahol a({t}) = D, W;
a széria hosszát h({t}), ahol { }( )
=≤≤=≤≤
=WahaSh1
DahaPh0th ;
a szérián belül elfoglalt sorszámot d*({t}), ahol 0 ≤ d*({t}) ≤ h({t});
a minta éven belül sorszámát pedig {t}, { } 1365
ttt +
−= .
A fenti értelemben Zt folyamatot az alábbi módon állítjuk elı:
Zt = v(a({t}), h({t}), d *({t})) ⋅Ut + u(a({t}), h({t}), d *({t})),
ahol az Ut elsırendő feltételes autoregresszív folyamat: Ut+1=AUt + Bεt.
Mielıtt rátérnénk az autoregresszív folyamattal kapcsolatos vizsgálatainkra, megmutatjuk a
rezidum sorok néhány, a továbbiakban részben felhasználásra kerülı tulajdonságát.
51
4.3 Faktoranalízis
A vizsgált összes meteorológiai változót faktoranalízis segítségével csoportosítottuk
olymódon, hogy elkülönítettük azokat azon elemeket, amelyek egymástól lineárisan
függetlennek tekinthetık, illetve amelyeknél a változók között szoros lineáris kapcsolat
mutatható ki. A számításokat a "Statistica for Windows, Factor Analysis" modulja
segítségével végeztük el a kilenc meteorológiai elemre (1951-1995), havonként, külön-külön
az említett száraz ill. csapadékos idısorokra, valamint a teljes mintára. Az aktuális faktorszám
kiválasztása a Kaiser féle kritérium alapján (Statistica for Windows III kötet 3204. old.) az
1-nél nagyobb sajátérték meghatározásával történt. A faktorok elkülönítéséhez az
alapértelmezésként ajánlott normalizált Varimax rotációt alkalmaztuk (Móri, 1999; Statistica
for Windows III kötet).
A sajátértékek kumulatív összegei szerint három faktor a figyelembe vett elemek
közös faktorokkal kifejezhetı varianciájának 70-82 % -ának leírását teszi lehetıvé.
A faktorok osztályozását a rotált faktor értékek alapján, a 7. táblázatba összegyőjtött
faktorsorszámok szerint végeztük el teljes (ALL) mintára ill. csak csapadékos (DET) és csak
száraz (DRY) napokra. A táblázatban a 0,7-es korrelációt meghaladó faktorok sorszámait
tőntettük fel, zárójelben lévı faktorok értéke 0,5 és 0,7 közötti. Azonos szín és minta jelzi a
faktoranalízis szerint megegyezı csoportba tartozó elemeket. A rotáció miatt az elsı és
második faktorok (a száraz napokra vonatkozó táblázat kivételével) felcserélıdnek az év egy
részében, ennek azonban az osztályok kiválasztására nézve nincs jelentısége.
A 7. táblázat alapján a vizsgált elemek között az alábbi összetartozó csoportok
különíthetık el:
I maximum-, minimum-, átlag hımérséklet;
II napfénytartam, relatív nedvesség, felhızet;
III szél, légnyomás.
A csapadék és többi elem között tipikusan nem lineáris a kapcsolat, ezért a napi
csapadékösszeg minden más elemtıl függetlenül kezelendı.
52
ALL PREC MAX TEMP MIN SUN REL CLOUD WIND PRES Jan (3) 1 1 1 2 2 2 3 3 Feb (2) 1 1 1 2 2 2 3 (3)
Márc (1) 2 2 2 1 1 1 3 (1) Ápr (1) 2 2 2 1 1 1 3 (1) Máj (1) 2 2 2 1 1 1 3 (1) Jún (1) 2 2 2 1 1 1 (2) (1) Júl (1) 2 2 2 1 1 1 (1) 1 Aug (1) 2 2 2 1 (1) 1 (1) (1) Szept (1) 2 2 2 1 1 1 3 (1) Okt (1) 2 2 2 1 1 1 3 (1) Nov (3) 1 1 1 2 2 2 3 (3) Dec (3) 1 1 2 2 2 2 3 3
WET PREC MAX TEMP MIN SUN REL CLOUD WIND PRES Jan (3) 1 1 1 2 (2) 2 3 (3) Feb (3) 1 1 1 2 2 2 3 (3)
Márc (2) 1 1 1 2 2 2 3 (3) Ápr (1) 2 2 2 1 1 1 3 (3) Máj (1) 2 2 2 1 1 1 3 3 Jún (3) 2 2 2 1 1 1 3 (1) Júl (2) 1 1 2 1 1 1 3 2 Aug (3) 1 2 2 1 1 1 3 3 Szept (2) 1 2 2 1 1 1 3 (2) Okt (2) 1 1 1 2 2 2 3 3 Nov (3) 1 1 1 2 2 2 3 3 Dec (3) 1 1 1 2 (2) 2 3 3
DRY PREC MAX TEMP MIN SUN REL CLOUD DIND PRES Jan - 1 1 1 2 (2) 2 3 3 Feb - 1 1 1 2 (2) 2 3 (3)
Márc - 1 1 1 2 (2) 2 3 (2) Ápr - 1 1 1 2 (2) 2 3 (2) Máj - 1 1 1 2 2 2 3 (2) Jún - 1 1 1 2 2 2 3 (2) Júl - 1 1 2 1 (1) 1 (1) (2) Aug - 2 2 2 1 1 1 3 (2) Szept - 1 1 1 2 2 1 3 (1) Okt - 1 1 1 2 (3) 2 3 (1) Nov - 1 1 1 2 (2) 2 3 (3) Dec - 1 1 1 2 (3) 2 3 (3)
7. táblázat
Faktor csoportok havonta a teljes (ALL) mintára, ill. a csapadékos (WET) és a száraz (DRY) napokra.
(Maximális faktorszám: 3, sajátérték > 1,0.) A táblázatban a 0.7 -es korrelációt meghaladó faktorok
sorszámait tőntettük fel, zárójelben lévı faktorok értéke 0.5 és 0.7 közötti. Azonos szín és minta jelzi a
faktoranalízis szerint megegyezı csoportba tartozó elemeket.
53
4.4 Normalitás vizsgálat
A 4.1 fejezetben ismertetett transzformáció nulla várható értékő és egységnyi szórású
sorokat hozott létre. A reziduumok normalitását azonban ellenırizni kell, egyrészt a
normalitást feltételezı próbák alkalmazhatósága, másrészt a szimuláció során alkalmazásra
kerülı eloszlások megválasztása miatt. Ismeretes, hogy a N(m,σ) eloszlású valószínőségi
változó standardizáltja N(0,1) eloszlású változó, illetve ennek fordítottja is igaz, vagyis
standard normális eloszlású változóhoz találhatók olyan paraméterek, melyek lineáris
transzformációt követıen elıállítják a keresett normális eloszlású mintát (pl. Mogyoródi,
1993). Ez a tétel lehetıvé teszi, hogy az elızı fejezetben tárgyalt módon elıállított reziduum
sorokra elvégezzük a normalitást vizsgáló próbákat, és azok eredményeit kiterjesszük az
eredeti változókra. Elsı lépésként változónként külön-külön grafikus eljárást alkalmaztunk,
majd Kolmogorov-Szmirnov próbát végeztünk, végül kiszámoltuk az egyváltozós ferdeség-
és lapultság-értékeket valamint ezek korrigált és normalizált értékeit.
Kétdimenziós normál valószínőségi görbén az X tengelyen a rendezett minta elemek
vannak feltőntetve (j=1,…,n), az Y tengelyen pedig a feltételezett nomális valószínőségi
értékek:
)]1n*3/()1j*3[(z 1j +−Φ= −
ahol Φ-1 az inverz normális kumulatív eloszlás függvény (Statistica III, 2475 old.)
Az egyenestıl vett jelentısebb eltérés arra utal, hogy a minta nem tekinthetı normális
eloszlásúnak, mint pl. napfénytartam, a felhızet és a szél reziduumok esetén - tipikusnak
tekinthetı - száraz júniusi napokon (10. ábra). Az elhajlást részben a szélsı értékek (pl. nulla
érték) nagy gyakorisága okozza. A Kolmogorov-Szmirnov próbastatisztikákat (1. Függelék)
és azok szignifikancia szintjeit ismert paraméter esetén a 8. táblázatba győjtöttük össze.
A 0,05-nál kisebb p értékek esetén azt mondjuk, hogy a hipotézist 0,95 szinten elvetjük.
A modell számára olyan változókat keresünk melyek együttes normális eloszlásúaknak
tekinthetık. Ez utóbbi feltétel kielégítésének szükséges, de nem elégséges feltétele a
peremeloszlások normálitása. A maximum hımérséklet és a légnyomás minden hónapban, a
relatív nedvesség néhány téli hónap kivételével normálisnak adódott. Ezt követıen
megvizsgáltuk, hogy ezt a három elemet valamely több dimenziós eloszlás perem
eloszlásainak tekintve, az együttes eloszlás is normálisnak tekinthetı-e.
54
Std. Max. Hõm.
Exp
ecte
d N
orm
al V
alue
-4
-3
-2
-1
0
1
2
3
4
-4 -3 -2 -1 0 1 2 3
Std. átl. hõm.
Exp
ecte
d N
orm
al V
alue
-4
-3
-2
-1
0
1
2
3
4
-3.5 -2.5 -1.5 -0.5 0.5 1.5 2.5 3.5
Std. Min. hõm.
Exp
ecte
d N
orm
al V
alue
-4
-3
-2
-1
0
1
2
3
4
-3.5 -2.5 -1.5 -0.5 0.5 1.5 2.5 3.5
Std. Rel. nedv.
Exp
ecte
d N
orm
al V
alue
-4
-3
-2
-1
0
1
2
3
4
-4 -3 -2 -1 0 1 2 3 4 5
Std. felhõzet
Exp
ecte
d N
orm
al V
alue
-4
-3
-2
-1
0
1
2
3
4
-2.5 -1.5 -0.5 0.5 1.5 2.5 3.5
Std. napfénytartam
Exp
ecte
d N
orm
al V
alue
-4
-3
-2
-1
0
1
2
3
4
-3.5 -2.5 -1.5 -0.5 0.5 1.5 2.5
Std. szél
Exp
ecte
d N
orm
al V
alue
-4
-3
-2
-1
0
1
2
3
4
-3 -2 -1 0 1 2 3 4 5 6
Std. légnyomás
Exp
ecte
d N
orm
al V
alue
-4
-3
-2
-1
0
1
2
3
4
-5 -4 -3 -2 -1 0 1 2 3 4
10. ábra
Reziduumok normál valószínőségi görbéi száraz napokon júniusban.
* DRY,° DET I II III IV V VI VII VIII IX X XI XII
SMAX
SMEAN * °°°°
*
SMIN * °°°°
* °°°°
* °°°°
* °°°°
* °°°°
SREL * °°°°
°°°°
°°°°
* °°°°
SCLOUD * °°°°
* °°°°
* °°°°
* °°°°
* °°°°
* °°°°
* °°°°
* °°°°
* °°°°
* °°°°
* °°°°
* °°°°
SSUN * °°°°
* °°°°
* °°°°
* °°°°
* °°°°
* °°°°
* °°°°
* °°°°
* °°°°
* °°°°
* °°°°
* °°°°
SDIND * °°°°
* °°°°
* °°°°
* °°°°
* °°°°
* °°°°
* °°°°
* °°°°
* °°°°
* °°°°
* °°°°
* °°°°
SPRES
8. táblázat
Ismert paraméterő Kolmogorov-Szmirnov próba alapján a normális eloszlástól
0,95 szignifikancia szinten eltérı hónapokat száraz napokon *, csapadékos napokon pedig °°°°jelöli.
55
A többváltozós normalitás tesztelése céljából a Mardia - féle többváltozós lapultságon
alapuló együtthatók (Krishnaiah, 1980) felhasználásával, a Statistica SEPATH moduljával
végeztünk különféle próbákat. A Mardia alapú kappa - becslések, valamint a relatív
többváltozós lapultság formuláit 2. Függelékben soroljuk fel. Az eredményeket a 9.a,b,c
táblázatok tartalmazzák.
I II III IV V VI VII VIII IX X XI XII
W 1,523 0,308 -0,991 0,147 0,359 0,658 -0,535 -0,094 -0,544 -0,197 -0,199 1,21
D 0,573 -0,25 -0,534 -0,589 -0,408 -0,448 -0,324 -0,089 -0,83 0,653 -0,99 -0,496
9.a táblázat
A többváltozós lapultság Mardia együtthatói havonta csapadékos (W) ill, száraz(D) napokon.
I II III IV V VI VII VIII IX X XI XII
W 3,47 0,610 -1,963 0,305 0,763 1,469 -,999 -2,543 -0,927 -0,338 -0,406 2,59
D 1,583 -0,642 -1,482 -1,556 -1,088 -1,155 -0,924 -0,257 -2,398 1,924 -2,633 -1,28
9.b táblázat
Normalizált sokváltozós lapultság együtthatói havonta csapadékos (W) ill, száraz(D) napokon.
A ±1,96-ot meghaladó értékeket vastaggal szedtük.
I II III IV V VI VII VIII IX X XI XII
W 0,102 0,021 -0,066 0,010 0,024 0,046 -0,999 -0,094 -0,036 -0,013 -0,013 0,081
D 0,038 -0,017 -0,036 -0,039 -0,027 -0,03 -0,022 -0,006 -0,055 0,044 -0,066 -0,033
9.c táblázat
Mardia-alapú kappa értékek együtthatói havonta csapadékos (W) ill. száraz (D) napokon.
A többváltozós lapultság Mardia együtthatói, amelyeknek többváltozós normális
eloszlás esetén zérushoz közeli értékeknek kellene lenniük, a 9.a táblázat szerint - 0,991 és
1,523 között változnak. A normalizált sokváltozós lapultság együtthatókra a ±1,96
konfidencia intervallumba tartozó értékek esetén a hónapok többségénél 0,95 szinten nem
jutunk ellentmondásra a hipotézissel. A Mardia-alapú kappa értékek többváltozós normális
eloszlás esetén zérushoz közeliek, így e teszt alapján is elfogadhatjuk a mullhipotézist,
miszerint a maximum hımérséklet, a relatív nedvesség és a légnyomás együttesen normális
eloszlásúnak tekinthetık.
56
4.5 Feltételes korreláció és autokorreláció
A különbözı változók közötti lineáris kapcsolatokat a kereszt korrelációs mátrix, az
azonos valószínőségi változók egymást követı értékei közötti összefüggéseket, azaz a
sorokon belüli függıséget, pedig az autokorrelációs mátrix segítségével lehet számszerősíteni.
A reziduum sorok alapján számítottuk ki ezeket a feltételes statisztikákat. A 11. ábra
illusztrálja, a maximum hmérsékletnek a többi változóval vett kereszt korrelációs együtthatók
száraz napokon havonta. Az átlaggal vett szoros lineáris kapcsolattól eltekintve nem
elhanyagolható éves menet.
11. ábra
Maximum hımérséklet többi elemmel vett korrelációs együtthatói havonta száraz napokon.
Az idısorokon belüli, egy napos késleltetéső autokorrelációk rendszerint szintén nem
hagyhatók figyelmen kívül. Mivel a száraz és csapadékos idıszakok váltakozása miatt a minta
nem összefüggı, célszerő az egymást követı napok közötti korrelációkat, illetve a váltásokat
típusonként külön megvizsgálni. Ez okból havonta végeztük a számításokat száraz (i=1) ill.,
csapadékos (i=2) szériákban valamint a tetszıleges hosszúságú csapadékos (ill. száraz)
szériák utolsó és tetszıleges tartamú száraz (ill. csapadékos) szériák elsı napjaira (i=3 ill.
i=4).
57
Vizsgáltuk tehát a ξ = ξijk(t) valószínőségi változót, ahol j = 1, 2, 3 az elızı fejezet
eredményeinek figyelembe vételével kiválasztott elemeket jelöli, sorrendben a maximum
hımérsékletet, a relatív nedvességet ill. a légnyomást, A hónapot k, a tetszıleges hosszúságú
száraz vagy csapadékos tartamon belül a nap sorszámát pedig t jelöli. Például ξ = ξ111(t=1)
jelöli a száraz idıszak maximum hımérsékletét januárban, a tetszıleges hosszúságú ilyen
szakasz elsı napján.
A mintaszámok a tartamhosszal rohamosan (közel exponenciálisan) csökkenek
(12 ábra teteje). Ezt figyelembe véve, 1- 4 napos tartamokra végeztük el a számításokat.
Bevezettük az η=ξijk(t-1) jelölést az egy nappal korábbi mintaelemekre, Ekkor adott feltételek
mellett az n1 mintaszámot a két minta hosszának minimuma határozza meg, Tekintsük tehát a
(ξ,η) valószínőségi változó párra vett n1 elemő mintát, A változó párok korrelációs
együtthatóit jelölje R1=R1(ξ,η), becslésüket pedig ρ1 ≈ R1 :
( )( )
( ) ( )∑∑
∑
==
=
η−ηξ−ξ
η−ηξ−ξ=ρ
n
1i
2i
n
1i
2i
n
1iii
1
ahol
∑∑==
η=ηξ=ξ11 n
1ii
1
n
1ii
1 n
1ill
n
1. ,
A nagyszámú eredmény szemléletes áttekintése céljából a 12. ábrán a váltást jellemzı
(DW ill. WD) korrelációkat, majd a száraz tartamon belüli együtthatókat egymás mellett
ábrázoltuk. Az azonos skálabeosztás miatt a bal oldali ábrákon látható száraz esetekre
nagyobb együtthatók jellemzık, mint a csapadékos szériákban. Az eltérés egy-egy görbe
mentén rendszerint néhány tized, szigorúan véve mégsem összemérhetık a korrelációk
tekintettel arra, hogy az X tengely mentén feltőntetett együtthatók eltérı nagyságú mintákból
származnak, és emiatt az együtthatók becslésébıl adódó konfidencia intervallumok is
különböznek. A két tapasztalati korrelációs együttható azonosságának tesztelésére a
mintaszámot is figyelembe vevı u próbát alkalmaztunk, ld. Vincze (1975) az alábbi módon.
A fentiek szerint definiáljuk a (ξ,ω) változópárt, ahol legyen ξ=ξijk(t) és ω=ξijk(t+1);
a mintaszámot jelölje n2, a korrelációs együtthatót R2=R2(ξ,ω), becslését pedig ρ2,
A nullhipotézis szerint: H0: R1 = R2,
58
A becslések ismeretében elıállítjuk az alábbi valószínőségi változókat:
2
22
1
11 1
1
2
1Zill
1
1
2
1Z
ρ−ρ+
=ρ−ρ+
= ln.ln ,
Ezek jó közelítéssel normális eloszlásúnak tekinthetık és a mullhipotézis fennállása esetén
várható értékeik azonosak, ezért az alábbi u statisztika N(0,1) eloszlású.
3n
1
3n
1
ZZu
21
21
−+
−
−=
Az u próba értékeit részben a 10. táblázat tartalmazza. Amennyiben a próbastatisztika
értéke a (-2, +2) intervallumba esik, akkor 0,98-as szinten elfogadjuk a mullhipotézist, amely
szerint a két korrelációs együttható megegyezik. Az u értékek alapján szignifikáns eltérés
leggyakrabban a maximum hımérsékleteknél fordul elı a típusváltások alkalmával (4 - 4
hónapban), Ugyanakkor, a tartamokon belüli korrelációk azonban (egy-egy hónaptól
eltekintve) állandónak vehetık,
Ismeretes, hogy a gyenge értelemben vett stacionárius folyamatok esetén a második
momentumok végesek, a kovarianciák pedig invariánsak az idıeltolással szemben (Karlin és
Taylor, 1986), Mivel egységnyi szórású sorokat használunk, a kovarianciák megegyeznek a
korrelációkkal, A fenti vizsgálat eredményei szerint az egy napos eltolással kapott idısorok
esetén nincs jelentısége annak, hogy az adott típuson belüli tartam melyik részét vesszük.
Tehát adott tartamon belüli folyamat gyengén stacionáriusnak tekinthetı.
59
0
50
100
150
200
250
300
DW D2 D3 D4 D5
I
II
III
IV
V
VI
VII
VIII
IX
X
XI
XII
0.4
0.5
0.6
0.7
0.8
0.9
1.0
DW D1_2 D2_3 D3_4 D4_5
0.4
0.5
0.6
0.7
0.8
0.9
1.0
DW D1_2 D2_3 D3_4 D4_5
0.4
0.5
0.6
0.7
0.8
0.9
1.0
DW D1_2 D2_3 D3_4 D4_5
0
50
100
150
200
250
300
WD W2 W3 W4 W5
I
II
III
IV
V
VI
VII
VIII
IX
X
XI
XII
0.4
0.5
0.6
0.7
0.8
0.9
1.0
WD W1_2 W2_3 W3_4 W4_5
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
WD W1_2 W2_3 W3_4 W4_5
0.4
0.5
0.6
0.7
0.8
0.9
1.0
WD W1_2 W2_3 W3_4 W4_5
MINTASZÁM
MAXIMUM HÕMÉRSÉKLET
RELATÍV NEDVESSÉG
LÉGNYOMÁS
SZÁRAZ CSAPADÉKOS
12. ábra
Az egy napos késleltetéső autokorrelációs együtthatók értékei havonta a száraz (bal) és a
csapadékos (jobb) idıszakokban, ill. típus-váltáskor.
60
DRY Maximum hımérséklet Relatív nedvesség Légnyomás Korreláció
Párok WD &
D1_2
D1_2&
D2_3
D2_3&
D3_4
D3_4 &
D4_5
WD &
D1_2
D1_2&
D2_3
D2_3&
D3_4
D3_4&
D4_5
WD &
D1_2
D1_2&
D2_3
D2_3&
D3_4
D3_4&
D4_5
I 1,92 1,37 -0,20 0,19 -0,14 0,61 -0,99 -0,67 -1,63 -0,50 0,92 0,30
II 0,67 -1,05 -0,49 -1,47 -0,15 0,11 -0,40 1,09 -0,48 0,86 0,71 0,15
III 0,54 0,97 0,44 0,00 -3,22 1,27 0,50 0,43 -1,13 0,00 -0,38 0,97
IV -0,88 1,12 0,40 0,35 0,28 1,69 -1,45 -1,37 -1,09 0,64 1,60 0,50
V -2,00 -0,76 -0,41 0,00 -2,72 1,31 2,25 0,43 0,42 0,34 -1,16 -0,74
VI 0,28 1,89 0,79 0,00 -2,88 -0,83 -0,11 0,2 0,38 0,15 0,38 -0,78
VII -2,47 -0,26 0,41 1,18 -1,22 0,69 1,96 1,44 -1,89 -0,97 0,97 -0,32
VIII -1,88 0,78 -2,99 -2,14 -2,91 0,00 -0,94 -0,95 0,19 0,71 -0,68 -1,23
IX -2,68 0,00 -0,50 -1,36 -0,99 1,43 -0,36 -0,75 -2,00 -0,88 1,15 1,12
X -1,01 0,00 -0,55 0,55 0,15 1,23 1,31 2,00 -0,23 0,22 1,49 0,26
XI 0,80 0,65 -1,54 -0,98 1,50 1,73 0,82 -0,47 -0,84 0,39 0,52 -1,78
XII -0,29 0,00 -0,39 -1,16 1,76 0,19 0,00 0,81 -0,24 1,81 1,19 0,46
DRY Maximum hımérséklet Relatív nedvesség Légnyomás Korreláció
Párok DW &
W1_2
W1_2&
W2_3
W2_3&
W3_4
W3_4 &
W4_5
DW &
W1_2
W1_2&
W2_3
W2_3&
W3_4
W3_4&
W4_5
DW &
W1_2
W1_2&
W2_3
W2_3&
W3_4
W3_4&
W4_5
I -0,60 -1,62 -1,91 0,32 1,59 2,28 1,89 1,18 0,22 0,22 -0,43 -0,24
II 0,26 -0,18 -1,13 -1,46 1,67 -1,45 -1,95 0,75 -0,73 -0,73 -0,86 -0,19
III 0,18 0,13 -0,87 1,00 0,37 -0,66 0,00 -0,94 0,55 0,36 -0,36 0,32
IV 0,28 1,20 -1,04 0,38 1,95 -1,10 -0,39 0,52 0,36 0,36 -0,12 -0,24
V -3,18 -1,98 -1,81 -0,33 0,68 0,94 1,49 0,27 1,82 2,25 1,81 0,36
VI 0,44 0,40 -2,00 0,20 0,92 1,15 0,91 0,46 0,18 0,18 0,38 -0,80
VII -3,19 -1,13 -0,75 -0,44 2,01 1,53 0,12 -1,12 -0,16 -0,46 1,46 1,55
VIII -0,87 0,33 -2,07 -0,59 0,43 0,29 -1,15 0,30 0,79 0,65 1,41 2,08 IX -0,74 0,78 0,53 1,46 1,31 -0,27 -0,94 1,14 -0,55 -1,05 0,00 0,67
X 0,58 0,94 -1,53 -0,58 0,86 0,29 -0,08 -0,59 0,32 0,67 0,00 -0,53
XI -2,67 -1,18 -0,56 0,91 0,60 1,56 0,57 -0,29 1,01 0,39 1,29 0,24
XII 2,18 0,98 -0,34 0,00 1,02 -0,18 -1,17 -0,35 1,10 0,00 0,82 -0,30
10. táblázat
Az u próba értékei száraz ill. csapadékos idıszakokban
Jelölés:
DD : tetszıleges hosszúságú száraz szériák utolsó és rá a következı csapadékos széria elsı napjai
közti korrelációk adott elemre, adott hónapban.
D1_2: legalább két napos száraz szériák elsı és második napjai közötti korrelációk.
D2_3: legalább három napos száraz szériák második és harmadik napjai közti korrelációk.
D3_4: legalább négy napos száraz szériák harmadik és negyedik napjai közti korrelációk.
D4_5: legalább öt napos száraz szériák negyedik és ötödik napjai közötti korrelációk.
61
5. A modellfejlesztés lépései
5.1 Kísérlet együttes autoregresszív modellezésre
(Néhány negatív eredménnyel járó kísérlet tapasztalatai.)
Többváltozós idısorok elıállítására a meteorológiai szakirodalomban gyakorta
alkalmaznak elsırendő autoregresszív folyamatot, mely adott kereszt- és egy lépéses
korrelációval rendelkezı idısorokat eredményez. (Ennek a megközelítésnek a hibáit már
korábban elemeztük.) A száraz ill. csapadékos feltételek mellett a maximum hımérséklet, a
relatív nedvesség és légnyomás idısorok elıállítására programot készítettünk és a
paramétereket havonként becsültük. A felhasznált módszer leírását Richardson (1981) cikke
alapján 3. Függelék tartalmazza. Az említett három változó esetén a számítás eredményeinek
illusztrálására a 11. táblázatban megmutatjuk a megfigyelt minták közötti, valamint néhány
szimulációval elıállított idısoron belüli korrelációkat. A kereszt korrelációk
összehasonlítására Füstös és Kovács (1989, 99-100 old.) által ajánlott t-eloszlást használtuk.
A mőveleteket megismételtük a maximum, minimum és átlag hımérsékletekkel, ekkor
a minimum értékek között sok esetben indokolatlan nagyság szerinti relációk (pl. a
minimumnál alacsonyabb napi átlag) léptek fel. Más változó hármasokra kapott generált
idısorok gyakoriságai, különösen a korlátos elemeknél (pl. csapadék, napfénytartam) erısen
eltértek a valódi értékektıl és gyakran irreális értékek (pl. negatív csapadékösszeg) fordultak
elı. Ebbıl azt a következtetést vontuk le, az említett autoregresszív folyamat ebben a
formában a kilenc változóra nem terjeszthetı ki.
Kísérletet tettünk a fennmaradó hat elem elıállítására a fenti három, jól modellezhetı
paraméterhez, mint független változókhoz kapcsolódó, különféle regressziós eljárások
felhasználásával. A maximum hımérséklet, a relatív nedvesség és légnyomás idısoraira
egyváltozós, háromváltozós, a szórás korrekciójára szolgáló ún. “inflated” (Kaas,1993)
valamint többszörös lineáris regressziót illesztettünk. E próbálkozások azonban nem vezettek
sikerre: mindegyik számítás hasonló eredményt adott, a korrelációk és az autokorrelációk
minden esetben jelentısen magasabbak lettek a valódiaknál. Mivel ezt a módszert teljesen el
kellett vetnünk, a részeredményekre sem kívánunk részletesebben kitérni.
62
SZÁRAZ CSAPADÉKOS Obs. Gen.1 Gen.2 Obs. Gen.1 Gen.2
I -0,13 -0,01 -0,06 -0,10 0,03 -0,08 II -0,17 -0,15 -0,16 -0,30 -0,28 -0,15 III -0,37 -0,29 -0,36 -0,51 -0,48 -0,45 IV -0,34 -0,27 -0,30 -0,50 -0,47 -0,48 V -0,22 -0,14 -0,19 -0,55 -0,56 -0,53 VI -0,19 -0,15 -0,16 -0,46 -0,42 -0,36 VII -0,33 -0,27 -0,26 -0,56 -0,47 -0,50 VIII -0,47 -0,45 -0,45 -0,61 -0,56 -0,54 IX -0,16 -0,13 -0,16 -0,50 -0,43 -0,46 X -0,12 -0,03 -0,20 -0,47 -0,38 -0,39 XI -0,23 -0,19 -0,25 -0,47 -0,48 -0,41
Max
imum
hım
érsé
klet
, R
elat
ív n
edve
sség
XII -0,19 -0,17 -0,17 -0,32 -0,25 -0,22 I 0,08 0,03 0,02 0,07 0,01 0,09 II 0,03 0,08 0,08 0,12 0,14 0,10 III -0,02 -0,06 0,04 0,04 0,15 0,02 IV -0,11 -0,15 -0,12 -0,03 -0,04 -0,00 V -0,17 -0,13 -0,17 -0,09 -0,02 -0,05 VI -0,23 -0,23 -0,20 -0,14 -0,15 -0,07 VII -0,17 -0,17 -0,17 -0,21 -0,19 -0,24 VIII 0,00 0,03 -0,06 -0,11 -0,14 -0,13 IX -0,10 -0,11 -0,09 -0,04 -0,03 -0,05 X -0,03 -0,08 0,01 0,01 -0,03 0,02 XI 0,10 0,13 0,13 0,26 0,27 0,25
Rel
atív
ned
vess
ég,
Légn
yom
ás
XII 0,16 0,17 0,15 0,19 0,18 0,17 I -0,33 -0,32 -0,33 -0,43 -0,35 -0,43 II -0,32 -0,29 -0,42 -0,36 -0,35 -0,36 III -0,21 -0,21 -0,30 -0,29 -0,33 -0,29 IV -0,16 -0,19 -0,20 -0,27 -0,19 -0,23 V -0,17 -0,12 -0,11 -0,07 -0,11 -0,12 VI -0,06 -0,04 -0,01 0,00 0,05 -0,10 VII -0,12 -0,14 -0,14 -0,07 -0,13 -0,02 VIII -0,24 -0,21 -0,23 -0,06 -0,04 -0,10 IX -0,31 -0,27 -0,32 -0,30 -0,23 -0,27 X -0,41 -0,41 -0,39 -0,30 -0,23 -0,32 XI -0,43 -0,44 -0,36 -0,44 -0,41 -0,42
Légn
yom
ás,
Max
imum
hım
érsé
klet
XII -0,35 -0,34 -0,30 -0,40 -0,40 -0,39
11. táblázat
Autoregresszív folyamat alkalmazásával elıállított két véletlen szimuláció (Gen1, Gen2) és a
transzformált valódi (Obs) minták közötti kereszt korrelációk.
A 0,95 szinten szignifikáns eltéréseket vastagított számok jelzik.
63
5.2 Modellezés Johnson eloszlással
Olyan eljárást kerestünk, amely mind az összes vizsgált változót együttesen képes
elıállítani. Az elızı fejezetekben megmutattuk, hogy a meteorológiai elemek feltételes
eloszlásához a normális eloszlás rendszerint nem illeszkedik megfelelıen. Hayhoe (2000)
megemlíti, hogy a nem normális eloszlások esetén célszerő Johnson transzformációt
alkalmazni, amely a valószínőségi változók eléggé bı osztályára az eloszlásokat klasszikus
eljárásokkal kezelhetı standard normális eloszlásúvá alakítja.
Az egyváltozós eset leírását megtaláljuk Hahn és Shapiro (1967), Slifker és Shapiro
(1980) munkájában, a többváltozós transzformációt Stanfield és mtsai. (1996) szimulációs
konferenciára készült publikációjában. Ez utóbbi tartalmazza a módszernek egyfajta
kibıvítését, amely lehetıvé teszi, hogy az eloszlások széles osztályára többváltozós
idısorokat állítsunk elı az átlag, a szórás, a ferdeség, a lapultság és az elemek közötti
korrelációk megırzésével. Az eredetileg biomechanikai vizsgálatok céljára kifejlesztett
modellt meteorológiai idısorokra alkalmaztuk. Tapasztaltuk, hogy a 2. Függelékben
ismertetett módszerrel elıállíthatók olyan számsorok, melyek a felsorolt paraméterekben
megegyeznek a bemenı adatként használt minták paramétereivel. Ugyanakkor az eljárás nem
biztosította a megfelelı változók idısorán belüli korrelációt, ami így nem is teljesült a
szimulált adatsorokban.
A vázolt hosszadalmas kísérletezés eredményeit összegezve jutottunk el a
megoldáshoz. Felhasználtuk az autoregresszív folyamatnak azon tulajdonságát, miszerint a
kereszt-korrelációk és az egy lépéses autokorrelációk megırzıdnek a folyamat alkalmazása
során, továbbá figyelembe vettük azt a felismerést, hogy a Stanfield és munkatársai által
kidolgozott Johnson transzformáció kibıvített változata -a 4. fejezetben ismertetett
transzformált sorra alkalmazva is- képes elıállítani adott ferdeségő és lapultságú többváltozós
idısorokat. Arra a következtetésre jutottunk tehát, hogy a két módszer egyidejő alkalmazására
van szükség. Amennyiben a többváltozós folyamat zaj tagja nem véletlen fehér zaj, hanem
nulla várható értékő, egy szórású, adott ferdeségő és lapultságú Johnson eloszlású véletlen
szám, a szimulált kilenc (a száraz napokon csak nyolc) változós minták megfelelıen
reprodukálják a megkívánt statisztikákat (ferdeség, lapultság, korreláció, egy lépéses
autokorreláció).
64
6. Idıjárás generátor modell és szimuláció
Az X folyamatot akarjuk modellezni a száraz és csapadékos napokra külön-külön az
alábbi módon. Jelölje X = {X i (t,j), i=1...9} vektor az i-ik meteorológiai elem realizációi,
ahol t=1,...365 a nap éven belüli sorszáma, j=1...45 pedig az év száma. Belátható, hogy az
adathalmaz felbontható a száraz (D) és a csapadékos (W) napok diszjunkt halmazaira:
X=XD∪XW és XD∩XW=0
A 3.1 fejezetben igazoltuk, hogy az egymást követı szériák elsı és másodrendben is
függetlenek, ezért a paramétereket száraz ill csapadékos idıszakokra külön-külön, havonként
becsüljük a mintából. A száraz ill. csapadékos szériák sorozatait (amiket 3. fejezetben
definiálunk) a többi elemtıl függetlenül a Poisson és geometriai eloszlások keverék
eloszlással modelleztük ( 3.2 fejezet):
λλλλλλλλξξξξ −−
−
−⋅−+−⋅⋅== e
1ks1q1qskP
1k1k
2 )!()()()(
k=1,2,…n és ahol s a keveréket alkotó geometriai eloszlás súlytényezıje. Az eloszlások
paramétereit és a súlytényezıket kvázi-Newton módszerrel (Statistica for Windows Time
Series modul) becsüljük a négyzetes eltérést minimalizáló veszteség-függvény mellett.
A többváltozós folyamat egymástól független száraz és csapadékos sorozatainak
modellezésére az alábbi feltételes autoregresszív folyamatot alkalmaztunk:
n1iηBAYY 1ii1i ,...=+= ++
ahol Yi , Yi+1 és ηi+1 zérus várható értékő vektorok, ηi az Yi-tıl független többváltozós
Johnson eloszlású változó. Az A és B mátrix kiszámítási módja:
A = C1C0-1.
T1
1010
TBB CCCC −−=
ahol C0=E(Yi, YiT) és C1= E(Yi+1, Yi
T) (m×m)-es mátrixok. C0 kovariancia mátrix, amely
fıátlójában a szórásnégyzeteket tartalmazza, C1 fıátlójában az egy lépéses autokovarianciák,
a többi helyen az egy lépéses kereszt kovarianciák állnak. A spektrális felbontási tétel
felhasználásával kapjuk, hogy B= ΘΛΘT ahol Θ a sajátvektorokat, Λ a sajátértékeket jelöli.
Az A és B mátrixok biztosítják a kereszt korrelációk és az egy lépéses autokorrelációk
reprodukálását.
65
A zaj tagot a szimuláció során véletlen szám generátorral elıállított standard normális
eloszlású változóból az inverz transzformáció segítségével állíthatjuk elı:
−⋅+= −
δδδδγγγγλλλλξξξξηηηη Z1g
ahol
+
−=
−
−
családnormálisSz
családkorlátosSe11
családkorlátlanS2ee
családnormálislogSe
z
N
Bz
Uzz
Lz
)(
)()/(
)(/)(
)(
)g(
A ferdeség és lapultság becslésére többféle képlet használatos. Ezek közül a Stanfield féle
módszer az alábbi alakot alkalmazza:
3
N
1j
3j
XN
)XX(
aσ
−=∑
= és 4
N
1j
4j
XN
)XX(
bσ
−=∑
=
Az η valószínőségi változó aX ferdeség és bX lapultság vektorának ismeretében a
következı módon állítható elı az aηηηη és bηηηη vektor:
[ ] XX aΘa13 −
= )(ηηηη (6a)
[ ] )()(XXX ΨbΘb −=
−14ηηηη (6b)
ahol ΘΘΘΘX jelöli a k-adik Hadamard szorzatot, ΨΨΨΨX = (Ψ1,…,Ψν) pedig a segédvektort.
Definíció szerint (Kitamura, 1995; Styan, 1973) ΘΘΘΘX(k) = [Θi,j
(k)], ahol k = 3, 4,
illetve ∑ ∑ν
=
ν
+=ΘΘ=Ψ
1j 1jl
2l,i
2j,ii 6 és i = 1,…ν. W illeszkedésének jóságát meghatározza
Y elıállítása. Stanfield és munkatársai szerint amikor bηηηη ≥ ay(2) + 1 korrekciót kell
végrehajtani, bηηηη := ay(2) + 1,25.
A szimulált Zt sor elıállítása a 4.2 fejezetben leírt eljárással történt, majd a korlátos
változók értékkészletein kívül esést biztosan megakadályozó csonkítást végeztünk. Erre
ritkán, a paraméterbecslés pontatlanságai ill. kerekítései miatt volt szükség.
66
7. Verifikáció
A dolgozatban feladatának a modell elméleti megalapozását tekintettük emiatt
elegendınek találtuk néhány hónapra illusztrálni a generátor mőködését. A felhasznált
számítási eljárás sem tette lehetıvé a teljes idısor tesztelhetıségét. A csapadék tartam
szimulációs részt a 3. fejezetben már ellenıriztük. Ebben a részben a 4.1. fejezetben
ismertetett transzformációkkal elıállított idısorok paramétereit tekintettük bemenı adatnak, a
januári és a júniusi száraz ill. csapadékos mintákkal teszteltük az elızı fejezetben leírt
képletekkel elıállított folyamatot. A számításokat a Statistica for Windows programcsomag
felületén alkalmazható Statistica Basic valamint Fortran szubrutinok meghívásával oldottuk
meg az alábbi lépések szerint:
1. A 4.1 fejezetben leírt módon transzformált mintára µX, σ X, C0, C1, A, B, Θ X, aX és bX
kiszámítása.
2. Az aηηηη és bηηηη értékek meghatározása minden változóra, szükség esetén bηηηη korrekciója.
3. Johnson eloszlás paramétereinek (γ, δ, λ, ξ) meghatározása AS99 algoritmus
alkalmazásával .(Prog. Algorithm, 1976).
4. Y elıállítása: standard normális eloszlású véletlen számsor szimulációja véletlen szám
generátorral, majd ezt követıen az AS100 algoritmus (Prog. Algorithm, 1976).
felhasználásával standardizált aX és bX ferdeségő és lapultságú Johnson eloszlásúvá történı
transzformációja.
5. A folyamat elıállítása a feltételes autoregresszív modellel.
6. Inverz centrálás és standardizálás és az eloszlások csonkítása.
A modellel történı szimulációt a júniusi száraz és csapadékos mintákkal illusztráljuk.
A 12. táblázat a aX, bX, aηηηη, bηηηη, γγγγ, δδδδ, λλλλ, ξξξξ értékeit paramétereket tartalmazza. A 13. táblázatban a
száraz júniusi minta és a szimulált sor átlagainak t-próbával történt összehasonlítása. A 14.
ábra a valódi és a szimulált, csonkított minták gyakorisági eloszlásait mutatja. Különösen a
korlátos értékkészlető idısorokra (pl. csapadék, napfénytartam) jellemzı gyakoriságok jelzik
látványosan a változtatás lényegét, a szimulált sorok eloszlása az utóbbi esetben sokkal
jobban közelíti a valódi adatsorokét, mivel a megadott módon végzett szimuláció a ferdeség
és lapultság értéit pontosabban állítja be. A 14. táblázat a korrelációkat tartalmazza a szintelen
mezıkben a valódi, a színezettekben egy januári csapadékos szimulációban.
67
WET aX bX aY bY γ δ λ ξ típus zmin -0,278 2,600 -0,278 2,600 -0,663 1,553 7,014 -4,183 3 zsun 0,166 2,131 0,171 2,100 0,220 0,944 4,641 -2,101 3 zrel -0,271 2,728 -0,459 2,620 -0,87 1,901 8,432 -5,108 3
ztemp -0,242 2,711 -2,317 -1,393 -0,791 1,925 8,459 -5,037 3 zcloud -0,497 2,822 -2,279 5,139 -1,076 1,448 7,040 -4,660 3 zmax -0,333 2,897 -2,640 7,842 -1,448 2,291 10,412 -6,735 3 zwind 1,252 5,984 1,555 7,917 -4,694 2,525 0,685 -2,32 2 zpres -0,180 3,345 -0,194 3,409 0,859 3,839 3,616 0,843 2 zprec 2,42 10,303 2,741 11,593 2,156 0,751 8,739 -0,835 3 DRY aX bX aηηηη bηηηη γ δ λ ξ típus Zmin -0,169 2,727 -0,169 2,727 0,100 0,840 4,259 -2,13 3 Zsun -1,017 3,705 -1,019 3,707 -1,426 1,032 6,344 -4,837 3 Zrel 0,173 3,185 0,139 3,248 -0,889 4,414 4,214 -0,877 2
Ztemp -0,117 2,406 0,022 -4,813 -0,236 1,369 6,144 -3,307 3 zcloud 0,249 2,319 -0,937 -3,563 -3,879 3,374 -1,00 3,300 1 Zmax -0,218 2,549 -0,216 2,539 -0,517 1,547 6,904 -3,97 3 Zwind 0,872 3,808 1,859 7,706 2,606 1,085 1,082 -1,214 3 Zpres -0,139 0,022 -0,164 3,026 -0,107 0,162 2,316 -1,253 3
12. táblázat
Júniusi csapadékos és száraz napokra a transzformált mintából számított paraméterek
aX, bX, aηηηη bηηηη , γγγγ, δδδδ, λλλλ, ξξξξ értékei és a Johnson eloszlás típusa. (1=SL, 2=SU, 3=SB, 4=SN)
DRY JUN Obs Gen t p
Zmin 13,8 13,9 -0,45 0,65
Zsun 5,7 5,9 -0,75 0,45
Zrel 74,8 74,9 -0,08 0,93
Ztemp 18,5 18,7 -0,97 0,32
Zcloud 5,6 5,5 0,36 0,71
Zmax 24,5 24,7 -1,17 0,23
Zwind 3,2 3,2 0,82 0,41
Zpres 1012,1 1012,1 0,06 0,94
Zprec 5,71 7,8 -0,03 0,97
13. táblázat
Valódi (Obs) és egy szimulált (Gen) minta átlagai, valamint a t-próba értékei
száraz napokon júniusban (df=551).
68
14. ábra
A megfigyelt és a szimulált értékeke gyakoriságai
WET JAN MIN SUN REL TEMP CLOUD MAXI WIND PRES PREC
SMIN 1,00 -0,11 0,07 0,94 0,19 0,84 0,18 -0,37 0,11
SSUN -0,22 1,00 -0,34 -0,03 -0,65 0,11 0,05 0,02 -0,15
SREL 0,08 -0,38 1,00 -0,00 0,30 -0,11 -0,34 0,01 0,19
STEMP 0,93 -0,13 -0,00 1,00 0,09 0,95 0,22 -0,41 0,12
SCLOUD 0,26 -0,65 0,34 0,15 1,00 -0,06 -0,04 -0,05 0,17
SMAXI 0,81 0,03 -0,11 0,94 -0,02 1,00 0,25 -0,42 0,08
SWIND 0,17 0,06 -0,38 0,21 -0,11 0,28 1,00 -0,41 0,11
SPRES -0,34 0,08 0,02 -0,38 -0,08 -0,40 -0,35 1,00 -0,27
SPREC 0,16 -0,17 0,18 0,19 0,14 0,13 0,01 -0,23 1,00
14. táblázat
A kereszt korrelációk a megfigyelt és a szimulált (szürke cellákban) adatok között,
csapadékos januári napokon.
69
1. Függelék
Egyváltozós normalitás vizsgálat Kolmogorov –Szmirnov próbával. A részeredményeinek illusztrációja.
data file: 550C5195.STA [ 16425 cases Dith 67 varia bles ] STAT. Kolmogorov-Smirnov Test (550c5195.sta) BASIC (Mean & standard deviation knoDn) STATS DRY Jan Variable N max D p SMAX 915 .034497 p > .20 STEMP 915 * .083761 * p < .01 * SMIN 915 * .109548 * p < .01 * SSUN 915 * .161563 * p < .01 * SREL 915 * .060911 * p < .01 * SCLOUD 915 * .082571 * p < .01 * SDIND 915 * .119581 * p < .01 * SPRES 915 .024819 p > .20 STAT. Kolmogorov-Smirnov Test (550c5195.sta) BASIC (Mean & standard deviation knoDn) STATS DRY Feb Variable N max D p SMAX 790 .027607 p > .20 STEMP 790 .047575 p < .10 SMIN 790 * .086462 * p < .01 * SSUN 790 * .112519 * p < .01 * SREL 790 .038303 p < .20 SCLOUD 790 * .069120 * p < .01 * SDIND 790 * .092623 * p < .01 * SPRES 790 .023426 p > .20 STAT. Kolmogorov-Smirnov Test (550c5195.sta) BASIC (Mean & standard deviation knoDn) STATS DRY Márc Variable N max D p SMAX 924 .025860 p > .20 STEMP 924 .024595 p > .20 SMIN 924 .037197 p < .20 SSUN 924 * .111845 * p < .01 * SREL 924 .023274 p > .20 SCLOUD 924 * .054599 * p < .01 * SDIND 924 * .101496 * p < .01 * SPRES 924 .025325 p > .20 STAT. Kolmogorov-Smirnov Test (550c5195.sta) BASIC (Mean & standard deviation knoDn) STATS DRY Márc Variable N max D p SMAX 838 .035848 p > .20 STEMP 838 .035918 p > .20 SMIN 838 .021800 p > .20 SSUN 838 * .107393 * p < .01 * SREL 838 .028970 p > .20 SCLOUD 838 * .055106 * p < .05 * SDIND 838 * .092653 * p < .01 * SPRES 838 .031989 p > .20
70
2. Függelék
Egy- és többváltozós normalitás vizsgálatnál alkalmazott tesztek.
Egyváltozós ferdeség a j-edik változóra:
3N
1i
2jij
N
1i
3jij
j1
)XX(N
)XX(N
−
−=γ
∑
∑
=•
=•
ahol X•j jelöli a változó átlagát és s2j a szórásnégyzetét:
∑=
• =N
1iijj X
N
1X ∑
=•−=
N
1ijij
2j )XX(
N
1s
Egyváltozós lapultság a j-edik változóra:
3)XX(N
)XX(N
2N
1i
2jij
N
1i
4jij
j2
−
−
−=γ
∑
∑
=•
=•
a fenti formulák alkalmazásával a Mardia fél együtthatók kiszámítása:
∑=
− +−−′−=γN
1i
2i
1i2 )2p(p)}xx(S)xx{(
N
1
ahol xi az i-edik megfigyeléseket tartalmazó vektor, x a mintaátlag, p a megfigyelések
száma és S a minta kovariancia mátrixa.
A normalizált többváltozós lapultság definiciója: N/)2p(p8
20 +
γ=κ .
A Mardia alapú kappa számítási módja: )2p(p
21 +
γ=κ .
71
3. Függelék Az AR(1) folyamat paraméterbecslése
A többváltozós gyengén stacionárius folyamaton alapuló elsırendő autoregresszív
folyamat definíciója (Matalas, 1967):
n,...1iBAXX 1ii1i =ε+= ++
ahol Xi, Xi+1 és εi+1 zérus várható értékő vektorok, εi független az Xi-tıl. Az egyenlet mindkét
oldalát megszorozva XiT-vel és képezve a várható értékét, a következı összefüggést kapjuk:
)X(BE)XX(AE)XX(E Ti,1i
Ti,i
Ti,1i ++ ε+= .
Vezessük be az alábbi jelöléseket: C0=E(Xi, XiT) és C1= E(Xi+1, Xi
T) (m×m)-es mátrixok.
C0 kovariancia mátrix, amely fıátlójában a szórásnégyzeteket tartalmazza, C1 fıátlójában az
egy lépéses autokovarianciák, a többi helyen az egy lépéses kereszt kovarianciák állnak.
Az A mátrix kiszámítási módja:
A=C1C0-1.
B mátrix becslését Xi+1T-vel való szorzást követıen - az elıbbihez hasonló módon - kapjuk,
az egyenlet átrendezésével az alábbi alakhoz jutunk:
T1
1010
T CCCCBB −−=
A spektrálfelbontási tétel felhasználásával kapjuk, hogy
B= ΘΛΘT
ahol Θ a sajátvektorokat, Λ a sajátértékeket jelöli.
72
4. Függelék
Egy- és többváltozós Johnson eloszlás és ezek a kiterjesztett változata
Ismeretlen eloszlású folytonos valószínőségi változó (X) Johnson transzformációval
standard normális eloszlásúvá alakítható. A transzformáció általános alakja:
λξ−⋅δ+γ= X
gZ (1)
ahol X tetszıleges eloszlású folytonos valószínőségi változó, Z standard normális eloszlású,
γ és δ az alak, λ a skála, ξ a hely paraméter, g(⋅) pedig olyan függvény, amely a Johnson féle
transzformációs rendszerben négy eloszlás családot definiál:
−++=
család)normális(Sy
család)korlátos(S)]y1/(yln[
család)korlátlan(S]1yyln[
család)normális(logS)yln(
)y(g
N
B
U2
L
(2)
A szimuláció során véletlen számmal generált standard normális eloszlású változóból az
inverz transzformáció segítségével állíthatjuk elı X-et:
δγ−⋅λ+ξ= − Z
gX 1 (3)
ahol
+
−=
−
−
család)normális(Sz
család)korlátos(S)e1/(1
család)korlátlan(S2/)ee(
család)normális(logSe
)z(g
N
Bz
Uzz
Lz
(4)
Esı lépésben az adott mintához a megfelelı típusú eloszlást ill. a hozzá tartozó
függvényt kell kiválasztani. Hahn és Shapiro (1967) a harmadik és negyedik standardizált
momentum ismeretében ad összefüggést a típusok kiválasztásához és megadja a
momentumbecslést. A dolgozat számára megfelelı ez a módszer, hiszen az Applied Statistics
Fortran algoritmus győjteményében az AS90 felhasználásával elvégezhetık a paraméterek
elıállításához szükséges számítások (Hill et al., 1976). A négy paraméter megadásával az
AS100 algoritmussal (Hill, 1976) végrehajtható a transzformáció ill. az inverz transzformáció.
A teljesség kedvéért megemlítjük, hogy Slifker és Shapiro (1980) a percentilisek módszerrel
73
határozta meg az eloszlást és becsülte meg a paramétereket. A FITTR1 programcsomag
(Wilson,???) pedig az említetteken kívül még további négy becslési eljárást kínál fel.
Az ismertetett eljárás általánosítható többváltozós esetre oly módon, hogy
X=(X1… Xν)T perem eloszlásait egyváltozós Johnson eloszlásokkal közelítjük (Stanfield et
al., 1996). Tapasztalatok szerint ez a módszer jól alkalmazható az átlagra szimmetrikus
eloszlásoknál, de ahol a ferdeség számottevı a korreláció mátrix nem elég pontos. Ennek
probléma elkerülése érdekében Stanfield et al. (1996) többváltozós Johnson rendszer
kiterjesztését javasolja. A szerzık tapasztalatai szerint az ismertetésre kerülı módszerrel az
eredeti minta elsı négy momentumával és korrelációival megegyezı sorok szimulálhatók. A
Stanfield et al. (1996) cikk 4-ik fejezetét az alábbiakban néhány helyen kibıvítettük és a
Függelékben levezetésekkel egészítettük ki.
Jelölje X=(X1… Xν)T azaz ν darab változó N elemő mintáit tartalmazó mátrixot,
melynek várható érték vektora µµµµX, szórás mátrixa σσσσX = diag[Var1/2(X1),…, Var1/2(Xν)] és
korrelációs mátrixa CX. Ismeretes, hogy CX szimmetrikus pozitív definit mátrix (Dévényi és
Gulyás, 1988). A Cholesky felbontás tétele értelmében ez szükséges és elégséges feltétele
olyan alsó háromszög mátrix X = [Θi,j] = CX1/2 létezésének, amelyre teljesül, hogy
CX = ΘΘΘΘXΘΘΘΘXT (Stoyan és Takó, 1995, I kötet 65.oldal).
Ha Y=(Y1… Yν)T standardizált Johnson eloszlású valószínőségi változó, azaz
Y i i=1,…, ν nulla várható értékő és egy szórású, adott aY ferdeség és bY lapultság értékekkel,
akkor
W = µµµµX + σσσσX ΘΘΘΘX Y (5)
és W mátrix ugyanolyan várhatóérték, ferdeség és lapultság vektorral valamint szórás, és
kovariancia mátrixal rendelkezik, mint X.
3
N
1j
3j
XN
)XX(
aσ
−=∑
= és 4
N
1j
4j
XN
)XX(
bσ
−=∑
=
74
Az W = µµµµX + σσσσX ΘΘΘΘX Y összefüggésbıl kiindulva kapjuk, hogy )µ(WσYΘ X1
XX −= − .
Az egyenlet bal oldalára vezessünk be új jelölést és írjuk fel komponensekre:
∑=
υ=k
1jjj,kk YW . Ekkor a harmadik momentum:
∑∑==
⋅υ=⋅υ=k
1j
33j,k
k
1j
3jj,k
3k j
EY)Y(E)W(E
továbbá alkalmazva a ferdeség definícióját és figyelembe véve, hogy a szórás és a mintaszám
az egyenlet mindkét oldalán lévı változóra megegyezik, azt kapjuk, hogy aW = ΘΘΘΘX3aY mivel
aW ≅≅≅≅ aX ebbıl következik a (6a) összefüggést.
A negyedik momentum:
=υυυυ=⋅υ= ∑∑==
)YYYY(E)Y(E)W(Ek
1n,m,j,inmjin,km,kj,ki,k
k
1j
4jj,k
4k
)]YY2Y()YY2Y[(Ekrq1
rqr,kq,k
k
1p
2p
2p,k
knm1nmn,km,k
k
1j
2j
2j,k ∑∑∑∑
≤<≤=≤<≤=υυ+υ⋅υυ+υ=
∑∑∑∑≤<≤=≤<≤=
υυ+υ=υυ+υ=knm1
2n
2m
2n,k
2m,k
k
1j
4j
4j,k
2
knm1nmn,km,k
k
1j
22j
2j,k EYEY6EY])YY(4)Y[(E
mátrixos alakban: XXXW ΨaΘb += 4 , mivel bW ≅ bX ebbıl adódik (6b).
Az X ferdeség aX és lapultság bX vektorának ismeretében az alábbi módon állítható
elı aY és bY vektor:
[ ] XXY aΘa1)3( −
= (6a)
[ ] )(1)4(
XXXY ΨbΘb −=−
(6b)
ahol ΘΘΘΘX jelöli a k-adik Hadamard szorzatot, ΨΨΨΨX = (Ψ1,…,Ψν) pedig a segédvektort.
Definíció szerint (Kitamura, 1995; Styan, 1973) ΘΘΘΘX(k) = [Θi,j
(k)] ahol k = 3, 4,
illetve ∑ ∑ν
=
ν
+=ΘΘ=Ψ
1j 1jl
2l,i
2j,ii 6 és i = 1,…ν. W illeszkedésének jóságát meghatározza Y
elıállítása. Tapasztalatok szerint (Stanfield et al., 1986) a fenti módon elıállított ferdeségen
korrekciót kell végrehajtani abban az esetben, amikor bY ≥ ay(2) + 1 ekkor bY = ay
(2) + 1,25.
75
HIVATKOZÁSOK Bacsi, Zs. and M. Hunkár, 1994: Assessment of the impact of climate change on the yields of
winter wheat and maize, using crop models, Idıjárás, 98 (2), 119-134.
Bárdossy, A., 1993: Stochastische modelle zur Beschreibung der raum-zeitlichen variabilität
des Niederschlages. IHW Heft 44.
Bartholy, J. and I. Matyasovszky, 1998: A Kárpát-medence hõmérsékleti és csapadék
viszonyainak alakulása a globális éghajlat változások tükrében. IMetetorológiai Tudományos
Napok, 1997 nov. 20-21, 117-126.
Bartholy, J., I. Matyasovszky and T. Weidinger, 2001: Regional climate change in Hungary: a
survey and a stochastic downscaling method. Idıjárás, 105 (1), 1-17.
Bartholy, J., T. Pálvölgyi, I. Matyasovszky and T. Weidinger, 1994: Towards narrowing
uncertainties of regional climate changes predictions by general ciculation models and
empirical methods. In: Proc. XVIIth Conference of the Danube Countries on Hydrological
Forecasting and Hydrological Basis of Water Management (Budapest, Hungary, 5-9,
September, 1994), 409 - 415.
Bass, B, 1993: Development of the Weather Generatot. In: BAHC Focus 4. The Weather
generator project. Toronto, Canada, 1-3 December 1993, 21-33.
Bálint, G., B. Gauzer, I.W. Dobi and J. Mika, 1995: On hydrological aspects of climate
changes based on diurnal simulations. In: Drought in the Carpathians’ Region (Budapest-
Alsógöd, Hungary, 3-5 May, 1995), 65-77.
Bálint, G., I.W. Dobi and J. Mika, 1996: Runoff simulation assuming global warming
scenarios. In: Proceedings 18th Conference of the Danube Countries on Hydrological
Forecasting and Hydrological Bases of Weather Management ( Gratz, Austria, 25 - 30
August, 1996 ), 131-136.
Berger, A., Goossens, Chr., 1983: Persistence of wet and dry spells at Uccle (Belgium).
J. Climatol., Vol. 3, N 1, 21-34.
Bruhn, J.A., W.E. Fry and G.W. Fick, 1980: Simulation of daily weather data using
theoretical probability distributions. J. of Appl. Met. 19 (9), 1029-1036.
Cehak, K., Withalm, J., 1980: Über die Gültigkeit eines Markow-Ketten Modells für
Niederschlagsperioden im Hochgebirge. Meteorol. Rundsch., Vol. 33, N 5, 148-155.
76
Chin, E.H., , 1977: Modelling daily precipitation occurrence process with Markov chain.
Water Resour. Res., Vol. 13, N 6, 949-956.
Cox and Hinkley, 1978 (19)
Dobi, I.W., Mika J. and L. Szeidl, 1996: On modelling daily rainfall occurrences. In: Proc.
17th Int. Conf. on Carpathian Meteorology (Visegrád, Hungary, 14-18 Oct. 1996), 46-51.
Dobi-Wantuch I., Mika J. and Szeidl L., 2000: Modelling wet and dry spells with mixture
distributions. Meteorology and Atmos. Phys.,Vol. 73, 245-256.
Dévényi D., Gulyás O., 1988: Matematikai statisztikai módszerek a meteorológiában.
Tankönyvkiadó, Budapest.
Domonkos P. és Mika J., 1992: Az idıjárási elemek közötti összefüggések vizsgálata
faktoranalízissel. Hegyfoki Kabos Emlékülés, Debrecen, 140-146.
Dubrovsky, M., 1995: Met&Roll: The weather generator for investigating potential impacts of
climate change on agriculture. Manuscript to EGS XX General Assembly, (Hamburg, BRD, 3-
7 April, 1995).
Dubrovsky, M Zdenek Z. and M. Stastná, 2000: Sensitivity of CERES-maize yields to
statistical structure of daily weather series. Climate change 46, 447-472.
Éltetı Ö., Meszéna Gy. és Ziermann M., 1982: Sztochasztikus módszerek és modellek.
Közgazdasági és Jogi Könyvkiadó, Budapest.
Foufoula-Georgiou, E. and D.P. Letettenmaier, 1987: A Markov renewal model for rainfall
occurrences. Water Res. Res., 23 (5), 875-884.
Füstös L. és Kovács E., 1989: A számítógépes adatelemzés statisztikai módszerei.
Tankönyvkiadó, Budapest.
Gilyénné Hofer Alice és Nováky Béla, 1998: Az éghajlati hatásvizsgálatok megalapozása a
Zala-vízgyőjtı lefolyásának vizsgálatára. Vízügyi Közlemények LXXX. Évf. 3. füzet, 508-521.
Gabriel, K.R., Neumann, J.A., 1962: Markov chain model for daily rainfall occurrence at Tel-
Aviv. Quarterly Journal of Royal Meteorological Society, Vol. 88, N 375, 90-95.
Gates, P., Tong, H., 1976: On Markov chain modelling to some weather data. J. Appl.
Meteorol., Vol. 15, 1145-1151.
77
Geng, S. and J.S. Auburn, 1986: Weather simulation models based on summaries of long-
term data. In Int. Symp. on Impact of Weather Parameters on the Growth and Yield of Rice. 7-
10 Apr.IRRI, Manila, Philippes., 237-254.
Geng, S., F.W.T.Penning de Vries and I. Suppit, 1986: A simple method for generating daily
rainfall data. Agricultural and Forest Meteorology, 36, 363-376.
Giorgi, F. and L.O. Mearns, 1991: Approaches to the simulations of regional climate change:
a review. Reviews of Geophysics, 29 (2), 191-216.
Guenni, L., 1994: Spatial Interpolations of the parameters of stochastic weather models.
BAHC Rep. No. 3, G. Paoli (ed.), IRR, 61-79.
Hahn, G.J. and Shapiro, S.S., 1967: Statistical models in engineering. New York: John Wiley
& Sons, Inc.
Hanson, C.L. et al., 1989: Daily precipitation simulation model for mountainous areas. Tran.
ASAE, Vol. 32, N 3, 865-873.
Hantel, M. and F. Ács, 1995: Physical aspects of the weather generator. Submitted to J. of
Hidrology.
Harnos, Zs, 1998: A klímaváltozás várható alakulása és hatása néhány gazdasági növény
termeszthetıségére. In: Metetorológiai Tudományos Napok, 1997 nov. 20-21, 55-66.
Hasselmann, 1976: Stochastic climate models. Part I. Theory. Tellus. 28, 473-485.
Hayhoe, H.N., 2000: Improvements of stochastic weather data generators for diverse climate.
Clim. Res., Vol. 14, 75-87.
Hill, I.D., R.Hill and R.L.Holder, 1976: Fitting Johnson curves by moments. Journal Roy.
Stat.Soc., Ser. C, Vol 25, 180.
IGBP Report No. 27; 1993: Biospheric Aspects of the Hydrological Cycle.The Operational
Plan. Ed. By BAHC Core Project Office
Johnson G.L., C.L.Hanson, S.P. Hardegree and E.B.Ballard, 1996: Stochastic Weatther
Simulation: Overwiew and Analysis of two Commonly Used Models. J.of Appl. Met., 35,
1878-1896.
Jones, J.W., R.F. Colwick and E.D. Threadgill, 1970: A simulated environmental model of
temperature, evaporation, rainfall and soil moisture. Transactions of the ASAE, 366-372.
78
Jones, P.G. and P.K.Thornton, 1993: A rainfall generator for agricultural applications in the
tropics. Agricultural and Forest Meteorology, 63, 1-19.
Kaas, E., 1993: Greenhouse induced climate change in the Nordic countries as simulated with
the Hamburg climate model. Part 2: Statistical Interpretation, Danish Meteorological Institute
Scientific report 93-3.
Karlin, S - Taylor, H. M.,1986: Sztochasztikus folyamatok. Gondolat Kiadó, Budapest.
Katz, R.W., 1981: On some criteria for estimating the order of a Markov chain.
Technometrics, Vol. 23, 243-249.
Katz, R.W., 1982: Procedures for determining the statistical significance of precipitation
changes simulates by an atmospheric general circulation model. Clim. Res. Inst. Rept., N 33.
Kovács Géza és Dunkel Zoltán, 1998: A klímaváltozás várható következményei
Magyarország szántóföldjein a következı félszázadban. In: Metetorológiai Tudományos
Napok, 1997 nov. 20-21, 181-194.
Krishnaiah, P.R., 1980: Analysis of variance. Handbook of statistics. Vol1. North-Holland
Publishing Company.
Kröel-Dulay György, Bartha Sándor, Wantuchné Dobi Ildikó, Kovács-Láng Edit és Debra P.
Coffin, 1998: Mechanisztikus szimulációs modellek alkalmazása száraz homoki gyepek
klímaváltozással kapcsolatos dinamikájának predikciójára. In: Metetorológiai Tudományos
Napok, 1997 nov. 20-21, 269-274.
Lana, X. and A. Burgueňo, 1998: Probabilities of repeted long dry episodes based on the
Poisson distribution. An example for Catalonia (NE Spain). Theor. Appl.Climatol., Vol. 60,
111-120.
Matalas, N.C., 1967: Mathematical assessment os synthetic hydrology. Water Resources
Research, Vol. 3., No. 4., 937-945.
Matematikai statisztika, 1995: Szerk. Mogyoródi József és Michaletzky György. Nemzeti
tankönyvkiadó, Budapest.
Matyasovszky,I, 1986: Meteorológiai idısorok modellezése ARMA-folyamatok segítségével.
Idıjárás, 90 (4), 240-250.
Matyasovszky, I., Bogárdy, I., 1994: Comparison of two general ciculation models to
downscale temperature and precipitation under climate change. Water Resources Research,
Vol. 30, No. 12, p. 3437-3448.
79
Matyasovszky, I., Bogárdy, I., 1996:Downscalling two versions of a general ciculation
models to estimate local hydroclimatic factors under climate change. Hidrological Science, 41
(1), 117-129.
Matyasovszky I. and I.W. Dobi, 1989: Methods for analysis of time series of precipitation
data using Markov chains (in Hungarian), Idıjárás, Vol. 93, No. 5, 276-288.
Matyasovszky,I., A. Bardossy, L. Duckstein, 1993: Space-time precipitation reflecting
climate change. Hidrological Sciences, 38, 6, 539-558.
Mearns, L.O. 1997: On the statistical evaluation of climate model experiments. Climatic
Change. 37, 443-448.
Mearns, L.O., C. Rosenzweig and R. Goldberg, 1995: Mean and variance change in climate
scenarios: methods, agricultural applications and measures of uncertainty. Climatic Change.
35, 367-396.
Mika, J., 1991: A globális felmelegedés regionális éghajlati sajátosságai hazánk térségében.
Kandidátusi értekezés. Budapest.
Mika,J., 1998: A globális felmelegedés várható magyarországi sajátosságai. Magyarország
éghajlata. Szerk: Justyák J. , Budapest.
Mika J. és Wantuchné Dobi Ildikó, 1998: Kis globális változások térbeli és idıbeli
leskálázása hatásvizsgálati célokra. In: Metetorológiai Tudományos Napok, 1997 nov. 20-21,
99-102.
Mimioku, M., 1984: A study for improving precipitation occurences modelling with Markov
chain. J. Hydrol., Vol. 70, N 1-4, 25-33.
Móri T., 1999: Fõkomponens- és faktoranalízis. (kézirat)
Móri T. és Székely G. (szerk.), 1986:Többváltozós statisztikai analízis. Mőszaki Könyvkiadó,
Budapest.
Panofsky, H.A. and G.W.Brier, 1958: Some Application of Statistics to Meteorology, The
Pennsylvanian State University.
Péczely,G., 1957:Grosswetterlagen in Ungarn. Kleinere Veröffentlichungen der
Zentralanstalt für Meteorologie, Budapest, 30.
Pickering, N.B., J.W. Hansen, J.W. Jones, C.M. Wels, V.K. Chan and D.C. Godwin. 1994:
WeatherMan: A utility for managing and generating daily weather data. Agron. J. 86, 332-
337.
80
Prog. Algorithm as 99, 1000: Applied Statistics (1976) vol. 25.
Racsko, P., L. Szeidl, and M. Semenov, 1991: A serial approach to local stochastic weather
models. Ecological Modelling, 57, 27-41.
Richardson, C.W, 1981: Stochastic simulation of daily precipitation, temperature, and solar
radiation. Water. Resources Research, 17, 182-190.
Richardson, C.,W. Wright, D.A., 1984: WGEN: A model for generating daily weather
variables. USDA Publications ARS-8, 83 pp.
Semenov, M.A. and E.M. Barrow, 1997: Use of stochastic weather generator in the
development of climate change scenarios. Climate Change, 35, 397-414.
Semenov, M.A. and E.M. Barrow, 1999: Scaling consideration for agricultural climate
change impact assessment. ECLAT-2 Workshop October 13-15, 1999, Potsdam, Germany
(manuscript).
Slifker, J. F. and S.S.Shapiro, 1980: The Johnson system: selection and parameter estimation.
Technometrics, Vol.22, No.2. 239-246.
Stanfield, P.M., J.R.Wilson, G.A.Mirka, N.F.Glasscock, J.P.Psohogios, J.R.Davis, 1996:
Multivariate input modeling with Johnson distributions. In: Proc. Of the 1966 Winter
simulation conference. Ed. J.M.Charnes, D.J.Morice, D.T.Brunner and J.J.Swain,1457-1464.
Stern, R.D., 1982: Computing a probability distribution for the start of the rains from Markov
Chain model for precipitation. J. of Appl. Met., Vol. 21, 420-423.
Storch,H. and A.Navarra, 1993: Analysis of climate variability. Springer.
von Storch, H and F. W. Zwiers, 1998: Statistical analysis in climate research, Cambridge
University press.
von Storch, H., Hewitson, B. and L. Mearns, 2000: Review of empirical downscaling
techniques. In: Regional climate development under global warming. (Ed. by T. Iversen and
B. A. K. Hoiskar) General Technical Report No. 4. Conf. Proceedings RegClim Spring
Meeting Jevnaker, Torbjornrud, Norway, 8.-9. May 2000, p. 29-46.
Statistica for Windows, 1995, Statsoft (ISBN 1-884233-12-0)
Stoyan G. és Takó G., 1995:Numerikus módszerek. Budapest, ELTE Typotex.
81
Stöckle, C.O., G.B. Bellocchchi and R. Nelson, 1998: Evaluation of weather generator
CLIMGEN for several world locations. Proceedings of the 7th ICCTA , November 15-18,
1998, Florence.
Székely, V., 1994: Képkorrekció, hanganalízis, térszámítás. Computer Books, Budapest.
Szentimrey, T., 1996: Statistical methods for homogenization: break points detection
weighting of reference series, In: Proc. of the 13th Conference for Homogenization of Surface
Climatological Data (Budapest, Hungary, 6-12 Oct.1996), 47-62.
Tusnády G. és Ziermann M. (szerk.), 1986: Idõsorok analízise. Mőszaki Könyvkiadó,
Budapest.
Voet, P van der, K. Kramer and C.A. van Diepen, 1996: Parametrization of the Richardson
weather generator within the European Union. Report 92. The Winand Staring Centre,
Wageningen, The Niederlands. Join Reserarch Centre, SC-DLO.
Wilks, D., 1992: Adapting stochastic weather generation algorithm for climate change
studies. Climate Change, 22, 67-84.
82
KÖSZÖNETNYILVÁNÍTÁS
Köszönetemet szeretném kifejezni
- Szeidl Lászlónak és Mika Jánosnak az évek során a nyújtott számtalan szakmai
tanácsukért, a sok idıért és energiáért, a lelkiismeretes és kitartó segítségükért és
lankadatlan bíztatásukért, amivel lehetıvé tették számomra a modell elkészítését;
- az Országos Meteorológiai Szolgálatnak a rendelkezésemre bocsátott adatokért,
technikai feltételekért valamint azért, hogy lehetıségem volt a modellt jelentıs
részben a munkaköri leírásom részeként elkészíteni;
- a publikációs listában szereplı szerzıtársaimnak, akiktıl sokat tanulhattam;
- Pröhle Tamásnak a SPSS programcsomag megismerésében nyújtott segítségéért;
- kollégáim közül szintén hálámat szeretném kinyilvánítani Práger Tamásnak és.
Szentimrey Tamásnak a matematikai fogalmak alkalmazásakor felmerülı
problémáim esetén nyújtott gyors segítségükért, Ihász Istvánnak, a Fourier
Transzformációt meghívó fortran programok elkészítésében, valamint
Randriamanpianina Rogernak különféle számítástechnikai kérdések megoldásában
nyújtott segítségéért;
- a felsorolásban szereplı külföldi kollégáimnak (András Bárdossy, Harry Pavlopoulos,
Raymond Sneyers és Yuki Seo) akik olyan cikkeket küldtek, melyeket a dolgozathoz
felhasználtam; Martin Dubrovskynak akivel többször módomban állt tapasztalatot
cserélni; valamint Paul M. Stanfieldnek, aki e-mailen nyújtott tanácsaival segített,
hogy a cikkében kidolgozott módszert megfelelıen alkalmazzam;
- végül, de nem utolsó sorban családomnak. Szeretetük, buzdításuk adott erıt és
lehetıséget arra, hogy a Doktori Iskolával járó feladatokat elvállalhassam és végig
vihessem. Hálás vagyok férjemnek Wantuch Ferencnek, aki azzal is segítette
munkámat, hogy megtanított a C nyelvő programozásra. Neki és gyermekeimnek,
Ágnesnek és Viktornak, hogy elviselték, hogy évekig kevesebb idım és energiám
maradt rájuk. Végezetül hálásan köszönöm nemrég elhunyt édesanyámnak, aki egész
életében buzdított a tanulásra és minden erejével támogatta tanulmányaimat.
A dolgozat témája az alábbi Országos Tudományos Kutatási Alap támogatásokból
részesült: OTKA: F-022445, T-025803, T-032214, T-021166, T-022358;
83
Összefoglaló
A dolgozat a valószínőségszámítás, a statisztika és a sztochasztikus folyamatok
eszközrendszerének felhasználását mutatta be az éghajlat modellezés területén.
A célkitőzésben szereplı feladat egy adott földrajzi hely napi idıjárását többdimenziós
sztochasztikus folyamatként elıállító ún. Idıjárás Generátor Modell kifejlesztése volt.
E modell szerint az idıjárási paraméterek alakulása az egymást követı, egyformán
csapadékmentes, illetve csapadékos napok sorozataiból képzett, ún. száraz és nedves
idıszakokra épült, mint e két állapottól függı, feltételes valószínőségi modell. Kimutattuk
továbbá, hogy a feltételes statisztikák attól is függnek, hogy hányadik napról van szó e
szakaszokon belül. E feltételes statisztikákat kilenc (száraz szakaszokra nyolc) meteorológiai
változóra határoztuk meg. A száraz és a csapadékos szériák egymástól független sorozatainak
elıállítására külön modellként a Poisson és a Geometriai eloszlás keveréke bizonyult a
legalkalmasabbnak.
A determinisztikus éves menet, valamint a szériákon belüli sorszám hatásának
eltávolítására centráló és normáló transzformációkat hajtottunk végre. A vizsgálatok
alátámasztották, hogy a száraz ill. csapadékos szakaszokon belül a rezidumok idısorai már
minden hónapban gyengén stacionárius sorozatnak tekinthetık. Erre a gondolatmenetre
alapoztuk az elsırendő feltételes autoregresszív modell használatát.
Felhasználtuk továbbá, hogy a maradéktagok mindegyike nem normális Johnson
eloszlású oly módon, hogy zaj tagként adott paraméterő Johnson eloszlású véletlen számokat
alkalmazunk. Ezzel a megoldással kilencváltozósra bıvítettük a modellt, amelyben az
ismertetett lépések biztosították a szimulált sor és a megfigyelt sor paraméterei közötti,
statisztikai értelemben vett azonosságot.
Az idısorok belsı összefüggéseit két magyarországi állomás 9 meteorológiai
elemének 45 év hosszúságú napi adatsorain tanulmányoztuk. A fejlesztés lépéseit tesztekkel
ellenıriztük, az eredményeket ábrák és táblázatok teszik szemléletessé.
Az Értekezésben ismertetett modell elméleti alapot nyújt a hazai klímaváltozás
következményeit vizsgáló agrometeorológiai, hidrológiai és ökológiai hatástanulmányok
meteorológiai kiszolgálására. A fejlesztés következı lépése a dolgozatban alkalmazott
leírások alapján egy felhasználóbarát programcsomag készítése.
84
Summary
The dissertation demonstrates a system of applications in the field of climate research,
incorporating theorems and methodology of Probability theory, Statistics and Stochastic
processes. The aim of the study is to develop a Weather Generator Model which is able to
simulate diurnal weather sequences of a given geographical locality as a multivariate
stochastic process.
According to this model, the weather parameters are based on the so called dry and
wet series, i.e. spells, representing identically dry or rainy consecutive days, performing as a
probability model, conditioned by these two states. It is demonstrated that the conditional
statistics also depend on the serial number of the day within a given series. Conditional
statistics are determined for nine meteorological variables (eight variables for dry spells).
Simulation of the dry and wet duration, which perform statistically independent of the
previous ones, is the most successful by mixture distribution of Poisson and Geometrical
distributions.
Transformations of centralization and normalization are performed to remove the
deterministic annual cycle and the effect of serial number within a spell. The investigations
demonstrate that the residual variables can already be considered, as weakly stationary
processes within both the dry and wet series. The use of first-order conditional autoregressive
model is based on this idea.
It is also utilized, that all the residuals exhibit non-normal Johnson distribution in the
way, that random numbers of Johnson distribution are used for simulation of the noise terms.
The model is extended to treat nine variables by this solution, and the above steps accomplish
an identity between the simulated and observed series in statistical sense.
Internal relations among the time series are investigated for daily weather sequences of
two Hungarian stations in a 45 year period, including nine meteorological parameters. Each
step of the model development is checked by corresponding tests. The results are illustrated
by series of figures and tables.
The Model, specified in the Dissertation, provides a theoretical basis to support agro-
meteorological, hydrological and ecological climate impact studies from meteorological point
of view in Hungary. The next step of the development will be to compile a user friendly
software package, based on the specifications applied in the Dissertation.