alfred stach instytut badań czwartorzędu i geoekologii uam jan tamulewicz
DESCRIPTION
WSTĘPNA OCENA PRZYDATNOŚCI WYBRANYCH ALGORYTMÓW PRZESTRZENNEJ ESTYMACJI MIESIĘCZNYCH I ROCZNYCH SUM OPADÓW NA OBSZARZE POLSKI. Alfred Stach Instytut Badań Czwartorzędu i Geoekologii UAM Jan Tamulewicz Instytut Geografii Fizycznej i Kształtowania Środowiska Przyrodniczego UAM. Zarys treści. - PowerPoint PPT PresentationTRANSCRIPT
WSTĘPNA OCENA PRZYDATNOŚCI WYBRANYCH ALGORYTMÓWPRZESTRZENNEJ ESTYMACJI MIESIĘCZNYCH I ROCZNYCH
SUM OPADÓWNA OBSZARZE POLSKI
Alfred StachInstytut Badań Czwartorzędu i Geoekologii UAM
Jan TamulewiczInstytut Geografii Fizycznej i Kształtowania Środowiska Przyrodniczego UAM
Zarys treści
• Problem
• Cel pracy
• Analizowane dane
• Metody
• Wyniki
• Wnioski
Problem
• Precyzyjna estymacja punktowych i obszarowych charakterystyk opadów atmosferycznych jest bardzo istotna zarówno w badaniach naukowych, jak i w różnych aspektach gospodarki wodnej i rolnictwa.
• Powszechna dostępność komputerowych implementacji różnych algorytmów estymacji przestrzennej (=interpolacji) stwarza olbrzymie szanse, ale także liczne obawy. + możliwa jest szybka i obiektywna – w sensie powtarzalności i
niezależności od tzw. doświadczenia badacza – analiza wielkich zbiorów danych
– powszechne stosowanie narzędzi matematyczno-statystycznych bez gruntownej znajomości ich podstaw, zakresu stosowania i ograniczeń
Problem cd.
• Żaden algorytm estymacji przestrzennych nie jest uniwersalny. Jego przydatność jest różna, w zależności nie tylko od charakteru zjawiska, którego zmienność przestrzenna jest opracowywana, ale także od zagęszczenia i konfiguracji punktów pomiarowych, błędów samego pomiaru i niedokładności określenia lokalizacji stanowisk pomiarowych.
• Opady atmosferyczne charakteryzują się nieciągłością czasową i przestrzenną oraz sezonową i przestrzenną zmienność mechanizmów je generujących.
Problem cd.
• Co rozumiemy pod pojęciem efektywności (przydatności) algorytmu interpolacyjnego?– optymalną estymację w punkcie?
– optymalną estymację dla obszaru?
• Czy estymator jest lepszy kiedy wiernie oddaje oryginalne dane pomiarowe?– Czy rozkład błędów pomiarowych w czasie i przestrzeni
jest losowy?
– A co z nieprecyzyjną informacją o lokalizacji punktów pomiarowych?
Problem cd.
• Czy istnieje możliwość podniesienia jakości automatycznej estymacji przestrzennej opadów z wykorzystaniem skorelowanych charakterystyk morfometrycznych rzeźby?
• Niestacjonarność pola opadów – algorytmy globalne kontra lokalne.
Cel pracy
• Czy testowane algorytmy z taką sama wiarygodnością estymują sumy roczne i miesięczne?
• Czy w zróżnicowanej efektywności uwzględnionych algorytmów znajduje odbicie sezonowa zmienność struktury przestrzennej pola opadów?
• Które algorytmy są bardziej przydatne do estymacji punktowej, a które dla obszarowej?
• Jaka jest wielkość bezwzględnych i względnych błędów estymacji, i jaki jest ich rozkład geograficzny?
Metody
• Wykorzystane algorytmy estymacji przestrzennych:– geostatystyczne (kriging):
• zwykły kriging z globalnym semiwariogramem (OK-gv),• zwykły kriging z lokalnymi semiwariogramami (OK-lv),• prosty kriging ze zmiennymi średnimi lokalnymi i globalnym
semiwariogramem liczonym automatycznie (SKlm-gva),• prosty kriging ze zmiennymi średnimi lokalnymi i globalnym
semiwariogramem dopasowanym „ręcznie” (SKlm-gvm),• prosty kriging ze zmiennymi średnimi lokalnymi i lokalnymi
semiwariogramami (SKlm-lv),
– odwrotności odległości z kwadratowym wykładnikiem potęgowym (ID2),
– „triangulacji” (TIN),– minimalnej krzywizny (MC).
Metody
• Algorytmy o charakterze lokalnym: OK-lv, SKlm-lv, ID2, TIN i MC.
• Algorytmy o charakterze globalnym: OK-gv, SKlm-gva, SKlm-gvm.
• Algorytmy uwzględniające dodatkowe dane (wysokość nad poziom morza z cyfrowego modelu rzeźby terenu): SKlm-lv, SKlm-gva, SKlm-gvm.
• Algorytmy nie uwzględniające dodatkowych danych: OK-gv, OK-lv, ID2, TIN i MC.
Metody
• Metoda oceny jakości algorytmu interpolacyjnego: jackknifing czyli podział zbioru danych na podzbiory: kalibracyjny i walidacyjny.
• Porównanie estymacji miar centralnych populacji (wartości obszarowych): średniej (x) i mediany (Me).
• Porównanie estymacji miar rozrzutu/rozkładu populacji (wartości obszarowych): odchylenie standardowe (SD), pierwszy i trzeci kwartyl (Q1, Q3), minimum i maksimum (min, maks) skośność (Sk) i kurtoza (K).
• Porównanie estymacji wartości lokalnych: średni błąd (ME), pierwiastek średniego błądu kwadratowego (RMSE), współczynnik korelacji (r).
Dane
Rok 1980Suma roczna
200 300 400 500 600 700 800
O dległość [km ]
200
300
400
500
600
700
O pad [m m ]
od 471 do 603 od 603 do 650 od 650 do 694 od 694 do 742 od 742 do 808 od 808 do 924 od 924 do 2242
Rok 1980Suma stycznia
200 300 400 500 600 700 800
O dległość [km ]
200
300
400
500
600
700
O pad [m m ]
od 2 do 12 od 12 do 15 od 15 do 18 od 18 do 21 od 21 do 24 od 24 do 30 od 30 do 104
Rok 1980Suma kwietnia
200 300 400 500 600 700 800
O dległość [km ]
200
300
400
500
600
700
O pad [m m ]
od 19 do 45 od 45 do 54 od 54 do 62 od 62 do 69 od 69 do 77 od 77 do 91 od 91 do 293
200 300 400 500 600 700 800
O dległość [km ]
200
300
400
500
600
700
O pad [m m ]
od 46 do 103 od 103 do 124 od 124 do 141 od 141 do 161 od 161 do 185 od 185 do 226 od 226 do 806
Rok 1980Suma lipca
Rok 1980Suma października
200 300 400 500 600 700 800
O dległość [km ]
200
300
400
500
600
700
O pad [m m ]
od 26 do 51 od 51 do 67 od 67 do 85 od 85 do 102 od 102 do 118 od 118 do 134 od 134 do 330
Metody
• Z analizowanych zbiorów danych usunięto losowo co 40 punkt pomiarowy.
• Przyjęta procedura zapewniała równomierne rozmieszczenie punktów wybranych do walidacji na terenie całego kraju.
• Ze względu na różną liczebność zbioru stacji dla poszczególnych miesięcy i całego roku (minimalnie 2385 dla całego roku, maksymalnie 2504 stacje w lipcu) wylosowano od 59 do 63 punktów pomiarowych, co stanowiło od 2,47 do 2,53% analizowanych zbiorów danych.
100200300400500600700800900100011001200130014001500160017001800190020002100
0 km 100 km 200 km 300 km
Dane:cyfrowymodelrzeźbyterenu(DEM)o roz-dzielczościok. 1 km
GTOPO30http://www1.gsi.go.jp/gtopo30/gtopo30.html
Wyniki:zależność opadu od położenia i wysokości
600
700
800
900
1000
1100
1200
1300
1400
1500
1600
1700
1800
1900
2000
2100
2200
2300
2400
rok1980
0 km 100 km 200 km 300 km15
20
25
30
35
40
45
50
55
60
65
70
styczeń 19800 km 100 km 200 km 300 km
40
50
60
70
80
90
100
110
120
130
140
150
160
170
180
190
200
210
220
230
kwiecień 1980
0 km 100 km 200 km 300 km 50
100
150
200
250
300
350
400
450
500
550
600
650
lipiec 1980
0 km 100 km 200 km 300 km 5060708090100110120130140150160170180190200210220230240250260270280290
październik 1980
0 km 100 km 200 km 300 km
Wyniki:estymacja średniej obszarowej
OKgvOKlv
SKlm-gvmSKlm-gva
SKlm-lvID2MCTIN
750 755 760 765 770 775
OKgvOKlvSKlm-gvmSKlm-gvaSKlm-lvID2MCTIN
20.8 21.2 21.6 22 22.4
69 70 71 72 73
OKgvOKlv
SKlm-gvmSKlm-gva
SKlm-lvID2MCTIN
Me
tod
a e
sty
ma
cji
154 156 158 160
Opad [m m ]92 92.5 93 93.5 94 94.5
OKgvOKlvSKlm-gvmSKlm-gvaSKlm-lvID2MCTIN
Rok Styczeń
Kwiecień Lipiec Październik
Wyniki:estymacja odchylenia standardowego rozkładu obszarowego opadów
OKgvOKlv
SKlm-gvmSKlm-gva
SKlm-lvID2MCTIN
120 140 160 180 200
OKgvOKlvSKlm-gvmSKlm-gvaSKlm-lvID2MCTIN
9.5 10 10.5 11 11.5 12 12.5
24 26 28 30
OKgvOKlv
SKlm-gvmSKlm-gva
SKlm-lvID2MCTIN
Me
tod
a e
sty
ma
cji
48 50 52 54 56
Odchylenie standardowe opadu [m m ]36.5 37 37.5 38 38.5 39
OKgvOKlvSKlm-gvmSKlm-gvaSKlm-lvID2MCTIN
Rok Styczeń
Kwiecień Lipiec Październik
Wyniki:estymacja skośności rozkładu obszarowego opadów
OKgvOKlv
SKlm-gvmSKlm-gva
SKlm-lvID2MCTIN
1 1.2 1.4 1.6 1.8
OKgvOKlvSKlm-gvmSKlm-gvaSKlm-lvID2MCTIN
0.8 1.2 1.6 2 2.4 2.8
1 1.2 1.4 1.6 1.8
OKgvOKlv
SKlm-gvmSKlm-gva
SKlm-lvID2MCTIN
Me
tod
a e
sty
ma
cji
0.6 0.8 1 1.2 1.4 1.6
Skośność rozkładu opadów0.3 0.4 0.5 0.6
OKgvOKlvSKlm-gvmSKlm-gvaSKlm-lvID2MCTIN
Rok Styczeń
Kwiecień Lipiec Październik
Wyniki:współczynnik korelacji między danymi oryginalnymi i estymowanymi
OKgvOKlv
SKlm-gvmSKlm-gva
SKlm-lvID2MCTIN
0.84 0.88 0.92 0.96
OKgvOKlvSKlm-gvmSKlm-gvaSKlm-lvID2MCTIN
0.84 0.88 0.92 0.96
0.84 0.88 0.92 0.96
OKgvOKlv
SKlm-gvmSKlm-gva
SKlm-lvID2MCTIN
Me
tod
a e
sty
ma
cji
0.84 0.88 0.92 0.96
W spółczynnik korelacji liniowej0.84 0.88 0.92 0.96
OKgvOKlvSKlm-gvmSKlm-gvaSKlm-lvID2MCTIN
Rok Styczeń
Kwiecień Lipiec Październik
Wyniki:średni błąd estymacji (ME)
OKgvOKlv
SKlm-gvmSKlm-gva
SKlm-lvID2MCTIN
0 4 8 12 16 20
OKgvOKlvSKlm-gvmSKlm-gvaSKlm-lvID2MCTIN
0 0.4 0.8 1.2 1.6
0 1 2 3
OKgvOKlv
SKlm-gvmSKlm-gva
SKlm-lvID2MCTIN
Me
tod
a e
sty
ma
cji
-5 -4 -3 -2 -1 0
Średni błąd estymacji opadów [mm]-1 0 1 2 3
OKgvOKlvSKlm-gvmSKlm-gvaSKlm-lvID2MCTIN
Rok Styczeń
Kwiecień Lipiec Październik
Wyniki:pierwiastek względnego średniego błędu kwadratowego estymacji (RRMSE)
OKgvOKlv
SKlm-gvmSKlm-gva
SKlm-lvID2MCTIN
7 8 9 10
OKgvOKlvSKlm-gvmSKlm-gvaSKlm-lvID2MCTIN
17 18 19 20 21
10.8 11.2 11.6 12
OKgvOKlv
SKlm-gvmSKlm-gva
SKlm-lvID2MCTIN
Me
tod
a e
sty
ma
cji
12.6 12.8 13 13.2 13.4 13.6
Średni względny błąd estymacji opadów [%]8.4 8.8 9.2 9.6 10
OKgvOKlvSKlm-gvmSKlm-gvaSKlm-lvID2MCTIN
Rok Styczeń
Kwiecień Lipiec Październik
Wyniki:błędy estymacji metodą Najmniejszej Krzywizny (MC)
200 300 400 500 600 700 800
O dległość [km ]
200
300
400
500
600
700
B łąd estym acji [% ]
od -22 do -8 od -8 do -4 od -4 do -2 od -2 do 0 od 0 do 2 od 2 do 4 od 4 do 8 od 8 do 25
Rok
200 300 400 500 600 700 800
O dległość [km ]
200
300
400
500
600
700
B łąd estym acji [% ]
od -70 do -30 od -30 do -20 od -20 do -5 od -5 do 0 od 0 do 5 od 5 do 20 od 20 do 30 od 30 do 54
Styczeń
200 300 400 500 600 700 800
O dległość [km ]
200
300
400
500
600
700
B łąd estym acji [% ]
od -47 do -20 od -20 do -10 od -10 do -4 od -4 do 0 od 0 do 4 od 4 do 10 od 10 do 20 od 20 do 34
Kwiecień
200 300 400 500 600 700 800
O dległość [km ]
200
300
400
500
600
700
B łąd estym acji [% ]
od -38 do -20 od -20 do -15 od -15 do -5 od -5 do 0 od 0 do 5 od 5 do 15 od 15 do 20 od 20 do 31
Lipiec
200 300 400 500 600 700 800
O dległość [km ]
200
300
400
500
600
700
B łąd estym acji [% ]
od -37 do -10 od -10 do -6 od -6 do -3 od -3 do 0 od 0 do 3 od 3 do 6 od 6 do 10 od 10 do 26
Październik
Wnioski
• Z przeprowadzonej analizy wynika że żadna z testowanych metod nie może być uważana za uniwersalną i najlepszą w każdych warunkach. Wyniki testów są nie tylko różne w przypadku poszczególnych zbiorów danych (sumy rocznej i sum miesięcznych), ale także w sytuacji różnych parametrów oceny jakości estymacji. Porównanie wyników obliczeń wykonanych na jednym jedynie zbiorze danych referencyjnych może prowadzić do fałszywych uogólnień.
• Generalnie dość słabo wypadły algorytmy (SKlm-), które uwzględniały dane z cyfrowego modelu rzeźby terenu. Zależność między wysokością nad poziom morza a opadami obliczono bowiem w postaci jednego modelu wielomianowego dla całego terytorium Polski.
Wnioski cd.
• Lepsze wyniki dają algorytmy oparte na lokalnym modelu struktury pola opadów niż na globalnym.
• Algorytmy TIN, SKlm-gva, SKlm-lv były nieco bardziej skuteczne przy estymacjach parametrów populacji (obszarowych), podczas gdy MC, OKgv, OKlv i SKlm-gvm – punktowych.
Wnioski cd.
• Zdecydowanie najlepiej wypadła metoda minimalnej krzywizny (MC). Jej średni wynik zarówno z estymacji punktowych, jak i obszarowych był znacznie lepszy niż wszystkich pozostałych metod.
• Można ją wstępnie zalecać do rutynowego wykonywania map opadów atmosferycznych, tym bardziej, że nie wymaga specjalistycznego parametryzowania.
• Metoda ta daje dobre rezultaty jedynie przy względnie równomiernym pokryciu analizowanego obszaru punktami pomiarowymi.
Wnioski cd.
• Zdecydowanie najgorzej w zestawieniu wypadł kriging w oparciu o globalny model struktury pola opadów (OKgv) i popularna metoda odwrotności odległości przy wykładniku kwadratowym (ID2).
• Średni błąd estymacji sumy rocznej opadów wahał się od 6,7 (SKlm-lv) do 7,9% (ID2), przy rozrzucie estymacji punktowych od –22,5 do +25,0%.
• Średnie błędy estymacji sum miesięcznych (dla wszystkich metod) wynosiły: styczeń – 18,6%, kwiecień – 10,9%, lipiec – 13,0%, październik – 9,2%. Różnice pomiędzy najlepszą a najgorszą metodą estymacji sum miesięcznych wahały się od 0,8% w lipcu do 3,4% w styczniu. Błędy estymacji punktowych mogą przy sumach miesięcznych sięgać 75%, w większości jednak przypadków oscylują w granicach 35%.
Wnioski cd.
Prezentowane wyniki mają charakter wstępnej oceny niektórych algorytmów estymacyjnych. Aktualnie trwają dalsze prace związane z testowaniem szerokiego spektrum metod automatycznej estymacji opadów przy wykorzystaniu większej ilości danych, zarówno wartości przeciętnych jak i uwzględniających ekstremalne wysokości opadów.
DziękujęZa
uwagę