evolutionary multi-objective direct policy search …

25
EVOLUTIONARY MULTI-OBJECTIVE DIRECT POLICY SEARCH (EMODPS), EINE HEURISTISCHE ENTSCHEIDUNGSHILFE IN DER WASSERWIRTSCHAFT 15. Symposium Energieinnovation Christoph Libisch-Lehner Graz, 15.02.2018

Upload: others

Post on 10-Feb-2022

4 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: EVOLUTIONARY MULTI-OBJECTIVE DIRECT POLICY SEARCH …

EVOLUTIONARY MULTI-OBJECTIVE DIRECT POLICY SEARCH (EMODPS), EINE HEURISTISCHE ENTSCHEIDUNGSHILFE IN DER WASSERWIRTSCHAFT 15. Symposium Energieinnovation Christoph Libisch-Lehner

Graz, 15.02.2018

Page 2: EVOLUTIONARY MULTI-OBJECTIVE DIRECT POLICY SEARCH …

COPYRIGHT©PÖYRY

EINLEITUNG

Simulationsbasiertes Optimierungsverfahren zur:

– langfristigen Planung und Wirkungsmodellierung von Wasserressourcenentwicklung in

Flussgebieten

– kurzfristige Einsatzplanung (Betriebsstrategien von wasserwirtschaftlichen Anlagen in real-

time)

Forschungsbedarf gegeben aufgrund von:

– Integrierten Wasserrecourcenmanagement

– “Globaler Wandel”

– Datenverfügbarkeit

– Limitierungen klassischer Optimierungsalgorithmen

2

Evolutionary Multi-Objective Direct Policy Search

Page 3: EVOLUTIONARY MULTI-OBJECTIVE DIRECT POLICY SEARCH …

COPYRIGHT©PÖYRY

EINLEITUNG

3

Mehrziel-Planung

Lehner, B., et.at. 2011. High-Resolution Mapping of the World’s Reservoirs and Dams for

Sustainable River-Flow Management. Frontiers in Ecology and the Environment

Page 4: EVOLUTIONARY MULTI-OBJECTIVE DIRECT POLICY SEARCH …

COPYRIGHT©PÖYRY

EINLEITUNG

4

Mehrziel-Planung

Global:

Hauptnutzung:

• 25 % Bewässerung

• 22 % Wasserkraft

• 12 % Trinkwasserversorgung

• 8 % Hochwasserschutz

30 % Mehrzweckanlagen

Deutschland:

Deutsches TalsperrenKomitee e.V. Hrsg (2013). Talsperren in Deutschland. Springer

Page 5: EVOLUTIONARY MULTI-OBJECTIVE DIRECT POLICY SEARCH …

COPYRIGHT©PÖYRY

EINLEITUNG

5

Integriertes Wasserressourcenmanagement

Zarfl, C., Lumsdon, A. E., Berlekamp, J., Tydecks, L., & Tockner, K. (2014). A global boom in hydropower dam construction

Page 6: EVOLUTIONARY MULTI-OBJECTIVE DIRECT POLICY SEARCH …

COPYRIGHT©PÖYRY

EINLEITUNG

Klimawandel

– Unsicherheit zukünftiger hydrologischer Verhältnisse

– Veränderung von Extremereignissen

– Veränderungen im Wasserverbrauch

Sozio-Ökonomischer Wandel

– Energiemarkt

– Ökologisch verträglicher Betrieb (z.B. Schwall und Sunk)

Chancen

– Mehr und neue Daten

– Gesteigerte Rechenleistung

– verbessertes Systemverständnis

6

“Globaler Wandel” und neue Chancen

Page 7: EVOLUTIONARY MULTI-OBJECTIVE DIRECT POLICY SEARCH …

COPYRIGHT©PÖYRY

PROBLEMSTELLUNG

7

Strategie p

Wasserstandsmessung

ut St+1

St

t

Optimales Steuerungsproblem:

𝑝∗ = argmin 𝑝

𝐽(𝑝, 𝑥0)

Markov-Entscheidungsprozess:

𝑥𝑡+1 = 𝑓𝑡(𝑥𝑡, 𝑢𝑡)

𝑥𝑡 = [𝑆𝑡]

𝑝 = 𝑚0, 𝑚1, …𝑚𝑇−1

𝑢𝑡 = 𝑚𝑡(𝑥𝑡)

Feedback-Control-Framework:

qt+1

Castelletti, A., de Rigo, D., Rizzoli, A. E., Soncini-Sessa, R., & Weber, E. (2007). Neuro-dynamic programming for designing water

reservoir network management policies.

Reservoir

𝑆𝑡+1 = 𝑆𝑡 + 𝑞𝑡+1 − 𝑒𝑡+1 − 𝑟𝑡+1

Page 8: EVOLUTIONARY MULTI-OBJECTIVE DIRECT POLICY SEARCH …

COPYRIGHT©PÖYRY

PROBLEMSTELLUNG

8

Reservoir

𝑆𝑡+1 = 𝑆𝑡 + 𝑞𝑡+1 − 𝑒𝑡+1 − 𝑟𝑡+1 Strategie p

Wasserstandsmessung

ut St+1

St

t

Einzugsgebiet

und

Meteorologie

Messungen

It qt+1

εt+1

Optimales Steuerungsproblem:

𝑝∗ = argmin 𝑝

𝐽(𝑝, 𝑥0)

Partiell beobachtbarer Markov-

Entscheidungsprozess:

𝑥𝑡+1 = 𝑓𝑡(𝑥𝑡, 𝑢𝑡, ε𝑡+1)

𝑥𝑡 = [𝑆𝑡, 𝐼𝑡]

𝑝 = 𝑚0, 𝑚1, …𝑚𝑇−1

𝑢𝑡 = 𝑚𝑡(𝑥𝑡)

Feedback-Control-Framework:

Castelletti, A., de Rigo, D., Rizzoli, A. E., Soncini-Sessa, R., & Weber, E. (2007). Neuro-dynamic programming for designing water

reservoir network management policies.

Page 9: EVOLUTIONARY MULTI-OBJECTIVE DIRECT POLICY SEARCH …

COPYRIGHT©PÖYRY

LÖSUNGSWEGE

“value function-based” vs. “policy search-based”

Klassische Lösung: Dynamic Programming

– Optimalitätsprinzip nach Bellman

– Limitierungen:

– “Fluch der Dimension”

– “Fluch der Modellierung” exponentieller Anstieg in der Berechnungszeit

– “Fluch der Mehrzielplanung”

9

Reinforcement Learning

Page 10: EVOLUTIONARY MULTI-OBJECTIVE DIRECT POLICY SEARCH …

COPYRIGHT©PÖYRY

LÖSUNGSWEGE

Betriebsregel wird parametrisiert (linear vs. nicht linear)

Suche nach optimalen Parameter der Betriebsregel: 𝑢𝑡= 𝑚𝑡(𝑥𝑡, 𝜃𝑡)

externe Optimierung: Evolutionsalgorithmus (BORG, NSGA2, …)

10

Reinforcement Learning: “policy search-based” - EMODPS

Page 11: EVOLUTIONARY MULTI-OBJECTIVE DIRECT POLICY SEARCH …

COPYRIGHT©PÖYRY

Fallstudie – Metro Manila

Wasserwirtschaftliches System:

• 3 Anlagen

• Mehr-Ziel-Planung:

Trink-

/Brauchwasserversorgung

Bewässerung

Hochwasserschutz

(Wasserkrafterzeugung)

Metro Manila: 13 Millionen Einwohner

Angat Reservoir: stellt 98 % des Wasserbedarfs

zur Verfügung

Page 12: EVOLUTIONARY MULTI-OBJECTIVE DIRECT POLICY SEARCH …

COPYRIGHT©PÖYRY

Fallstudie – Metro Manila

Warum diese Fallstudie?

• Konkurrierende Nutzer

• Vulnerabel während El Niño Phasen: 1997/1998 keine Bewässerung und nur

70% der Trinkwasserversorgung gedeckt

Metro Manila: 13 Millionen Einwohner

Angat Reservoir: stellt 98 % des Wasserbedarfs

zur Verfügung

Angat Reservoir:

• Speichergröße: 743 hm³

• Einzugsgebietsgröße: 545 km²

• MQ: 71 m³/s

• aktuelle Betriebsregel: ut = f(St)

Page 13: EVOLUTIONARY MULTI-OBJECTIVE DIRECT POLICY SEARCH …

COPYRIGHT©PÖYRY

Evolutionary Multi-Objective Direct Policy Search (EMODPS)

Giuliani, M., Castelletti, A., Pianosi, F., Mason, E., & Reed, P. M. (2015). Curses, tradeoffs, and scalable management: Advancing

evolutionary multiobjective direct policy search to improve water reservoir operations. Journal of Water Resources Planning and

Management, 142(2), 04015050.

Input time

series (e.g.

inflow)

Simulation Evaluation

Run the system model

for given inputs and

policy parameters

Calculate the value of

the objective functions

Sample trajectories

(e.g., storage)

Selection Crossover and

mutation Evolutionary

Multi-Objective

algorithm

Water system

model

Operating

objectives

New population of

policy parameters

Computational framework

Page 14: EVOLUTIONARY MULTI-OBJECTIVE DIRECT POLICY SEARCH …

COPYRIGHT©PÖYRY

Computational framework

Evolutionary Multi-Objective Direct Policy Search (EMODPS)

Input time

series (e.g.

inflow)

Simulation Evaluation

Run the system model

for given inputs and

policy parameters

Calculate the value of

the objective functions

Sample trajectories

(e.g., storage)

Selection Crossover and

mutation Evolutionary

Multi-Objective

algorithm

Water system

model

Operating

objectives

New population of

policy parameters

Simulation

Run the system model

for given inputs and

policy parameters

Angat water system

monthly Inflow (1968-2014)

historic demand

No changes in flood control rule

Operating policies conditioned on:

Storage

Time

ENSO state

Page 15: EVOLUTIONARY MULTI-OBJECTIVE DIRECT POLICY SEARCH …

COPYRIGHT©PÖYRY

Computational framework

Evolutionary Multi-Objective Direct Policy Search (EMODPS)

Input time

series (e.g.

inflow)

Simulation Evaluation

Run the system model

for given inputs and

policy parameters

Calculate the value of

the objective functions

Sample trajectories

(e.g., storage)

Selection Crossover and

mutation Evolutionary

Multi-Objective

algorithm

Water system

model

Operating

objectives

New population of

policy parameters

Evaluation

Calculate the value of

the objective functions

Operating objectives

Squared monthly deficit and

minimum releases (Manila)

Squared monthly deficit

(Irrigation)

Page 16: EVOLUTIONARY MULTI-OBJECTIVE DIRECT POLICY SEARCH …

COPYRIGHT©PÖYRY

Computational framework

Evolutionary Multi-Objective Direct Policy Search (EMODPS)

Input time

series (e.g.

inflow)

Simulation Evaluation

Run the system model

for given inputs and

policy parameters

Calculate the value of

the objective functions

Sample trajectories

(e.g., storage)

Selection Crossover and

mutation Evolutionary

Multi-Objective

algorithm

Water system

model

Operating

objectives

New population of

policy parameters

NSGA2

4,000,000 NFE

6 restarts

Page 17: EVOLUTIONARY MULTI-OBJECTIVE DIRECT POLICY SEARCH …

COPYRIGHT©PÖYRY

ERGEBNISSE

17

Page 18: EVOLUTIONARY MULTI-OBJECTIVE DIRECT POLICY SEARCH …

COPYRIGHT©PÖYRY

ERGEBNISSE

18

Page 19: EVOLUTIONARY MULTI-OBJECTIVE DIRECT POLICY SEARCH …

COPYRIGHT©PÖYRY

ERGEBNISSE

19

18 m³/s

25 m³/s

Page 20: EVOLUTIONARY MULTI-OBJECTIVE DIRECT POLICY SEARCH …

COPYRIGHT©PÖYRY

SCHLUSSFOLGERUNGEN

Vorteile:

– Erhalt der Systemkomplexität (kein “Fluch der Dimensionalität”)

– Keine Diskretisierung nötig (kein “Fluch der Dimensionalität”)

– Einfache Implementierung exogener Informationen (kein “Fluch der Modellierung”)

– Mehrzieloptimierung durch Kombination mit MOEA (kein “Fluch der Mehrzielplanung”)

– Rechenzeit wächst linear mit dem Simulationshorizont und Anzahl von Reservoirs

Herausforderungen:

– Keine Garantie für optimale Lösung

– Sorgfältige Wahl der Input-Daten (vermeiden von Redundanz)

– Wie reagiert die optimierte Strategie auf unbekannte Zustände?

– Equifinality

– Definition des Zielfunktionsvektors

20

Page 21: EVOLUTIONARY MULTI-OBJECTIVE DIRECT POLICY SEARCH …

Consulting. Engineering. Projects. Operations. www.poyry.com

Page 22: EVOLUTIONARY MULTI-OBJECTIVE DIRECT POLICY SEARCH …

COPYRIGHT©PÖYRY

Hydrologie

Page 23: EVOLUTIONARY MULTI-OBJECTIVE DIRECT POLICY SEARCH …

COPYRIGHT©PÖYRY

Einfluss von ENSO auf bestehenden Betrieb

Page 24: EVOLUTIONARY MULTI-OBJECTIVE DIRECT POLICY SEARCH …

COPYRIGHT©PÖYRY

El Niño Southern Oscillation - ENSO

Page 25: EVOLUTIONARY MULTI-OBJECTIVE DIRECT POLICY SEARCH …

COPYRIGHT©PÖYRY

6-D Optimierungsproblem

Total El Nino neutral La Nina