metody analizy decyzji wykład 10 – niespójność czasowa decyzji

Metody analizy decyzji

Wykład 10 – niespójność czasowa decyzji

Czy wolałbyś/łabyś?A) 15 minut masażu teraz

czyB) 20 minut masażu za godzinę

Eksperyment motywujący

Czy wolałbyś/łabyś?A) 15 minut masażu za tydzień

czyB) 20 minut masażu za tydzień i jedną godzinę

Read i van Leeuwen (1998)

CzasWybór dzisiaj Konsumpcja za tydzień

Jeśli decydowałbyś/łabyś dzisiaj,co wybrałbyś/łabyś owoce czy czekoladęna następny tydzień?

CzasWybór dzisiaj Konsumpcja za tydzień

Dzisiaj ludzie często decydują się na owoce na następny tydzień?

Cierpliwe wybory na następny tydzień

74% wybrało owoce

Niecierpliwe wybory na dzisiaj

Czas

Wybór i konsumpcja jednocześnie

Jeśli decydowałbyś/łabyś dzisiaj,co wybrałbyś/łabyś owoce czy czekoladęna dzisiaj?

Preferencje niespójne czasowo

Czas

Wybór i konsumpcja jednocześnie

70%wybiera czekoladę

Read, Loewenstein & Kalyanaraman (1999)

Wybierz spośród 24 filmów video:• Niektóre lekkie i mniej ambitne: Four Weddings and a Funeral• Niektóre nieco cięższe I bardziej ambitne : Schindler’s List

• Wybór na dzisiaj: 66% badanych wybiera lekkie• Wybór na następną środę: 37% badanych wybiera lekkie.• Wybór na jeszcze następną środę: 29% wybiera lekkie.

Dzisiaj chcę się zabawić… w następnym tygodniu chcę rzeczy, które są dobre dla mnie

Bardzo spragnieni respondenciMcClure, Ericson, Laibson, Loewenstein i Cohen (2007)

• Wybór pomiędzy wypiciem, sok teraz lub 2x sok za 5 minut

60% badanych wybrało pierwszą opcję.• Wybór pomiędzy wypiciem

sok za 20 minut lub 2x sok za 25 minut 30% badanych wybrało pierwszą opcję

• Autorzy estymują, że 5-minutowy współczynnik dyskontujący to 50%, a długo-terminowy współczynnik dyskontujący to 0%

• Ramsey (1930s), Strotz (1950s), & Herrnstein (1960s) byli pierwsi, którzy zrozumieli, że współczynniki dyskontujące są wyższe w krótkim okresie niż w długim.

• Klasyczna forma funkcyjna – funkcja wykładnicza D(t) = dt

D(t) = 1, d, d2, d3, ...Ut = ut + d ut+1 + d2 ut+2 + d3 ut+3 + ...

• Ale funkcja wykładnicza nie jest w stanie opisać efektu natychmiastowego bonusa (instant gratification effect)

• Funkcja dyskontująca maleje w stałym tempie. • Funkcja dyskontująca nie maleje szybciej w krótkim

okresie niż w długim.

Teoretyczne wprowadzenie

Funkcja wykładnicza

1 6 11 16 21 26 31 36 41 46 510

1

Tygodnie (Czas=t)

Zdys

kont

owan

a w

arto

ść

przy

szłe

go p

rzyc

hodu

Stała stopa spadku

-D'(t)/D(t) = stopa spadku funkcji

1 6 11 16 21 26 31 36 41 46 510

1Funkcje dyskontujące

Wykładnicza Hiperboliczna

Wysoka stopa spadku w krótkim okresie

Niska stopa spadku w długim okresie

Paradoks dyskontowania wykładniczego.

Załóżmy, że ludzie dyskontują przynajmniej 1% pomiędzy dzisiaj a jutro.

Załóżmy, że ich funkcje dyskontujące są wykładnicze. Wówczas 100 za t lat jest warte 100*e(-0.01)*365*t dzisiaj.

• Ile jest dzisiaj warte 100 dzisiaj? 100.00• Ile jest dzisiaj warte 100 za rok? 2.55• Ile jest dzisiaj warte 100 za dwa lata? 0.07• Ile jest dzisiaj warte 100 za trzy lata? 0.00

Alternatywna forma funkcyjna

Dyskontowanie QUASI-HIPERBOLICZNE(Phelps and Pollak 1968, Laibson 1997)

D(t) = 1, bd, bd2, bd3, ...Ut = ut + bdut+1 + bd2ut+2 + bd3ut+3 + ...

Ut = ut + b [dut+1 + d2ut+2 + d3ut+3 + ...]

b Dyskontuje jednakowo wszystkie przyszłe okresy.d Dyskontuje wykładniczo wszystkie przyszłe okresy

W czasie ciągłym: patrz Barro (2001), Luttmer i Marriotti (2003), oraz Harris i Laibson (2009)

Intuicja

• Załóżmy, że b = ½ oraz d = 1.• Zdyskontowana funkcja użyteczności:

Ut = ut + ½ [ut+1 + ut+2 + ut+3 + ...]

• Zdyskontowana funkcja użyteczności z perspektywy czasu t+1. Ut+1 = ut+1 + ½ [ut+2 + ut+3 + ...]

• Funkcja dyskontująca odzwierciedla dynamiczną niespójność: preferencje w czasie t nie zgadzają się z preferencjami w czasie t+1.

Zastosowanie dla masażyb = ½ oraz d = 1

A 15 minut terazB 20 minut za 1 godzinę

C 15 minut za 1 tydzieńD 20 minut za 1 tydzień i 1 godzinę

NPV w minutach bieżących

15 minut teraz10 minut teraz

7.5 minut teraz10 minut teraz

Ćwiczenia

• Załóżmy, że b = ½ oraz d = 1.• Załóżmy, że ćwiczenia (wysiłek bieżący 6) generują przyszłe

korzyści (poprawa stanu zdrowia 8).• Czy chcesz ćwiczyć?

• Ćwiczyć teraz: -6 + ½ [8] = -2• Ćwiczyć jutro: 0 + ½ [-6 + 8] = +1

• Czyli decydent chciałby wypoczywać dzisiaj i ćwiczyć jutro.• Ale nie jest stanie tego zrealizować bez poczynienia

zobowiązania.

Osądy na temat przyszłości?

• Wysofistykowani decydenci: wiedzą, że ich plany, aby być cierpliwym jutro nie wypalą (Strotz, 1957).– “Nie rzucę palenia w następnym tygodniu, chociażbym

tego chciał.”• Naiwni: wierzą mylnie, że ich plany, aby być cierpliwym

powiodą się (Strotz, 1957). Myślą, że β=1 w przyszłości.– “Rzucę palenie w następnym tygodniu, chociaż nie

udawało mi się to przez wszystkie tygodnie ostatnich 5 lat.”

• Częściowo naiwni: mylnie wierzą, że β=β* w przyszłości, gdzie β < β* < 1 (O’Donoghue and Rabin, 2001).

Cele dzisiejszego wykładu

• Uwzględnienie sekwencyjności problemu – analiza możliwości reewaluacji problemu

• Analiza dyskontowania przyszłości• Niespójność czasowa decyzji

Dyskontowanie – kilka pytań• Co wolisz:

– 100 PLN dziś?– 100 PLN za miesiąc?

• Czemu dyskontujemy?– niecierpliwość– niepewność– możliwość lokowania (przyczyna czy skutek?)

• Wartość bieżąca strumienia wypłat vt dla czynnika dyskontującego 0<d<1

T

tt

tvPV0

d

Klasyczne dyskontowanie – własności (d=0,9)

t 0 1 2 3 4 5 6 7vt 0 0 0 0 0 0 85 0

dt 1 0,9 0,81 0,729 0,656 0,59 0,531 0,478

t 0 1 2 3 4 5 6 7vt 0 0 0 0 0 0 0 100

dt 1 0,9 0,81 0,729 0,656 0,59 0,531 0,478

PV=45,17

PV=47,83

t 0 1

vt 85 0

dt 1 0,9

t 0 1

vt 0 100

dt 1 0,9

PV=85

PV=900dd

dd

Bk

A

tB

ktA

vv

vv

+

Jakub i Ezaw

23

• http://www.ted.com/index.php/talks/joachim_de_posada_says_don_t_eat_the_marshmallow_yet.html

Czy zjesz ptasie mleczko? Eksperyment w Stanford

http://www.ted.com/index.php/talks/joachim_de_posada_says_don_t_eat_the_marshmallow_yet.html

http://www.ted.com/index.php/talks/joachim_de_posada_says_don_t_eat_the_marshmallow_yet.html

Dyskontowanie – dalsze pytania• Co wolisz:

– 1000 PLN dziś?– 1050 PLN za miesiąc?

• Co wolisz:– 1000 PLN za rok?– 1050 PLN za rok i miesiąc?

• Czy stopa dyskontowa jest stała w czasie?– eksperymenty wskazują, że ludzie przywiązują dużą wartość do

teraźniejszości (rozróżnienie między dwoma okresami w przyszłości jest mniej ważne)

– podobne wyniki dla zwierząt!

Dyskontowanie hiperboliczne

• Czynnik dyskontujący dla momentu t>0 wynosi bdt, gdzie 0<b<1 i 0<d<1– b reprezentuje dodatkowy nacisk na

teraźniejszość (krótkowzroczność, myopia)

Dyskontowanie hiperboliczne – własności (b=0,9; d=0,9)

t 0 1 2 3 4 5 6 7vt 0 0 0 0 0 0 85 0

bdt 1 0,81 0,729 0,656 0,59 0,531 0,478 0,43

t 0 1 2 3 4 5 6 7vt 0 0 0 0 0 0 0 100

bdt 1 0,81 0,729 0,656 0,59 0,531 0,478 0,43

PV=40,66

PV=43,05

t 0 1

vt 85 0

bdt 1 0,81

t 0 1

vt 0 100

bdt 1 0,81

PV=85

PV=81

0

ale ,

dbd

bdbd

Bk

A

tB

ktA

vv

vv

<

+

Niespójność czasowa decyzji

• Rozwiązaniem poniższego problemu jest wariant „dolny”• Reewaluacja problemu w chwili t=6 spowoduje zmianę

rozwiązania na „górny” (mimo braku zmiany parametrów problemu)

• Taka zmiana decyzji to niespójność czasowa decyzji

t 0 1 2 3 4 5 6 7vt 0 0 0 0 0 0 85 0

bdt 1 0,81 0,729 0,656 0,59 0,531 0,478 0,43

t 0 1 2 3 4 5 6 7vt 0 0 0 0 0 0 0 100

bdt 1 0,81 0,729 0,656 0,59 0,531 0,478 0,43

PV=40,66

PV=43,05

Scenariusze decydowania• W warunkach niespójności czasowej decyzji możliwe trzy scenariusze

decydowania:– scenariusz optymalizacji globalnej (spójny czasowo) – jednokrotne rozwiązanie

problemu oryginalnego i wdrożenie wybranego rozwiązania bez reeweluacji– scenariusz optymalizacji sekwencyjnej (naiwny) – ciągłe reewaluowanie

problemów zredukowanych i wdrażanie kolejno uzyskiwanych rozwiązań– scenariusz optymalizacji wstecznej (wyszukany) – (rekurencyjne)

przewidywanie przyszłych zachowań i dobieranie bieżącego zachowania tak, aby było optymalne (na moment bieżący) w połączeniu z przyszłym przewidywanym zachowaniem

• Nie zawsze decydent ma możliwość wybrania scenariusza decyzji:– rozproszone decyzje– brak silnej woli

Przykład (na podstawie O’Donoghue i Rabin, AER 1999)

• Michał chodzi do kina w soboty. W lokalnym kinie grafik premier na najbliższe cztery weekendy jest następujący:

– sobota w tym tygodniu: ** (wypłata 3 za obejrzenie);– kolejna sobota: *** (wypłata 5);– kolejna sobota: **** (wypłata 8);– kolejna sobota: ***** (wypłata 13).

• W ciągu miesiąca Michał musi przygotować się do sesji – musi zrezygnować z jednego filmu (i stracić wypłatę)

• Przyszłość (tj. przyszłe straty wypłat) dyskontuje wg funkcji quasi-hiperbolicznej z parametrami:

– b=½ (czyli odróżnia teraźniejszość od przyszłości);– d=1 (czyli nie odróżnia bliższej i dalszej przyszłości).

• Samodzielnie zastanów się, z którego filmu Michał zrezygnuje w poszczególnych scenariuszach decyzyjnych

Scenariusz optymalizacji globalnej (time consistent)

-3 -5 -8 -13

** *** **** *****t=0 t=1 t=2 t=3 t=4

-3/2

-5/2

-8/2

-13/2

Scenariusz optymalizacji sekwencyjnej (naїve)

-3 -5 -8 -13

** *** **** *****t=0 t=1 t=2 t=3 t=4

-3/2

-5/2

-8/2

-13/2

-5/2

-8/2

-13/2

-8/2

-13/2

-13/2

Scenariusz optymalizacji wstecznej (sophisticated)

-3 -5 -8 -13

** *** **** *****t=1 t=2 t=3 t=4

-13/2-13/2-5/2

Przykład – zachowanie wg różnych scenariuszy

-3 -5 -8 -13

** *** **** *****t=0 t=1 t=2 t=3 t=4

Scenariusz optymalizacji globalnej (spójny czasowo): t=0) porównuje-3/2; -5/2; -8/2; -13/2 rezygnuje z ** filmu

Scenariusz optymalizacji sekwencyjnej (naiwny):t=0) porównuje -3/2; -5/2; -8/2; -13/2 planuje zrezygnowanie z ** filmut=1) porównuje -3; -5/2; -8/2; -13/2 planuje zrezygnowanie z *** filmut=2) porównuje -5; -8/2; -13/2 planuje zrezygnowanie z **** filmut=3) porównuje -8; -13/2 rezygnuje z ***** filmu

Scenariusz optymalizacji wstecznej (wyszukany):t=3) porównuje -8; -13/2 zrezygnowałby z ***** filmut=2) porównuje -5; -13/2 zrezygnowałby z *** filmut=1) porównuje -3; -5/2 rezygnuje z *** filmu

Niespójność czasowa decyzji a wartość opcji

• W scenariuszu optymalizacji wstecznej decydent przewiduje swoje przyszłe zachowania choć nie ma na nie wpływu

• Decydent może woleć mieć w przyszłości mniej opcji, żeby nie być narażony na pokusy – jest zdolny oprzeć się pokusom dziś redukując przyszłą liczbę alternatyw:– Michał wolałby w momencie t=0 kupić bilet na film *** w t=2, wtedy

straciłby film **

• Przykłady ograniczania własnych opcji:– ustawianie budzika daleko od łóżka– uczestnictwo w Klubach Świątecznych– zobowiązywanie się do przyszłych działań (np. zgłaszanie się do udziału

w projektach, konferencjach, …)

Niespójność czasowa decyzji a wartość informacji (b=0,5; d=1)

t=0

-15

50%

50%

t=1

-100

-10

t=0

-15

t=1

-10

-100

-10

50%

50%

Unikanie niespójności czasowej decyzji

• Z perspektywy problemu oryginalnego:– ograniczenie zbioru wariantów – np.Odyseusz,

Christmas clubs– wybór rozwiązań suboptymalnych

(optymalnych w scenariuszu optymalizacji wstecznej)

• Z perspektywy problemu zredukowanego:– silna wola – koordynacja z „wcześniejszym ja”– odrzucenie konsekwencjonalizmu – myślenie o całej ścieżce

działań (także przeszłości), a nie jedynie o przyszłych konsekwencjach działań

37

http://www.stickk.com/

Niespójność czasowa decyzji a zachowania konsumentów (Shui i Ausubel, 2005)

• Badanie:– decyzje konsumentów dotyczące wyboru karty kredytowej (oprocentowanie w okresie

promocyjnym i potem)– późniejsze decyzje zakupowe (czy wybrany profil oprocentowania optymalny a

posteriori)

• Dane:– 600 tys. konsumentów objętych próbną kampanią w 1995 r.– 6 profili oprocentowania– 24 miesiące obserwacji po decyzji

• Wyniki:– preferencja niższego oprocentowania na początku, kosztem wyższego później– pozostawanie na ścieżce wysokiego zadłużania się, pomimo wzrostu oprocentowania– współczynnik preferencji teraźniejszości b=0,8

Uproszczony model wyboru profilu oprocentowania i konsumpcji

• Wybór w dwóch okresach:– profil oprocentowania (do spłaty w kolejnym okresie)

• 10% i 10%• 5% i 20%

– konsumpcja na kredyt:• 10 i 0• 10 i 10

• Parametry dyskontowania b=d=0,9

• Wybór profilu oprocentowania i ścieżki konsumpcji w pierwszym okresie

• W drugim okresie możliwość reewaluacji ścieżki konsumpcji

Ilustracja (b=0,9; d=0,9)t 0 1 2% 10% 10% 10%c 10 0 0u 10 -11 0

t 0 1 2% 10% 10% 10%c 10 10 0u 10 10-11 -11

t 0 1 2% 5% 20% 20%c 10 0 0u 10 -10,5 0

t 0 1 2% 5% 20% 20%c 10 10 0u 10 10-10,5 -12

PV=10-11*0,81=1,09

PV==10-1*0,81-11*0,729=1,171

PV==10-10,5*0,81=1,495

PV==10-0,5*0,81-12*0,729=0,847

wybór oprocentowania

wybór konsumpcji

wybór konsumpcji

Ilustracja (b=0,9; d=0,9)

t 1 2% 20% 20%c 0 0u -10,5 0

t 1 2% 20% 20%c 10 0u 10-10,5 -12

PV=-10,5

PV==-0,5-12*0,81=-10,22

wybór konsumpcji

Ilustracja (b=0,9; d=0,9)t 0 1 2% 10% 10% 10%c 10 0 0u 10 -11 0

t 0 1 2% 10% 10% 10%c 10 10 0u 10 10-11 -11

t 0 1 2% 5% 20% 20%c 10 0 0u 10 -10,5 0

t 0 1 2% 5% 20% 20%c 10 10 0u 10 10-10,5 -12

PV=10-11*0,81=1,09

PV==10-1*0,81-11*0,729=1,171

PV==10-10,5*0,81=1,495

PV==10-0,5*0,81-12*0,729=0,847

wybór oprocentowania

wybór konsumpcji

wybór konsumpcji

Podsumowanie• Badania eksperymentalne wykazują, że bardziej adekwatny jest

model z dyskontowaniem hiperbolicznym

• Takie dyskontowania powoduje zachowania niespójne czasowo (zmianę decyzji w wyniku upływu czasu, bez zmiany parametrów problemu)

• W sytuacjach z NCD można zdefiniować kilka scenariuszy postępowania

• NCD powoduje zaskakujące efekty: chęć ograniczania własnych opcji, ujemną wartość informacji

Materiały

• T. O’Donoghue, M. Rabin (1999): „Doing it Now or Later”, The American Economic Review, ss. 103-124

• G. Akerlof (1991): „Procrastination and Obedience”, The American Economic Review, 81(2), ss. 1-19

• H. Shui, L. Ausubel (2005): „Time Inconsistency in the Credit Card Market”

45

Dziękuję!

metody analizy decyzji wykład 10 – niespójność czasowa decyzji

Documents