metody analizy decyzji wykład 10 – niespójność czasowa decyzji
DESCRIPTION
Metody analizy decyzji Wykład 10 – niespójność czasowa decyzji. Eksperyment motywujący. Czy wolałbyś/ łabyś ? A) 15 minut masażu teraz czy B) 20 min ut mas ażu za godzinę. Czy wolałbyś/ łabyś ? A) 15 minut masażu za tydzień czy B) 20 min ut mas ażu za tydzień i jedną godzinę. - PowerPoint PPT PresentationTRANSCRIPT
Metody analizy decyzji
Wykład 10 – niespójność czasowa decyzji
Czy wolałbyś/łabyś?A) 15 minut masażu teraz
czyB) 20 minut masażu za godzinę
Eksperyment motywujący
Czy wolałbyś/łabyś?A) 15 minut masażu za tydzień
czyB) 20 minut masażu za tydzień i jedną godzinę
Read i van Leeuwen (1998)
CzasWybór dzisiaj Konsumpcja za tydzień
Jeśli decydowałbyś/łabyś dzisiaj,co wybrałbyś/łabyś owoce czy czekoladęna następny tydzień?
CzasWybór dzisiaj Konsumpcja za tydzień
Dzisiaj ludzie często decydują się na owoce na następny tydzień?
Cierpliwe wybory na następny tydzień
74% wybrało owoce
Niecierpliwe wybory na dzisiaj
Czas
Wybór i konsumpcja jednocześnie
Jeśli decydowałbyś/łabyś dzisiaj,co wybrałbyś/łabyś owoce czy czekoladęna dzisiaj?
Preferencje niespójne czasowo
Czas
Wybór i konsumpcja jednocześnie
70%wybiera czekoladę
Read, Loewenstein & Kalyanaraman (1999)
Wybierz spośród 24 filmów video:• Niektóre lekkie i mniej ambitne: Four Weddings and a Funeral• Niektóre nieco cięższe I bardziej ambitne : Schindler’s List
• Wybór na dzisiaj: 66% badanych wybiera lekkie• Wybór na następną środę: 37% badanych wybiera lekkie.• Wybór na jeszcze następną środę: 29% wybiera lekkie.
Dzisiaj chcę się zabawić… w następnym tygodniu chcę rzeczy, które są dobre dla mnie
Bardzo spragnieni respondenciMcClure, Ericson, Laibson, Loewenstein i Cohen (2007)
• Wybór pomiędzy wypiciem, sok teraz lub 2x sok za 5 minut
60% badanych wybrało pierwszą opcję.• Wybór pomiędzy wypiciem
sok za 20 minut lub 2x sok za 25 minut 30% badanych wybrało pierwszą opcję
• Autorzy estymują, że 5-minutowy współczynnik dyskontujący to 50%, a długo-terminowy współczynnik dyskontujący to 0%
• Ramsey (1930s), Strotz (1950s), & Herrnstein (1960s) byli pierwsi, którzy zrozumieli, że współczynniki dyskontujące są wyższe w krótkim okresie niż w długim.
• Klasyczna forma funkcyjna – funkcja wykładnicza D(t) = dt
D(t) = 1, d, d2, d3, ...Ut = ut + d ut+1 + d2 ut+2 + d3 ut+3 + ...
• Ale funkcja wykładnicza nie jest w stanie opisać efektu natychmiastowego bonusa (instant gratification effect)
• Funkcja dyskontująca maleje w stałym tempie. • Funkcja dyskontująca nie maleje szybciej w krótkim
okresie niż w długim.
Teoretyczne wprowadzenie
Funkcja wykładnicza
1 6 11 16 21 26 31 36 41 46 510
1
Tygodnie (Czas=t)
Zdys
kont
owan
a w
arto
ść
przy
szłe
go p
rzyc
hodu
Stała stopa spadku
-D'(t)/D(t) = stopa spadku funkcji
1 6 11 16 21 26 31 36 41 46 510
1Funkcje dyskontujące
Wykładnicza Hiperboliczna
Wysoka stopa spadku w krótkim okresie
Niska stopa spadku w długim okresie
Paradoks dyskontowania wykładniczego.
Załóżmy, że ludzie dyskontują przynajmniej 1% pomiędzy dzisiaj a jutro.
Załóżmy, że ich funkcje dyskontujące są wykładnicze. Wówczas 100 za t lat jest warte 100*e(-0.01)*365*t dzisiaj.
• Ile jest dzisiaj warte 100 dzisiaj? 100.00• Ile jest dzisiaj warte 100 za rok? 2.55• Ile jest dzisiaj warte 100 za dwa lata? 0.07• Ile jest dzisiaj warte 100 za trzy lata? 0.00
Alternatywna forma funkcyjna
Dyskontowanie QUASI-HIPERBOLICZNE(Phelps and Pollak 1968, Laibson 1997)
D(t) = 1, bd, bd2, bd3, ...Ut = ut + bdut+1 + bd2ut+2 + bd3ut+3 + ...
Ut = ut + b [dut+1 + d2ut+2 + d3ut+3 + ...]
b Dyskontuje jednakowo wszystkie przyszłe okresy.d Dyskontuje wykładniczo wszystkie przyszłe okresy
W czasie ciągłym: patrz Barro (2001), Luttmer i Marriotti (2003), oraz Harris i Laibson (2009)
Intuicja
• Załóżmy, że b = ½ oraz d = 1.• Zdyskontowana funkcja użyteczności:
Ut = ut + ½ [ut+1 + ut+2 + ut+3 + ...]
• Zdyskontowana funkcja użyteczności z perspektywy czasu t+1. Ut+1 = ut+1 + ½ [ut+2 + ut+3 + ...]
• Funkcja dyskontująca odzwierciedla dynamiczną niespójność: preferencje w czasie t nie zgadzają się z preferencjami w czasie t+1.
Zastosowanie dla masażyb = ½ oraz d = 1
A 15 minut terazB 20 minut za 1 godzinę
C 15 minut za 1 tydzieńD 20 minut za 1 tydzień i 1 godzinę
NPV w minutach bieżących
15 minut teraz10 minut teraz
7.5 minut teraz10 minut teraz
Zastosowanie dla masażyb = ½ oraz d = 1
A 15 minut terazB 20 minut za 1 godzinę
C 15 minut za 1 tydzieńD 20 minut za 1 tydzień i 1 godzinę
NPV w minutach bieżących
15 minut teraz10 minut teraz
7.5 minut teraz10 minut teraz
Ćwiczenia
• Załóżmy, że b = ½ oraz d = 1.• Załóżmy, że ćwiczenia (wysiłek bieżący 6) generują przyszłe
korzyści (poprawa stanu zdrowia 8).• Czy chcesz ćwiczyć?
• Ćwiczyć teraz: -6 + ½ [8] = -2• Ćwiczyć jutro: 0 + ½ [-6 + 8] = +1
• Czyli decydent chciałby wypoczywać dzisiaj i ćwiczyć jutro.• Ale nie jest stanie tego zrealizować bez poczynienia
zobowiązania.
Osądy na temat przyszłości?
• Wysofistykowani decydenci: wiedzą, że ich plany, aby być cierpliwym jutro nie wypalą (Strotz, 1957).– “Nie rzucę palenia w następnym tygodniu, chociażbym
tego chciał.”• Naiwni: wierzą mylnie, że ich plany, aby być cierpliwym
powiodą się (Strotz, 1957). Myślą, że β=1 w przyszłości.– “Rzucę palenie w następnym tygodniu, chociaż nie
udawało mi się to przez wszystkie tygodnie ostatnich 5 lat.”
• Częściowo naiwni: mylnie wierzą, że β=β* w przyszłości, gdzie β < β* < 1 (O’Donoghue and Rabin, 2001).
Cele dzisiejszego wykładu
• Uwzględnienie sekwencyjności problemu – analiza możliwości reewaluacji problemu
• Analiza dyskontowania przyszłości• Niespójność czasowa decyzji
Dyskontowanie – kilka pytań• Co wolisz:
– 100 PLN dziś?– 100 PLN za miesiąc?
• Czemu dyskontujemy?– niecierpliwość– niepewność– możliwość lokowania (przyczyna czy skutek?)
• Wartość bieżąca strumienia wypłat vt dla czynnika dyskontującego 0<d<1
T
tt
tvPV0
d
Klasyczne dyskontowanie – własności (d=0,9)
t 0 1 2 3 4 5 6 7vt 0 0 0 0 0 0 85 0
dt 1 0,9 0,81 0,729 0,656 0,59 0,531 0,478
t 0 1 2 3 4 5 6 7vt 0 0 0 0 0 0 0 100
dt 1 0,9 0,81 0,729 0,656 0,59 0,531 0,478
PV=45,17
PV=47,83
t 0 1
vt 85 0
dt 1 0,9
t 0 1
vt 0 100
dt 1 0,9
PV=85
PV=900dd
dd
Bk
A
tB
ktA
vv
vv
+
Jakub i Ezaw
23
• http://www.ted.com/index.php/talks/joachim_de_posada_says_don_t_eat_the_marshmallow_yet.html
Czy zjesz ptasie mleczko? Eksperyment w Stanford
Dyskontowanie – dalsze pytania• Co wolisz:
– 1000 PLN dziś?– 1050 PLN za miesiąc?
• Co wolisz:– 1000 PLN za rok?– 1050 PLN za rok i miesiąc?
• Czy stopa dyskontowa jest stała w czasie?– eksperymenty wskazują, że ludzie przywiązują dużą wartość do
teraźniejszości (rozróżnienie między dwoma okresami w przyszłości jest mniej ważne)
– podobne wyniki dla zwierząt!
Dyskontowanie hiperboliczne
• Czynnik dyskontujący dla momentu t>0 wynosi bdt, gdzie 0<b<1 i 0<d<1– b reprezentuje dodatkowy nacisk na
teraźniejszość (krótkowzroczność, myopia)
Dyskontowanie hiperboliczne – własności (b=0,9; d=0,9)
t 0 1 2 3 4 5 6 7vt 0 0 0 0 0 0 85 0
bdt 1 0,81 0,729 0,656 0,59 0,531 0,478 0,43
t 0 1 2 3 4 5 6 7vt 0 0 0 0 0 0 0 100
bdt 1 0,81 0,729 0,656 0,59 0,531 0,478 0,43
PV=40,66
PV=43,05
t 0 1
vt 85 0
bdt 1 0,81
t 0 1
vt 0 100
bdt 1 0,81
PV=85
PV=81
0
ale ,
dbd
bdbd
Bk
A
tB
ktA
vv
vv
<
+
Niespójność czasowa decyzji
• Rozwiązaniem poniższego problemu jest wariant „dolny”• Reewaluacja problemu w chwili t=6 spowoduje zmianę
rozwiązania na „górny” (mimo braku zmiany parametrów problemu)
• Taka zmiana decyzji to niespójność czasowa decyzji
t 0 1 2 3 4 5 6 7vt 0 0 0 0 0 0 85 0
bdt 1 0,81 0,729 0,656 0,59 0,531 0,478 0,43
t 0 1 2 3 4 5 6 7vt 0 0 0 0 0 0 0 100
bdt 1 0,81 0,729 0,656 0,59 0,531 0,478 0,43
PV=40,66
PV=43,05
Scenariusze decydowania• W warunkach niespójności czasowej decyzji możliwe trzy scenariusze
decydowania:– scenariusz optymalizacji globalnej (spójny czasowo) – jednokrotne rozwiązanie
problemu oryginalnego i wdrożenie wybranego rozwiązania bez reeweluacji– scenariusz optymalizacji sekwencyjnej (naiwny) – ciągłe reewaluowanie
problemów zredukowanych i wdrażanie kolejno uzyskiwanych rozwiązań– scenariusz optymalizacji wstecznej (wyszukany) – (rekurencyjne)
przewidywanie przyszłych zachowań i dobieranie bieżącego zachowania tak, aby było optymalne (na moment bieżący) w połączeniu z przyszłym przewidywanym zachowaniem
• Nie zawsze decydent ma możliwość wybrania scenariusza decyzji:– rozproszone decyzje– brak silnej woli
Przykład (na podstawie O’Donoghue i Rabin, AER 1999)
• Michał chodzi do kina w soboty. W lokalnym kinie grafik premier na najbliższe cztery weekendy jest następujący:
– sobota w tym tygodniu: ** (wypłata 3 za obejrzenie);– kolejna sobota: *** (wypłata 5);– kolejna sobota: **** (wypłata 8);– kolejna sobota: ***** (wypłata 13).
• W ciągu miesiąca Michał musi przygotować się do sesji – musi zrezygnować z jednego filmu (i stracić wypłatę)
• Przyszłość (tj. przyszłe straty wypłat) dyskontuje wg funkcji quasi-hiperbolicznej z parametrami:
– b=½ (czyli odróżnia teraźniejszość od przyszłości);– d=1 (czyli nie odróżnia bliższej i dalszej przyszłości).
• Samodzielnie zastanów się, z którego filmu Michał zrezygnuje w poszczególnych scenariuszach decyzyjnych
Scenariusz optymalizacji globalnej (time consistent)
-3 -5 -8 -13
** *** **** *****t=0 t=1 t=2 t=3 t=4
-3/2
-5/2
-8/2
-13/2
Scenariusz optymalizacji sekwencyjnej (naїve)
-3 -5 -8 -13
** *** **** *****t=0 t=1 t=2 t=3 t=4
-3/2
-5/2
-8/2
-13/2
-5/2
-8/2
-13/2
-8/2
-13/2
-13/2
Scenariusz optymalizacji wstecznej (sophisticated)
-3 -5 -8 -13
** *** **** *****t=1 t=2 t=3 t=4
-13/2-13/2-5/2
Przykład – zachowanie wg różnych scenariuszy
-3 -5 -8 -13
** *** **** *****t=0 t=1 t=2 t=3 t=4
Scenariusz optymalizacji globalnej (spójny czasowo): t=0) porównuje-3/2; -5/2; -8/2; -13/2 rezygnuje z ** filmu
Scenariusz optymalizacji sekwencyjnej (naiwny):t=0) porównuje -3/2; -5/2; -8/2; -13/2 planuje zrezygnowanie z ** filmut=1) porównuje -3; -5/2; -8/2; -13/2 planuje zrezygnowanie z *** filmut=2) porównuje -5; -8/2; -13/2 planuje zrezygnowanie z **** filmut=3) porównuje -8; -13/2 rezygnuje z ***** filmu
Scenariusz optymalizacji wstecznej (wyszukany):t=3) porównuje -8; -13/2 zrezygnowałby z ***** filmut=2) porównuje -5; -13/2 zrezygnowałby z *** filmut=1) porównuje -3; -5/2 rezygnuje z *** filmu
Niespójność czasowa decyzji a wartość opcji
• W scenariuszu optymalizacji wstecznej decydent przewiduje swoje przyszłe zachowania choć nie ma na nie wpływu
• Decydent może woleć mieć w przyszłości mniej opcji, żeby nie być narażony na pokusy – jest zdolny oprzeć się pokusom dziś redukując przyszłą liczbę alternatyw:– Michał wolałby w momencie t=0 kupić bilet na film *** w t=2, wtedy
straciłby film **
• Przykłady ograniczania własnych opcji:– ustawianie budzika daleko od łóżka– uczestnictwo w Klubach Świątecznych– zobowiązywanie się do przyszłych działań (np. zgłaszanie się do udziału
w projektach, konferencjach, …)
Niespójność czasowa decyzji a wartość informacji (b=0,5; d=1)
t=0
-15
50%
50%
t=1
-100
-10
t=0
-15
t=1
-10
-100
-10
50%
50%
Unikanie niespójności czasowej decyzji
• Z perspektywy problemu oryginalnego:– ograniczenie zbioru wariantów – np.Odyseusz,
Christmas clubs– wybór rozwiązań suboptymalnych
(optymalnych w scenariuszu optymalizacji wstecznej)
• Z perspektywy problemu zredukowanego:– silna wola – koordynacja z „wcześniejszym ja”– odrzucenie konsekwencjonalizmu – myślenie o całej ścieżce
działań (także przeszłości), a nie jedynie o przyszłych konsekwencjach działań
37
http://www.stickk.com/
Niespójność czasowa decyzji a zachowania konsumentów (Shui i Ausubel, 2005)
• Badanie:– decyzje konsumentów dotyczące wyboru karty kredytowej (oprocentowanie w okresie
promocyjnym i potem)– późniejsze decyzje zakupowe (czy wybrany profil oprocentowania optymalny a
posteriori)
• Dane:– 600 tys. konsumentów objętych próbną kampanią w 1995 r.– 6 profili oprocentowania– 24 miesiące obserwacji po decyzji
• Wyniki:– preferencja niższego oprocentowania na początku, kosztem wyższego później– pozostawanie na ścieżce wysokiego zadłużania się, pomimo wzrostu oprocentowania– współczynnik preferencji teraźniejszości b=0,8
Uproszczony model wyboru profilu oprocentowania i konsumpcji
• Wybór w dwóch okresach:– profil oprocentowania (do spłaty w kolejnym okresie)
• 10% i 10%• 5% i 20%
– konsumpcja na kredyt:• 10 i 0• 10 i 10
• Parametry dyskontowania b=d=0,9
• Wybór profilu oprocentowania i ścieżki konsumpcji w pierwszym okresie
• W drugim okresie możliwość reewaluacji ścieżki konsumpcji
Ilustracja (b=0,9; d=0,9)t 0 1 2% 10% 10% 10%c 10 0 0u 10 -11 0
t 0 1 2% 10% 10% 10%c 10 10 0u 10 10-11 -11
t 0 1 2% 5% 20% 20%c 10 0 0u 10 -10,5 0
t 0 1 2% 5% 20% 20%c 10 10 0u 10 10-10,5 -12
PV=10-11*0,81=1,09
PV==10-1*0,81-11*0,729=1,171
PV==10-10,5*0,81=1,495
PV==10-0,5*0,81-12*0,729=0,847
wybór oprocentowania
wybór konsumpcji
wybór konsumpcji
Ilustracja (b=0,9; d=0,9)
t 1 2% 20% 20%c 0 0u -10,5 0
t 1 2% 20% 20%c 10 0u 10-10,5 -12
PV=-10,5
PV==-0,5-12*0,81=-10,22
wybór konsumpcji
Ilustracja (b=0,9; d=0,9)t 0 1 2% 10% 10% 10%c 10 0 0u 10 -11 0
t 0 1 2% 10% 10% 10%c 10 10 0u 10 10-11 -11
t 0 1 2% 5% 20% 20%c 10 0 0u 10 -10,5 0
t 0 1 2% 5% 20% 20%c 10 10 0u 10 10-10,5 -12
PV=10-11*0,81=1,09
PV==10-1*0,81-11*0,729=1,171
PV==10-10,5*0,81=1,495
PV==10-0,5*0,81-12*0,729=0,847
wybór oprocentowania
wybór konsumpcji
wybór konsumpcji
Podsumowanie• Badania eksperymentalne wykazują, że bardziej adekwatny jest
model z dyskontowaniem hiperbolicznym
• Takie dyskontowania powoduje zachowania niespójne czasowo (zmianę decyzji w wyniku upływu czasu, bez zmiany parametrów problemu)
• W sytuacjach z NCD można zdefiniować kilka scenariuszy postępowania
• NCD powoduje zaskakujące efekty: chęć ograniczania własnych opcji, ujemną wartość informacji
Materiały
• T. O’Donoghue, M. Rabin (1999): „Doing it Now or Later”, The American Economic Review, ss. 103-124
• G. Akerlof (1991): „Procrastination and Obedience”, The American Economic Review, 81(2), ss. 1-19
• H. Shui, L. Ausubel (2005): „Time Inconsistency in the Credit Card Market”
45
Dziękuję!