análise de decisão - ufjf · 2015-03-06 · modelagem e simulação - análise de decisão notas...

Para os peixinhos do aquário, quem troca a água é Deus. - Mário Quintana

Análise de Decisão

Thomas Bayes

(*1702, Londres, Inglaterra; †1761 em Tunbridge Wells, Inglaterra).

Modelagem e Simulação - Análise de Decisão

Notas de Aula - Fernando Nogueira 2

1. Introdução

A Análise de Decisão envolve o uso de processos racionais para selecionar a melhor

alternativa dentre um conjunto de alternativas possíveis.

Os processos de tomada de decisão podem ser divididos em duas principais

categorias:

1) Tomada de Decisão Sem Experimentação, e

2) Tomada de Decisão Com Experimentação.

Os problemas abaixo exemplificam algumas situações nas quais se faz necessário

tomar alguma decisão:

� Uma indústria lança um novo produto no mercado. Qual será a reação dos

clientes potenciais? Quanto deveria ser produzido? A aceitação do produto

por parte do mercado deveria ser testada em uma pequena região antes de

decidir sobre a distribuição total do produto? Quanto se deve investir em

publicidade para lançar o produto?

� Uma concorrência pública será aberta. Qual será o custo do projeto? Quais

as potencias companhias que poderiam concorrer?

� Uma firma agrícola necessita planejar para o próximo ano o uso de suas

terras. Quantos hectares devem ser destinados a pastagens para criação de

gado e quantos hectares devem ser destinados ao plantio de milho e soja?

Estes exemplos são tipos de processos de tomada de decisão nos quais existe uma

grande incerteza envolvida. Análise de Decisão fornece uma metodologia para tomar tais

decisões de maneira racional.

O exemplo protótipo abaixo será utilizado para ilustrar a metodologia envolvida.

Exemplo Protótipo: a companhia GoferBroke possui terras que podem ter petróleo. Um

levantamento geofísico determinou que existe 1 chance em 4 de realmente existir petróleo

nestas terras. Por causa desta informação, outra companhia petrolífera quer comprar estas

terras por $90.000,00. Entretanto, a GoferBroke sabe que o custo para perfurar um poço

naquela região é $100.000,00. Se for encontrado petróleo, o retorno esperado deverá ser de

$800.000,00. Descontando o custo da perfuração, o lucro então será de $700.000,00.

A tabela abaixo resume estas informações.



Tabela 1 - Payoff para a companhia GoferBroke

Estado

Alternativa

Payoff

Poço com Petróleo Poço Seco

Perfurar $700.000,00 $-100.000,00

Vender a terra $90.000,00 $90.000,00

Chance 1 em 4 3 em 4

Qual a decisão que a companhia GoferBroke deve tomar: 1) vender a terra e ganhar

$90.000,00 sem riscos ou 2) perfurar o poço a um custo de $100.000,00 e obter um retorno

de $800.000,00, resultando em lucro de $700.000,00 com um risco estimado em 75% (3 em

4) ?

2. Tomada de Decisão Sem Experimentação

Como se percebe no exemplo protótipo, existe uma informação referente à chance

que existe em achar petróleo ou não. Esta informação pode ser convertida em uma medida

de probabilidade. Com isso, pode-se dizer que existe uma probabilidade de 0.25 de

encontrar petróleo e conseqüentemente, uma probabilidade de 0.75 de não encontrar

petróleo. A estas probabilidades dá-se o nome de Probabilidades a Priori.

Na terminologia de Análise de Decisão, os valores $700.000,00, $-100.000,00,

$90.000,00 e $90.000,00 da tabela 1 são denominados Payoffs e os nomes “Poço com

Petróleo” e “Poço Seco” são denominados Estados da Natureza.

Por Tomada de Decisão Sem Experimentação, entende-se que é de conhecimento

apenas as Probabilidades a Priori e os Estados da Natureza.

Neste tipo de tomada de decisão pode-se utilizar, entre outros, três critérios:

1. Critério de Maximin Payoff,

2. Critério de Máxima Verossimilhança, e

3. Critério da Regra de Bayes.

2.1 Critério de Maximin Payoff

Neste critério, o problema de tomar uma decisão é vista como um Jogo (Teoria dos

Jogos) entre o Tomador de Decisão (jogador A) e a Natureza (jogador B).

Como a matriz de Payoff é geralmente formada para o Tomador de Decisão (os

valores da matriz são os payoff para o jogador A), a decisão pode ser tomada baseada no

Critério de Maximin Payoff.



Critério de Maximin Payoff: para cada ação (estratégia), encontrar o mínimo payoff entre

todos os Estados da Natureza e então encontrar o máximo destes payoff mínimos. Escolher

a ação cujo mínimo payoff resultou neste máximo.

No exemplo protótipo o Maximin é:

Estado

Alternativa

Payoff Mínimo em

Linha


Perfurar $700.000,00 -$100.000,00 $-100.000,00

Vender a terra $90.000,00 $90.000,00 $90.000,00 Maximin

Com isso, a decisão a ser tomada é vender a terra.

2.2 Critério de Máxima Verossimilhança

Este critério assume como decisão a ser tomada a que for mais provável.

Critério de Máxima Verossimilhança: identificar o Estado da Natureza mais provável (o

com maior probabilidade). Para este Estado da Natureza, encontrar a ação com máximo

payoff. Escolher esta ação.

Aplicando este critério para o exemplo protótipo, indica que o Estado Poço Seco

possui a maior probabilidade. Na coluna "Poço Seco", a alternativa "Vender a terra" possui

o maior payoff.

Estado

Alternativa

Payoff


Perfurar $700.000,00 $-100.000,00

Vender a terra $90.000,00 $90.000,00 Máximo

Probabilidade à Prior 0.25 0.75

Máximo

Com isso, a ação a ser tomada, segundo este critério é vender a terra.

O maior problema deste critério é que este ignora completamente muita informação

relevante. Nenhum outro Estado da Natureza é considerado, a não ser o mais provável.



2.3 Critério da Regra de Bayes

Regra de Decisão de Bayes: usando a melhor estimativa das probabilidades dos

respectivos Estados da Natureza (as Probabilidades à Priori), calcular o valor esperado de

payoff para cada alternativa possível. Escolher a alternativa com máximo payoff esperado.

Para o exemplo protótipo, os payoff esperados E são calculados diretamente a partir

da tabela 1 como:

( )[ ] ( ) 00,000.10000,000.100*75.000,000.700*25.0PerfurarPayoffE =−+= (1)

( )[ ] ( ) 00,000.9000,000.90*75.000,000.90*25.0TerraVenderPayoffE =+= (2)

Uma vez que $100.000,00 é maior que $90.000,00 a ação a ser tomada, segundo

este critério é perfurar o poço. Percebe-se que este critério resultou em uma ação diferente

das ações obtidas segundo os dois critérios anteriores.

A grande vantagem deste critério em relação aos demais é que este incorpora todas

as informações disponíveis (Estados da Natureza e Probabilidades a Priori).

A fim de verificar o efeito de possíveis imprecisões nas Probabilidades a Priori,

pode-se realizar uma Análise de Sensibilidade.

2.3.1 Análise de Sensibilidade para o Critério da Regra de Bayes

A Análise de Sensibilidade para o Critério da Regra de Bayes é facilmente

implementado através da generalização das expressões (1) e (2). Denominando p como a

Probabilidade a Priori para poço com petróleo, a Probabilidade a Priori para poço seco é

dada por 1-p, uma vez que a soma das probabilidades a Priori resulta em 1. Os payoff

esperados (em milhares de $, para simplificação da notação) ficam:

( )[ ] ( ) 100p800p1100p700PerfurarPayoffE −=−−= (3)

( )[ ] ( ) 90p190p90TerraVenderPayoffE =−+= (4)

A figura abaixo mostra em azul a reta dada pela expressão (3), em vermelho a reta

dada pela expressão (4) e em verde a reta que divide a região onde a decisão deveria ser

vender a terra (região à esquerda) da região onde a decisão deveria ser perfurar o poço

(região à direita).



0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1-100

0

100

200

300

400

500

600

700Analise de Sensibilidade para o exemplo GoferBroke

Probabilidade a Priori para Poço com Petroleo

Pay

off

Esp

era

do

Região ondea decisão deveriaser perfurar o poço

Região ondea decisão deveriaser vender a terra

Fig. 1 - Regiões de Decisão para o Critério da Regra de Bayes

Para encontrar a Probabilidade a Priori (ponto no eixo x do gráfico da figura 1) onde

a decisão a ser tomada muda (Crossover Point) faz-se:

( )[ ] ( )[ ]

2375.0800

190p

90100p800TerraVenderPayoffEPerfurarPayoffE

==

=−==

(5)

Com isso, pode-se concluir que se p>0.2375, a decisão deveria ser perfurar o poço e

se p<0.2375, a decisão deveria ser vender a terra.

Para outros problemas que possuem mais de que duas alternativas, o mesmo

procedimento pode ser aplicado, a diferença é que vai haver mais retas (uma para cada

alternativa). No entanto, a reta que estiver mais acima (no exemplo, reta azul acima da

vermelha para a região onde p>0.2375 e reta vermelha acima da azul para a região onde

p<023.75) dentre as demais em uma região indica a decisão a ser tomada.

Com mais que duas retas, poderá haver mais de um Crossover Point, onde a decisão

muda de uma alternativa para outra.

Para problemas com mais de dois Estados da Natureza, a metodologia mais direta é

realizar a Análise de Sensibilidade sobre somente dois Estados de cada vez.



3. Tomada de Decisão Com Experimentação

Freqüentemente, testes adicionais (experimentações) podem ser realizadas para

melhorar as estimativas preliminares dos respectivos Estados da Natureza fornecidos pelas

Probabilidades a Priori. Estas estimativas melhoradas são denominadas Probabilidades a

Posteriori.

Exemplo Protótipo com Experimentação: a companhia GoferBroke pode realizar um

levantamento geofísico mais detalhado das suas terras para obter uma melhor estimativa da

probabilidade de encontrar petróleo. O custo deste levantamento é $30.000,00.

O levantamento geofísico obtém sondagens sísmicas que indicam se a estrutura

geológica é favorável para a presença de petróleo. Assim, as possibilidades de encontrar

petróleo podem ser divididas em duas categorias:

USS: Sondagem Sísmica Desfavorável ⇒ presença de petróleo na região é pouco provável;

FSS: Sondagem Sísmica Favorável ⇒ presença de petróleo na região é bastante provável.

Baseado em experiências passadas, se existir petróleo, então a probabilidade de

Sondagem Sísmica Desfavorável é:

( ) 4.0petróleoEstadoUSSP == , e (6)

( ) 6.04.01petróleoEstadoFSSP =−== (7)

Similarmente, se não há petróleo (isto é, o Estado da Natureza é Poço Seco), então a

probabilidade de Sondagem Sísmica Desfavorável é estimada para ser:

( ) 8.0osecpoçoEstadoUSSP == , e (8)

( ) 2.08.01osecpoçoEstadoFSSP =−== (9)

A estas probabilidades dadas em (6), (7), (8) e (9) dá-se o nome de Probabilidades

Condicionais, a partir das quais se podem encontrar as Probabilidades a Posteriori dos

respectivos Estados da Natureza dada as Sondagens Sísmicas.

3.1 Probabilidades a Posteriori

Em termos gerais, considerando que:



n = número de Estados da Natureza;

P(Estado = estado i) = Probabilidade a Priori que o Estado verdadeiro da Natureza é

o estado i, para i = 1, 2,..., n;

Constatação = constatação a partir de uma experimentação (uma variável aleatótia);

Constatação j = um valor possível de constatação;

P(Estado = estado i | Constatação = constatação j) = Probabilidade a Posteriori que o

Estado verdadeiro da Natureza é estado i, dado que Constatação = constatação j, para i = 1,

2, . . ., n.

O objetivo é:

Dado P(Estado = estado i) e P(Constatação = constatação j | Estado = estado i), para

i = 1, 2,..., . Qual é P(Estado = estado i | Constatação = constatação j)?

Esta questão é respondida por combinar as seguintes fórmulas da teoria de

Probabilidade:

( )( )

( )joconstataçãoConstataçãP

joconstataçãoConstataçã,iestadoEstadoPjoconstataçãoConstataçãiestadoEstadoP

=

===== (10)

( ) ( )∑ =====

n

1kjoconstataçãoConstataçã,kestadoEstadoPjoconstataçãoConstataçãP (11)

( )

( ) ( )iestadoEstadoP.iestadoEstadojoconstataçãoConstataçãP

joconstataçãoConstataçã,iestadoEstadoP

===

===

(12)

A probabilidade em (12), dá-se o nome de Probabilidade Conjunta.

Portanto, para cada i =1, 2,..., n, a fórmula desejada para a Probabilidade a

Posteriori é:

( )

( ) ( )

( ) ( )∑ ===

===

===

=

n

1kkestadoEstadoP.kestadoEstadojoconstataçãoConstataçãP

iestadoEstadoP.iestadoEstadojoconstataçãoConstataçãP

joconstataçãoConstataçãiestadoEstadoP

(13)



A expressão 13 é denominada Teorema de Bayes1.

Retomando o exemplo protótipo, se a constatação do levantamento sísmico é

Sondagem Sísmica Desfavorável (USS), então as Probabilidades a Posteriori são:

( )7

1

)75.0(8.0)25.0(4.0

)25.0(4.0USSoConstataçãpetroleoEstadoP =

+=== (14)

( )7

6

7

11USSoConstataçãosecpoçoEstadoP =−=== (15)

Similarmente, se o levantamento sísmico resulta em Sondagem Sísmica Favorável

(FSS), então:

( )2

1

)75.0(2.0)25.0(6.0

)25.0(6.0FSSoConstataçãpetroleoEstadoP =

+=== (16)

( )2

1

2

11FSSoConstataçãosecpoçoEstadoP =−=== (17)

Uma maneira interessante de organizar estes cálculos é utilizar um diagrama em

árvore de probabilidade.

1 O Teorema de Bayes se basea em que ( ) ( ) ( ) ( ) ( )APA/BPBPB/APBAP ==∩ e, portanto,

( )( )

( )BP

BAPB/AP

∩= ou ( )

( )

( )AP

BAPA/BP

∩= . Assim, de posse de ( )B/AP e ( )BP , calcula-se

( )BAP ∩ e então divide-se esta probabilidade conjunta por ( )AP para se obter ( )A/BP (a probabilidade

condicional inversa de ( )B/AP ).



Fig. 2 - Diagrama em Árvore de Probabilidades.

No diagrama da figura 2, as Probabilidades a Priori estão na primeira coluna e as

Probabilidades Condicionais estão na segunda coluna. Estas probabilidades são as

informações de entrada. Multiplicando cada Probabilidade na primeira coluna por uma

probabilidade na segunda coluna resulta na Probabilidade Conjunta correspondente na

terceira coluna. Cada Probabilidade Conjunta torna-se o numerador no cálculo das

Probabilidades a Posteriori na quarta coluna. Acumulando as Probabilidades Conjuntas

com mesma constatação, fornece o denominador para cada Probabilidade a Posteriori com

esta constatação.

Depois que estes cálculos foram completados, a Regra de Decisão de Bayes pode

ser aplicada simplesmente como em (1) e (2), com as Probabilidades a Posteriori no lugar

das Probabilidades a Priori. De novo, usando os payoffs dados e subtraindo o custo da

experimentação, obtém-se o seguinte resultado:

Payoff Esperado se constatação é Sondagem Sísmica Desfavorável (USS):

( )[ ] ( ) ( ) 7.15301007

6700

7

1USSoConstataçãPerfurarPayoffE −=−−+== (18)



( )[ ] ( ) ( ) 6030907

690

7

1USSoConstataçãVenderPayoffE =−+== (19)

Payoff Esperado se constatação é Sondagem Sísmica Favorável (FSS):

( )[ ] ( ) ( ) 270301002

1700

2

1FSSoConstataçãPerfurarPayoffE =−−+== (20)

( )[ ] ( ) ( ) 6030902

190

2

1FSSoConstataçãVenderPayoffE =−+== (21)

Uma vez que o objetivo é maximizar o Payoff Esperado, estes resultados produzem

a seguinte política ótima, como mostra a tabela 2.

Tabela 2 - Politica Ótima com Experimentação sob a Regra de Decisão de Bayes.

Constatação a

partir do

Levantamento Sísmico

Ação Ótima Payoff Esperado

excluindo custos de

levantamento

Payoff Esperado

incluindo custos de

levantamento

USS vender a terra 90 60

FSS perfurar 300 270

Entretanto, este resultado não responde se é válido gastar (ou não) $30.000,00 para

realizar a experimentação.

3.2 O Valor da Experimentação

Antes de realizar qualquer experimentação, deve-se estimar seu valor potencial.

Para isto pode-se utilizar dois métodos.

O primeiro método assume que o experimento irá remover toda a incerteza sobre o

verdadeiro Estado da Natureza e então se calcula a melhora no Payoff Esperado ignorando

o custo da experimentação. Esta quantidade, denominada Valor Esperado da Informação

Perfeita (EVPI) fornece um limite superior para o valor potencial do experimento.

Portanto, se este limite superior é menor que o custo da experimentação, a experimentação

não deve ser realizada.

Entretanto, se este limite superior excede o custo da experimentação, então um

segundo método deverá ser utilizado. Este segundo método calcula a melhora atual no

Payoff Esperado (ignorando o custo da experimentação) que resultaria a partir de realizar a



experimentação. A comparação da melhora do Payoff Esperado com o custo indica se a

experimentação deve ou não ser realizada.

Valor Esperado da Informação Perfeita: admitindo que a experimentação permita

identificar o verdadeiro Estado da Natureza (informação perfeita) e portanto, a ação a ser

realizada é aquela que fornece o maior Payoff para aquele Estado. Uma vez que não se

conhece qual o Estado da Natureza que será identificado como verdadeiro Estado da

Natureza, o cálculo do Payoff Esperado com Informação Perfeita (ignorando os custos da

experimentação) requer ponderar o máximo Payoff para cada Estado da Natureza pelas suas

respectivas Probabilidades a Priori. A tabela 3 mostra os Payoff Máximos (em milhares de

$) para os possíveis Estados da Natureza do exemplo protótipo.

Tabela 3 - Payoff Máximos para os possíveis Estados da Natureza

Estado

Alternativa

Payoff


Perfurar $700 $-100

Vender a terra $90 $90

Probabilidade à Prior 0.25 0.75

Máximo Payoff $700 $90

O Payoff Esperado com Informação Perfeita (EVWPI) para o exemplo protótipo é

então:

5.242)90(75.0)700(25.0EVWPI =+= (22)

O Valor Esperado da Informação Perfeita (EVPI) é calculado como:

EVWOEEVWPIEVPI −= (23)

onde:

EVWOE é o Valor Esperado Sem Experimentação.

Geralmente a experimentação não fornece Informação Perfeita, porém o EVPI

fornece um limite superior do valor esperado da experimentação.

Para o exemplo protótipo, o Valor Esperado Sem Experimentação (seção 2.3) é 100.

Portanto:



5.1421005.242EVPI =−= (24)

Uma vez que 142.5 é maior que 30 (custo do levantamento geofísico), deve-se

proceder com o levantamento geofísico. O segundo método citado abaixo avalia o potencial

benefício da experimentação.

Valor Esperado da Experimentação: para calcular esta quantidade requer primeiro

computar o Payoff Esperado Com Experimentação (ignorando os custos da

experimentação) (seção 3.1) e as probabilidades das Constatações P(Constatação =

constatação j). Esta quantidade então fica:

( ) [ ]joconstataçãoConstataçãpayoffE.joconstataçãoConstataçãP

açaoExperimentComEsperadoPayoff

j=∑ =

=

(25)

onde:

( )

( ) ( )∑ ===

==

=

n

1kkestadoEstadoP.kestadoEstadojoconstataçãoConstataçãP

joconstataçãoConstataçãP

(26)

Para o exemplo protótipo, tem-se que:

( ) ( ) ( ) 7.075.0*8.025.0*4.0)osecpoço(P.osecpoçoUSSP)petroleo(P.petroleoUSSPUSSP =+=+= (27)

( ) ( ) ( ) 3.075.0*2.025.0*6.0)osecpoço(P.osecpoçoFSSP)petroleo(P.petroleoFSSPFSSP =+=+= (28)

( ) 90USSoConstataçãPayoffE == (29)

( ) 300FSSoConstataçãPayoffE == (30)

Com isso, o Payoff Esperado Com Experimentação é:

153)300(3.0)90(7.0açaoExperimentComEsperadoPayoff =+= (31)

O Valor Esperado da Experimentação (EVE) é dado então por:

açaoExperimentSemEsperadoPayoffaçaoExperimentComEsperadoPayoffEVE −= (32)

Para o exemplo protótipo, fica:



53100153EVE =−= (33)

Uma vez que este valor excede 30 (o custo do levantamento geofísico), a

experimentação deverá ser realizada.

4. Árvores de Decisão

Árvores de Decisão fornecem uma maneira útil de visualmente mostrar o problema

e então organizar o trabalho computacional descrito nas seções anteriores. Tais árvores são

úteis quando uma seqüência de decisões precisa ser realizada.

O exemplo protótipo envolve uma seqüência de duas decisões:

1. O levantamento geofísico deverá ser realizado?

2. Qual ação (perfurar ou vender a terra) deverá ser realizada?

Nestas árvores, os nós são denominados bifurcações (forks) e os arcos são

denominados galhos (branches). Uma bifurcação de decisão (decision fork), representada

aqui por um quadrado, indica que uma decisão precisa ser feita naquele ponto do processo.

Uma bifurcação de chance (chance fork), representada por um círculo, indica que um

evento randômico ocorre naquele ponto.

A árvore da figura 3 mostra a árvore para o exemplo protótipo.

Fig. 3 - Árvore de Decisão para o exemplo protótipo.



Na árvore da figura 3, a primeira decisão é representada pela bifurcação a. A

bifurcação b é a bifurcação de chance representando o evento randômico do resultado do

levantamento geofísico. Os dois galhos provenientes da bifurcação b representam os dois

resultados possíveis do levantamento. Após, vem a segunda decisão (bifurcações c,d e e)

com duas escolhas possíveis. Se a decisão é perfurar, então resultará em outras bifurcações

de chance (f, g e h), que se conectam a dois galhos que representam os dois Estados da

Natureza.

O próximo passo na construção da árvore de decisão é inserir o fluxo de dinheiro e

as probabilidades referentes a cada galho (arco). Na figura 4, as probabilidades estão em

azul dentro de parênteses e o fluxo de dinheiro (em milhares de $) em vermelho e em verde,

no canto direito da figura encontra-se os valores de Payoff para cada ação.

Fig. 4 - Árvore de Decisão para o exemplo protótipo com fluxo de dinheiro e probabilidades.



4.1 Realizando a Análise

De posse da Árvore de Decisão (como na figura 4), pode-se realizar a análise, de

acordo com os seguintes passos:

1. Começar no lado direito da Árvore e mover para a esquerda uma coluna de cada

vez. Para cada coluna, utilizar o passo 2 ou passo 3, dependendo se a bifurcação na

coluna é uma bifurcação de chance ou uma bifurcação de decisão.

2. Para cada bifurcação de chance calcular seu Payoff Esperado multiplicando o Payoff

Esperado de cada galho (em verde, na figura 4) pela probabilidade de cada galho e

então somar estes produtos. Armazenar este Payoff Esperado para cada bifurcação

de decisão (também em verde na figura 5) e designar esta quantidade como sendo o

Payoff Esperado para o galho oriundo desta bifurcação.

3. Para cada bifurcação de decisão comparar o Payoff Esperado de seus galhos e

escolher a alternativa cujo galho tem maior Payoff Esperado. Em cada caso,

armazenar a escolha na Árvore de Decisão inserindo barras duplas (representando

uma barreira) em cada galho rejeitado (ver figura 5).

Para começar o procedimento, considere a coluna mais à direita cujos galhos originam-

se das bifurcações f, g e h. Aplicando o passo 2, seus Payoff Esperados (EP) são

calculados como:

7.15)130(7

6)670(

7

1EP −=−+= para bifurcação f (34)

270)130(2

1)670(

2

1EP =−+= para bifurcação g (35)

100)100(4

3)700(

4

1EP =−+= para bifurcação h (36)

Estes Payoff Esperados são colocados acima destas bifurcações (ver figura 5).

Dando seqüência, move-se uma coluna para a esquerda, o que consiste em alcançar

as bifurcações de decisão c,d e e. Através do passo 3 obtém-se:

Bifurcação c: perfurar com EP = -15.7

vender com EP = 60

60>-15.7, portanto escolher vender



Bifurcação d: perfurar com EP = 270

vender com EP = 60

270>60, portanto escolher perfurar

Bifurcação e: perfurar com EP = 100

vender com EP = 90

100>90, portanto escolher perfurar

Estes Payoff Esperados são colocados acima destas bifurcações de decisão (ver

figura 5). A alternativa escolhida também está indicando para inserir barras duplas nos

galhos rejeitados.

Movendo mais uma coluna a esquerda alcança-se a bifurcação de chance b.

Aplicando o passo 2, os Payoff Esperados de seus galhos encontram-se armazenados

sobre as seguintes bifurcações de decisão (c e d). Portanto, o Payoff Esperado é:

123)270(3.0)60(7.0EP =+= para bifurcação b (37)

Finalmente, alcança-se a bifurcação de decisão a. Aplicando o passo 3, resulta em:

Bifurcação a: fazer levantamento geofísico com EP = 123.

não fazer levantamento geofísico com EP = 100

123>100, portanto escolher fazer levantamento.

O Payoff Esperado de 123 deve ser colocado sobre a bifurcação a e uma barra dupla

indicando o galho rejeitado.



Fig. 5 - Árvore de Decisão final para o exemplo protótipo.

Uma vez concluída a Árvore, move-se da esquerda para a direita através apenas dos

caminhos abertos (sem barras duplas), o que resulta na seguinte política ótima:

Política Ótima:

Fazer levantamento geofísico,

Se resultado é desfavorável, vender a terra, senão perfurar.

O Payoff Esperado (incluindo os custos do levantamento) é 123 ($123.000,00).

Esta solução ótima (única) é a mesma que pode ser obtida sem o beneficio da

Árvore de Decisão aplicando a expressão 37 para os valores da tabela 2.



5. Teoria da Utilidade

Nas seções anteriores, considerou-se que o Payoff Esperado em termos monetários é

uma medida apropriada das conseqüências de tomar uma ação. Entretanto, em muitas

situações esta consideração não reflete o "verdadeiro" Payoff Esperado que o tomador de

decisões deseja. O parágrafo abaixo explica o porquê disto.

Supondo que seja oferecido a um indivíduo um investimento (jogo, negócio,...) no

qual há (1) uma chance de 50% de ganhar $100.000,00 ou (2) receber $40.000,00 com

garantia (chance de 100%). Muitas pessoas devem preferir a opção 2 (receber $40.000,00

com garantia), mesmo embora o Payoff Esperado de ganhar $100.000,00 em uma chance de

50% é $50.000,00.

Este exemplo não invalida a Regra de Decisão de Bayes porque existe uma maneira

de transformar os valores monetários para uma escala apropriada que reflete as preferências

do tomador de decisão. Esta escala é denominada Função de Utilidade para o Dinheiro.

A figura 6 mostra um exemplo desta função para um indivíduo (organização) que

tem "aversão ao risco" (verde), "indiferente ao risco" (azul), "atração ao risco" (vermelho).

As funções na figura 6 indicam que o valor do dinheiro M possui uma utilidade

u(M). De maneira textual, para a curva "aversão ao risco", por exemplo, um ganho de 600

(M = 600) possui uma utilidade de apenas algo em torno de 300 (u(M) = 300), enquanto um

prejuízo de 600 (M = -600) possui uma utilidade em torno de -2500 (u(M) = - 2500). Para

as demais curvas o raciocínio é análogo.

Um modelo bastante comum utilizado para a Função de Utilidade u(M) é dado

abaixo:

( )

−=

−R

M

e1RMu (38)

onde:

M é o valor do dinheiro;

R é a tolerância ao risco do indivíduo.

Assim, uma grande aversão ao risco corresponde para um pequeno valor de R,

enquanto uma atração ao risco corresponde para um alto valor de R.

Neste contexto é comum apresentar as curvas da figura 6 como na figura 7.



-600 -400 -200 0 200 400 600

-3000

-2000

-1000

0

1000

2000

3000

M

u(M)

Função de Utilidade

aversão ao risco

atração ao risco

indiferença ao risco

Fig. 6 - Exemplo de Função de Utilidade para o Dinheiro.

atração ao risco


aversão ao risco

Fig. 7 - Função de Utilidade tipicamente apresentada.

Como exemplo desta teoria, tem-se a Função de Utilidade do Dinheiro para o

exemplo protótipo da companhia GoferBroke de acordo com a figura 8. A companhia

GoferBroke possui aversão ao risco (curva verde).

O procedimento para utilizar a árvore de decisão para analisar o problema de

tomada de decisão é idêntico ao descrito na seção 4, exceto que os Payoff monetários são

substituídos pelos valores de utilidade u(M).



-600 -400 -200 0 200 400 600 -800

-600

-400

-200

0

200

400

600

800

M

u(

M)

Funçao de Utilidade para o dinheiro da GoferBroke

aversão ao risco


Fig. 8 - Função de Utilidade para o Dinheiro da companhia GoferBroke.

A tabela abaixo mostra os valores dos Payoff monetários e seus respectivos valores

de utilidade.

Tabela 4 - Utilidade para a companhia GoferBroke

Payoff Monetário Utilidade

-130 -150

-100 -105

60 60

90 90

670 580

700 600

A Árvore de Decisão agora fica:



Fig. 9 - Árvore de Decisão para o exemplo protótipo com valores de utilidade.

A Política Ótima obtida com os valores de utilidade neste exemplo é a mesma obtida

com os Payoff monetários, apenas com a diferença no valor da Utilidade Esperada (que

corresponde ao Payoff Esperado no caso de utilizar Payoff monetário).

Política Ótima (utilidade):

Fazer levantamento geofísico,

Se resultado é desfavorável, vender a terra, senão perfurar.

A Utilidade Esperada (incluindo os custos do levantamento) é 106.5 ($106.500,00).



FONTE: Hiller & Lieberman, CAP. 15



Exercícios - Análise de Decisão qualquer erro, favor enviar e-mail para [email protected]

1) Uma companhia desenvolveu um novo chip de computador que a habilita a produzir computadores. Alternativamente, está firma pode vender os direitos do chip por $15.000.000,00. Se a companhia escolhe produzir os computadores, a lucratividade dependerá da habilidade da companhia para vender os computadores. Devido a informações dos distribuidores, a companhia irá vender com certeza 10.000 computadores, porém se o produto "emplacar", a companhia poderá vender 100.000 computadores. Para propósitos de análise, estes dois níveis de vendas são dois resultados possíveis, porém, suas probabilidades a priori não são conhecidas. O custo de instalação da linha de produção é de $6.000.000,00. O lucro sobre cada computador vendido é $600,00.

a) Identifique as ações (alternativas), os estados da natureza e a tabela de Payoff.

b) Desenvolva um gráfico dos Payoff Esperados para cada ação alternativa versus a probabilidade a priori de vender 10.000.

c) Determine o ponto de Crossover para o gráfico acima. Qual o significado deste ponto?

d) Assumindo que as probabilidades a priori dos dois níveis de venda são ambos iguais a 0.5, qual ação deveria ser tomada?

2) Dada a seguinte tabela de investimentos:

Economia Crescente

Economia Estável

Economia Decrescente

Investimento Conservador

$30.000,00 $5.000,00 $-10.000,00

Investimento Especulativo

$40.000,00 $10.000,00 $-30.000,00

Investimento Cíclico $-10.000,00 $0,00 $15.000,00

Probabilidade a Priori 0.1 0.5 0.4

Qual investimento deve ser escolhido segundo cada um dos critérios abaixo:

a) Maximin Payoff

b) Máxima Verossimilhança

c) Decisão de Bayes

3) Reconsidere o problema 1 agora considerando que uma pesquisa de mercado ao custo de $1.000.000,00 pode ser realizada para prever qual dos dois níveis de



demanda é mais provável ocorrer. Experiências prévias indicam que tais pesquisas são corretas em dois terços das vezes em que são realizadas.

a) Encontre o EVPI para este problema. Considere a probabilidade a priori de vender 10.000 igual a probabilidade a priori de 100.000 igual a 0.5.

b) A resposta em a) indica que compensa realizar a pesquisa de mercado ?

c) Desenvolva um diagrama em árvore de probabilidade para obter as probabilidades a posteriori dos dois níveis de demanda para cada dos dois resultados possíveis da pesquisa de mercado.

d) Encontre EVE.

4) José toma decisões de acordo com a regra de decisão de Bayes. José construiu a seguinte tabela de Payoff :

Estado da Natureza

Alternativa S1 S2 S3

A1 50 100 -100

A2 0 10 -10

A3 20 40 -40


a) Qual alternativa José deve escolher?

b) Encontre EVPI

c) Qual é o máximo que José deve pagar para obter maiores informações sobre qual estado da natureza irá ocorrer?

5) Suponha que você more em uma região sujeita a terremotos, assim você está considerando comprar um seguro para sua casa ao custo anual de $180,00. A probabilidade de um terremoto danificar sua casa durante um ano é 0.001. Se isto acontece, você estima que o custo dos danos (totalmente cobertos pelo seguro) é $160.000,00. Seus bens (incluindo a sua casa) totalizam $250.000,00.

a) Aplique a regra de decisão de Bayes para determinar qual alternativa (comprar ou não o seguro) maximiza seus bens esperados após 1 ano.

b) Você agora tem construído uma função de utilidade que mede o valor dos seus bens (x) em $. Está função é dada por ( ) xxu = . Compare a utilidade de reduzir seus bens totais no próximo ano pelo custo do seguro contra terremotos com a utilidade esperada no próximo ano de não comprar o seguro contra terremoto. Você deveria comprar o seguro?



6) Faça um programa que calcule, dado uma matriz de Payoff para n estados da natureza e m alternativas, os payoff´s seguindo os critérios de Maximin, Maxima Verossimilhança e Bayes.

7) Faça um programa que gere, a cada iteração, uma matriz de Payoff com valores aleatórios para os intervalos dado na tabela abaixo:

Estado

Alternativa

Payoff


Perfurar M11 M12

Vender a terra M21 M22

Probabilidade à

Prior

p1 p2

onde:

M11 = [300,1000]

M12 = [-300,-50]

M21 = M22 = [50,120]

p1 = [0.05,0.40]

p2 = 1- p1

A cada iteração o programa deverá determinar os Payoff´s seguindo os critérios de Maximin, Maxima Verossimilhança e Bayes. Após várias iterações, verificar qual dos critérios resultou em melhor payoff a cada iteração e os payoff´s médios para cada critério.



Respostas

1.a)

1.b)

( )[ ] ( ) 54p54p154p0esComputadoroduzirPrPayoffE +−=−+=

( )[ ] ( ) 15p115p15DireitosVenderPayoffE =−+=

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 10

10

20

30

40

50

60Analise de Sensibilidade

Probabilidade a Priori para Vender 10.000

Pa

yoff E

spera

do

1.c)

( )[ ] ( )[ ] 7222.054

39p1554p54DireitosVenderPayoffEesComputadoroduzirPrPayoffE ==⇒=+−⇒=

O significado do ponto de crossover é que se a probabilidade a priori de vender 10.000 computadores for menor que 0.7222, a decisão a ser tomada, segundo o critério de Bayes é Produzir Computadores, caso contrário, é Vender Direitos.

1.d) Obviamente, Produzir Computadores.

Alternativas

Estado da Natureza

Vender 10.000 Vender 100.000

Produzir Computadores 0 54

Vender Direitos 15 15



2.a)

Economia Crescente

Economia Estável


Mínimo em Linha


$30.000,00 $5.000,00 $-10.000,00 -10.000,00 Maximin


$40.000,00 $10.000,00 $-30.000,00 -30.000,00

Investimento Cíclico

$-10.000,00 $0,00 $15.000,00 -10.000,00 Maximin

Investimento Conservador ou Investimento Cíclico.

2.b)

Economia Crescente

Economia Estável



$30.000,00 $5.000,00 $-10.000,00


$40.000,00 $10.000,00 $-30.000,00 Máximo

Investimento Cíclico $-10.000,00 $0,00 $15.000,00

Probabilidade a Priori

0.1 0.5 0.4

Máximo

Investimento Especulativo.

2.c)

( )[ ] ( ) 00,500.100,000.10*4.000,000.5*5.000,000.30*1.0rConservadoPayoffE =−++=

( )[ ] ( ) 00,000.300,000.30*4.000,000.10*5.000,000.40*1.0voEspeculatiPayoffE −=−++=

( )[ ] ( ) 00,000.500,000.15*4.000,0*5.000,000.10*1.0CíclicoPayoffE =++−= Máximo

Investimento Cíclico.



3.a)

5.34)54(5.0)15(5.0EVWPI =+=

Alternativas

Estado da Natureza

Vender 10.000

Vender 100.000

Payoff Esperado

Produzir Computadores

0 54 0*0.5 + 54*0.5 = 27 Máximo

Vender Direitos 15 15 15*0.5 + 15*0.5 = 15

Probabilidade a Priori 0.5 0.5

27EVWOE =

5.7275.34EVWOEEVWPIEVPI =−=−=

3.b) Uma vez que 7.500.000,00 é maior que 1.000.000,00, a pesquisa deve ser realizada segundo este critério.

3.c)

Alternativas

Estado da Natureza

Vender 10.000 Vender 100.000

Produzir Computadores 0 54

Vender Direitos 15 15

Probabilidade a Priori 0.5 0.5

Máximo Payoff 15 54



( ) ( ) ( ) 5.05.0*3

15.0*

3

2)100V(P.100V10PesqP)10V(P.10V10PesqP10PesqP =+=+=

( ) ( ) ( ) 5.05.0*3

25.0*

3

1)100V(P.100V100PesqP)10V(P.10V100PesqP100PesqP =+=+=

3.d)

Regra de Bayes com probabilidade a posteriori.

Payoff Esperado se constatação é Pesq10:

( )[ ] ( ) ( ) 171543

10

3

210PesqoConstataçãoduzirPrPayoffE =−+==

( )[ ] ( ) ( ) 141153

115

3

210PesqoConstataçãVenderPayoffE =−+==

Payoff Esperado se constatação é Pesq100:

( )[ ] ( ) ( ) 351543

20

3

1100PesqoConstataçãoduzirPrPayoffE =−+==

( )[ ] ( ) ( ) 141153

215

3

1100PesqoConstataçãVenderPayoffE =−+==



Politica Ótima com Experimentação sob a Regra de Decisão de Bayes.

Constatação a

partir da Pesquisa

Ação Ótima Payoff Esperado

excluindo custos de

levantamento

Payoff Esperado

incluindo custos de

levantamento

Pesq10 produzir 18 17

Pesq100 produzir 36 35

2736*5.018*5.0)36(*)100pesq(P)18(*)10pesq(PaçaoExperimentComEsperadoPayoff =+=+=

O Valor Esperado da Experimentação (EVE) é dado por:

02727EVE

açaoExperimentSemEsperadoPayoffaçaoExperimentComEsperadoPayoffEVE

=−=

−=

Uma vez que 0 é menor que 1.000.000,00, a pesquisa não deve ser realizada segundo este

critério.

4.a) ( )[ ] ( ) 35100*2.0100*3.050*5.01APayoffE =−++= Máximo

( )[ ] ( ) 110*2.010*3.00*5.02APayoffE =−++=

( )[ ] 14)40(*2.040*3.020*5.03APayoffE =−++=

4.b)

Estado da Natureza

Alternativa S1 S2 S3

A1 50 100 -100

A2 0 10 -10

A3 20 40 -40


Máximo Payoff 50 100 -10

53)10(*2.0100*3.050*5.0EVWPI =−++=

35EVWOE =

183553EVWOEEVWPIEVPI =−=−=

4.c) José deverá gastar no máximo 18.

5.a)



Portanto, não comprar seguro.

5.b)

Portanto, comprar seguro.

Alternativas

Estado da Natureza Payoff Esperado

Haver terremoto

Não haver terremoto

Comprar Seguro

249820,00 249820,00 249820,00

Não Comprar Seguro

90.000,00 250.000,00 249840,00 Máximo


0.001 0.999

Alternativas

Estado da Natureza Payoff Esperado

Haver terremoto

Não haver terremoto

Comprar Seguro

499.82 499.82 499.82 Máximo

Não Comprar Seguro

300 500 499.80


0.001 0.999

análise de decisão - ufjf · 2015-03-06 · modelagem e simulação - análise de decisão notas...

Documents