análise de decisão - ufjf · 2015-03-06 · modelagem e simulação - análise de decisão notas...
TRANSCRIPT
Para os peixinhos do aquário, quem troca a água é Deus. - Mário Quintana
Análise de Decisão
Thomas Bayes
(*1702, Londres, Inglaterra; †1761 em Tunbridge Wells, Inglaterra).
Modelagem e Simulação - Análise de Decisão
Notas de Aula - Fernando Nogueira 2
1. Introdução
A Análise de Decisão envolve o uso de processos racionais para selecionar a melhor
alternativa dentre um conjunto de alternativas possíveis.
Os processos de tomada de decisão podem ser divididos em duas principais
categorias:
1) Tomada de Decisão Sem Experimentação, e
2) Tomada de Decisão Com Experimentação.
Os problemas abaixo exemplificam algumas situações nas quais se faz necessário
tomar alguma decisão:
� Uma indústria lança um novo produto no mercado. Qual será a reação dos
clientes potenciais? Quanto deveria ser produzido? A aceitação do produto
por parte do mercado deveria ser testada em uma pequena região antes de
decidir sobre a distribuição total do produto? Quanto se deve investir em
publicidade para lançar o produto?
� Uma concorrência pública será aberta. Qual será o custo do projeto? Quais
as potencias companhias que poderiam concorrer?
� Uma firma agrícola necessita planejar para o próximo ano o uso de suas
terras. Quantos hectares devem ser destinados a pastagens para criação de
gado e quantos hectares devem ser destinados ao plantio de milho e soja?
Estes exemplos são tipos de processos de tomada de decisão nos quais existe uma
grande incerteza envolvida. Análise de Decisão fornece uma metodologia para tomar tais
decisões de maneira racional.
O exemplo protótipo abaixo será utilizado para ilustrar a metodologia envolvida.
Exemplo Protótipo: a companhia GoferBroke possui terras que podem ter petróleo. Um
levantamento geofísico determinou que existe 1 chance em 4 de realmente existir petróleo
nestas terras. Por causa desta informação, outra companhia petrolífera quer comprar estas
terras por $90.000,00. Entretanto, a GoferBroke sabe que o custo para perfurar um poço
naquela região é $100.000,00. Se for encontrado petróleo, o retorno esperado deverá ser de
$800.000,00. Descontando o custo da perfuração, o lucro então será de $700.000,00.
A tabela abaixo resume estas informações.
Modelagem e Simulação - Análise de Decisão
Notas de Aula - Fernando Nogueira 3
Tabela 1 - Payoff para a companhia GoferBroke
Estado
Alternativa
Payoff
Poço com Petróleo Poço Seco
Perfurar $700.000,00 $-100.000,00
Vender a terra $90.000,00 $90.000,00
Chance 1 em 4 3 em 4
Qual a decisão que a companhia GoferBroke deve tomar: 1) vender a terra e ganhar
$90.000,00 sem riscos ou 2) perfurar o poço a um custo de $100.000,00 e obter um retorno
de $800.000,00, resultando em lucro de $700.000,00 com um risco estimado em 75% (3 em
4) ?
2. Tomada de Decisão Sem Experimentação
Como se percebe no exemplo protótipo, existe uma informação referente à chance
que existe em achar petróleo ou não. Esta informação pode ser convertida em uma medida
de probabilidade. Com isso, pode-se dizer que existe uma probabilidade de 0.25 de
encontrar petróleo e conseqüentemente, uma probabilidade de 0.75 de não encontrar
petróleo. A estas probabilidades dá-se o nome de Probabilidades a Priori.
Na terminologia de Análise de Decisão, os valores $700.000,00, $-100.000,00,
$90.000,00 e $90.000,00 da tabela 1 são denominados Payoffs e os nomes “Poço com
Petróleo” e “Poço Seco” são denominados Estados da Natureza.
Por Tomada de Decisão Sem Experimentação, entende-se que é de conhecimento
apenas as Probabilidades a Priori e os Estados da Natureza.
Neste tipo de tomada de decisão pode-se utilizar, entre outros, três critérios:
1. Critério de Maximin Payoff,
2. Critério de Máxima Verossimilhança, e
3. Critério da Regra de Bayes.
2.1 Critério de Maximin Payoff
Neste critério, o problema de tomar uma decisão é vista como um Jogo (Teoria dos
Jogos) entre o Tomador de Decisão (jogador A) e a Natureza (jogador B).
Como a matriz de Payoff é geralmente formada para o Tomador de Decisão (os
valores da matriz são os payoff para o jogador A), a decisão pode ser tomada baseada no
Critério de Maximin Payoff.
Modelagem e Simulação - Análise de Decisão
Notas de Aula - Fernando Nogueira 4
Critério de Maximin Payoff: para cada ação (estratégia), encontrar o mínimo payoff entre
todos os Estados da Natureza e então encontrar o máximo destes payoff mínimos. Escolher
a ação cujo mínimo payoff resultou neste máximo.
No exemplo protótipo o Maximin é:
Estado
Alternativa
Payoff Mínimo em
Linha
Poço com Petróleo Poço Seco
Perfurar $700.000,00 -$100.000,00 $-100.000,00
Vender a terra $90.000,00 $90.000,00 $90.000,00 Maximin
Com isso, a decisão a ser tomada é vender a terra.
2.2 Critério de Máxima Verossimilhança
Este critério assume como decisão a ser tomada a que for mais provável.
Critério de Máxima Verossimilhança: identificar o Estado da Natureza mais provável (o
com maior probabilidade). Para este Estado da Natureza, encontrar a ação com máximo
payoff. Escolher esta ação.
Aplicando este critério para o exemplo protótipo, indica que o Estado Poço Seco
possui a maior probabilidade. Na coluna "Poço Seco", a alternativa "Vender a terra" possui
o maior payoff.
Estado
Alternativa
Payoff
Poço com Petróleo Poço Seco
Perfurar $700.000,00 $-100.000,00
Vender a terra $90.000,00 $90.000,00 Máximo
Probabilidade à Prior 0.25 0.75
Máximo
Com isso, a ação a ser tomada, segundo este critério é vender a terra.
O maior problema deste critério é que este ignora completamente muita informação
relevante. Nenhum outro Estado da Natureza é considerado, a não ser o mais provável.
Modelagem e Simulação - Análise de Decisão
Notas de Aula - Fernando Nogueira 5
2.3 Critério da Regra de Bayes
Regra de Decisão de Bayes: usando a melhor estimativa das probabilidades dos
respectivos Estados da Natureza (as Probabilidades à Priori), calcular o valor esperado de
payoff para cada alternativa possível. Escolher a alternativa com máximo payoff esperado.
Para o exemplo protótipo, os payoff esperados E são calculados diretamente a partir
da tabela 1 como:
( )[ ] ( ) 00,000.10000,000.100*75.000,000.700*25.0PerfurarPayoffE =−+= (1)
( )[ ] ( ) 00,000.9000,000.90*75.000,000.90*25.0TerraVenderPayoffE =+= (2)
Uma vez que $100.000,00 é maior que $90.000,00 a ação a ser tomada, segundo
este critério é perfurar o poço. Percebe-se que este critério resultou em uma ação diferente
das ações obtidas segundo os dois critérios anteriores.
A grande vantagem deste critério em relação aos demais é que este incorpora todas
as informações disponíveis (Estados da Natureza e Probabilidades a Priori).
A fim de verificar o efeito de possíveis imprecisões nas Probabilidades a Priori,
pode-se realizar uma Análise de Sensibilidade.
2.3.1 Análise de Sensibilidade para o Critério da Regra de Bayes
A Análise de Sensibilidade para o Critério da Regra de Bayes é facilmente
implementado através da generalização das expressões (1) e (2). Denominando p como a
Probabilidade a Priori para poço com petróleo, a Probabilidade a Priori para poço seco é
dada por 1-p, uma vez que a soma das probabilidades a Priori resulta em 1. Os payoff
esperados (em milhares de $, para simplificação da notação) ficam:
( )[ ] ( ) 100p800p1100p700PerfurarPayoffE −=−−= (3)
( )[ ] ( ) 90p190p90TerraVenderPayoffE =−+= (4)
A figura abaixo mostra em azul a reta dada pela expressão (3), em vermelho a reta
dada pela expressão (4) e em verde a reta que divide a região onde a decisão deveria ser
vender a terra (região à esquerda) da região onde a decisão deveria ser perfurar o poço
(região à direita).
Modelagem e Simulação - Análise de Decisão
Notas de Aula - Fernando Nogueira 6
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1-100
0
100
200
300
400
500
600
700Analise de Sensibilidade para o exemplo GoferBroke
Probabilidade a Priori para Poço com Petroleo
Pay
off
Esp
era
do
Região ondea decisão deveriaser perfurar o poço
Região ondea decisão deveriaser vender a terra
Fig. 1 - Regiões de Decisão para o Critério da Regra de Bayes
Para encontrar a Probabilidade a Priori (ponto no eixo x do gráfico da figura 1) onde
a decisão a ser tomada muda (Crossover Point) faz-se:
( )[ ] ( )[ ]
2375.0800
190p
90100p800TerraVenderPayoffEPerfurarPayoffE
==
=−==
(5)
Com isso, pode-se concluir que se p>0.2375, a decisão deveria ser perfurar o poço e
se p<0.2375, a decisão deveria ser vender a terra.
Para outros problemas que possuem mais de que duas alternativas, o mesmo
procedimento pode ser aplicado, a diferença é que vai haver mais retas (uma para cada
alternativa). No entanto, a reta que estiver mais acima (no exemplo, reta azul acima da
vermelha para a região onde p>0.2375 e reta vermelha acima da azul para a região onde
p<023.75) dentre as demais em uma região indica a decisão a ser tomada.
Com mais que duas retas, poderá haver mais de um Crossover Point, onde a decisão
muda de uma alternativa para outra.
Para problemas com mais de dois Estados da Natureza, a metodologia mais direta é
realizar a Análise de Sensibilidade sobre somente dois Estados de cada vez.
Modelagem e Simulação - Análise de Decisão
Notas de Aula - Fernando Nogueira 7
3. Tomada de Decisão Com Experimentação
Freqüentemente, testes adicionais (experimentações) podem ser realizadas para
melhorar as estimativas preliminares dos respectivos Estados da Natureza fornecidos pelas
Probabilidades a Priori. Estas estimativas melhoradas são denominadas Probabilidades a
Posteriori.
Exemplo Protótipo com Experimentação: a companhia GoferBroke pode realizar um
levantamento geofísico mais detalhado das suas terras para obter uma melhor estimativa da
probabilidade de encontrar petróleo. O custo deste levantamento é $30.000,00.
O levantamento geofísico obtém sondagens sísmicas que indicam se a estrutura
geológica é favorável para a presença de petróleo. Assim, as possibilidades de encontrar
petróleo podem ser divididas em duas categorias:
USS: Sondagem Sísmica Desfavorável ⇒ presença de petróleo na região é pouco provável;
FSS: Sondagem Sísmica Favorável ⇒ presença de petróleo na região é bastante provável.
Baseado em experiências passadas, se existir petróleo, então a probabilidade de
Sondagem Sísmica Desfavorável é:
( ) 4.0petróleoEstadoUSSP == , e (6)
( ) 6.04.01petróleoEstadoFSSP =−== (7)
Similarmente, se não há petróleo (isto é, o Estado da Natureza é Poço Seco), então a
probabilidade de Sondagem Sísmica Desfavorável é estimada para ser:
( ) 8.0osecpoçoEstadoUSSP == , e (8)
( ) 2.08.01osecpoçoEstadoFSSP =−== (9)
A estas probabilidades dadas em (6), (7), (8) e (9) dá-se o nome de Probabilidades
Condicionais, a partir das quais se podem encontrar as Probabilidades a Posteriori dos
respectivos Estados da Natureza dada as Sondagens Sísmicas.
3.1 Probabilidades a Posteriori
Em termos gerais, considerando que:
Modelagem e Simulação - Análise de Decisão
Notas de Aula - Fernando Nogueira 8
n = número de Estados da Natureza;
P(Estado = estado i) = Probabilidade a Priori que o Estado verdadeiro da Natureza é
o estado i, para i = 1, 2,..., n;
Constatação = constatação a partir de uma experimentação (uma variável aleatótia);
Constatação j = um valor possível de constatação;
P(Estado = estado i | Constatação = constatação j) = Probabilidade a Posteriori que o
Estado verdadeiro da Natureza é estado i, dado que Constatação = constatação j, para i = 1,
2, . . ., n.
O objetivo é:
Dado P(Estado = estado i) e P(Constatação = constatação j | Estado = estado i), para
i = 1, 2,..., . Qual é P(Estado = estado i | Constatação = constatação j)?
Esta questão é respondida por combinar as seguintes fórmulas da teoria de
Probabilidade:
( )( )
( )joconstataçãoConstataçãP
joconstataçãoConstataçã,iestadoEstadoPjoconstataçãoConstataçãiestadoEstadoP
=
===== (10)
( ) ( )∑ =====
n
1kjoconstataçãoConstataçã,kestadoEstadoPjoconstataçãoConstataçãP (11)
( )
( ) ( )iestadoEstadoP.iestadoEstadojoconstataçãoConstataçãP
joconstataçãoConstataçã,iestadoEstadoP
===
===
(12)
A probabilidade em (12), dá-se o nome de Probabilidade Conjunta.
Portanto, para cada i =1, 2,..., n, a fórmula desejada para a Probabilidade a
Posteriori é:
( )
( ) ( )
( ) ( )∑ ===
===
===
=
n
1kkestadoEstadoP.kestadoEstadojoconstataçãoConstataçãP
iestadoEstadoP.iestadoEstadojoconstataçãoConstataçãP
joconstataçãoConstataçãiestadoEstadoP
(13)
Modelagem e Simulação - Análise de Decisão
Notas de Aula - Fernando Nogueira 9
A expressão 13 é denominada Teorema de Bayes1.
Retomando o exemplo protótipo, se a constatação do levantamento sísmico é
Sondagem Sísmica Desfavorável (USS), então as Probabilidades a Posteriori são:
( )7
1
)75.0(8.0)25.0(4.0
)25.0(4.0USSoConstataçãpetroleoEstadoP =
+=== (14)
( )7
6
7
11USSoConstataçãosecpoçoEstadoP =−=== (15)
Similarmente, se o levantamento sísmico resulta em Sondagem Sísmica Favorável
(FSS), então:
( )2
1
)75.0(2.0)25.0(6.0
)25.0(6.0FSSoConstataçãpetroleoEstadoP =
+=== (16)
( )2
1
2
11FSSoConstataçãosecpoçoEstadoP =−=== (17)
Uma maneira interessante de organizar estes cálculos é utilizar um diagrama em
árvore de probabilidade.
1 O Teorema de Bayes se basea em que ( ) ( ) ( ) ( ) ( )APA/BPBPB/APBAP ==∩ e, portanto,
( )( )
( )BP
BAPB/AP
∩= ou ( )
( )
( )AP
BAPA/BP
∩= . Assim, de posse de ( )B/AP e ( )BP , calcula-se
( )BAP ∩ e então divide-se esta probabilidade conjunta por ( )AP para se obter ( )A/BP (a probabilidade
condicional inversa de ( )B/AP ).
Modelagem e Simulação - Análise de Decisão
Notas de Aula - Fernando Nogueira 10
Fig. 2 - Diagrama em Árvore de Probabilidades.
No diagrama da figura 2, as Probabilidades a Priori estão na primeira coluna e as
Probabilidades Condicionais estão na segunda coluna. Estas probabilidades são as
informações de entrada. Multiplicando cada Probabilidade na primeira coluna por uma
probabilidade na segunda coluna resulta na Probabilidade Conjunta correspondente na
terceira coluna. Cada Probabilidade Conjunta torna-se o numerador no cálculo das
Probabilidades a Posteriori na quarta coluna. Acumulando as Probabilidades Conjuntas
com mesma constatação, fornece o denominador para cada Probabilidade a Posteriori com
esta constatação.
Depois que estes cálculos foram completados, a Regra de Decisão de Bayes pode
ser aplicada simplesmente como em (1) e (2), com as Probabilidades a Posteriori no lugar
das Probabilidades a Priori. De novo, usando os payoffs dados e subtraindo o custo da
experimentação, obtém-se o seguinte resultado:
Payoff Esperado se constatação é Sondagem Sísmica Desfavorável (USS):
( )[ ] ( ) ( ) 7.15301007
6700
7
1USSoConstataçãPerfurarPayoffE −=−−+== (18)
Modelagem e Simulação - Análise de Decisão
Notas de Aula - Fernando Nogueira 11
( )[ ] ( ) ( ) 6030907
690
7
1USSoConstataçãVenderPayoffE =−+== (19)
Payoff Esperado se constatação é Sondagem Sísmica Favorável (FSS):
( )[ ] ( ) ( ) 270301002
1700
2
1FSSoConstataçãPerfurarPayoffE =−−+== (20)
( )[ ] ( ) ( ) 6030902
190
2
1FSSoConstataçãVenderPayoffE =−+== (21)
Uma vez que o objetivo é maximizar o Payoff Esperado, estes resultados produzem
a seguinte política ótima, como mostra a tabela 2.
Tabela 2 - Politica Ótima com Experimentação sob a Regra de Decisão de Bayes.
Constatação a
partir do
Levantamento Sísmico
Ação Ótima Payoff Esperado
excluindo custos de
levantamento
Payoff Esperado
incluindo custos de
levantamento
USS vender a terra 90 60
FSS perfurar 300 270
Entretanto, este resultado não responde se é válido gastar (ou não) $30.000,00 para
realizar a experimentação.
3.2 O Valor da Experimentação
Antes de realizar qualquer experimentação, deve-se estimar seu valor potencial.
Para isto pode-se utilizar dois métodos.
O primeiro método assume que o experimento irá remover toda a incerteza sobre o
verdadeiro Estado da Natureza e então se calcula a melhora no Payoff Esperado ignorando
o custo da experimentação. Esta quantidade, denominada Valor Esperado da Informação
Perfeita (EVPI) fornece um limite superior para o valor potencial do experimento.
Portanto, se este limite superior é menor que o custo da experimentação, a experimentação
não deve ser realizada.
Entretanto, se este limite superior excede o custo da experimentação, então um
segundo método deverá ser utilizado. Este segundo método calcula a melhora atual no
Payoff Esperado (ignorando o custo da experimentação) que resultaria a partir de realizar a
Modelagem e Simulação - Análise de Decisão
Notas de Aula - Fernando Nogueira 12
experimentação. A comparação da melhora do Payoff Esperado com o custo indica se a
experimentação deve ou não ser realizada.
Valor Esperado da Informação Perfeita: admitindo que a experimentação permita
identificar o verdadeiro Estado da Natureza (informação perfeita) e portanto, a ação a ser
realizada é aquela que fornece o maior Payoff para aquele Estado. Uma vez que não se
conhece qual o Estado da Natureza que será identificado como verdadeiro Estado da
Natureza, o cálculo do Payoff Esperado com Informação Perfeita (ignorando os custos da
experimentação) requer ponderar o máximo Payoff para cada Estado da Natureza pelas suas
respectivas Probabilidades a Priori. A tabela 3 mostra os Payoff Máximos (em milhares de
$) para os possíveis Estados da Natureza do exemplo protótipo.
Tabela 3 - Payoff Máximos para os possíveis Estados da Natureza
Estado
Alternativa
Payoff
Poço com Petróleo Poço Seco
Perfurar $700 $-100
Vender a terra $90 $90
Probabilidade à Prior 0.25 0.75
Máximo Payoff $700 $90
O Payoff Esperado com Informação Perfeita (EVWPI) para o exemplo protótipo é
então:
5.242)90(75.0)700(25.0EVWPI =+= (22)
O Valor Esperado da Informação Perfeita (EVPI) é calculado como:
EVWOEEVWPIEVPI −= (23)
onde:
EVWOE é o Valor Esperado Sem Experimentação.
Geralmente a experimentação não fornece Informação Perfeita, porém o EVPI
fornece um limite superior do valor esperado da experimentação.
Para o exemplo protótipo, o Valor Esperado Sem Experimentação (seção 2.3) é 100.
Portanto:
Modelagem e Simulação - Análise de Decisão
Notas de Aula - Fernando Nogueira 13
5.1421005.242EVPI =−= (24)
Uma vez que 142.5 é maior que 30 (custo do levantamento geofísico), deve-se
proceder com o levantamento geofísico. O segundo método citado abaixo avalia o potencial
benefício da experimentação.
Valor Esperado da Experimentação: para calcular esta quantidade requer primeiro
computar o Payoff Esperado Com Experimentação (ignorando os custos da
experimentação) (seção 3.1) e as probabilidades das Constatações P(Constatação =
constatação j). Esta quantidade então fica:
( ) [ ]joconstataçãoConstataçãpayoffE.joconstataçãoConstataçãP
açaoExperimentComEsperadoPayoff
j=∑ =
=
(25)
onde:
( )
( ) ( )∑ ===
==
=
n
1kkestadoEstadoP.kestadoEstadojoconstataçãoConstataçãP
joconstataçãoConstataçãP
(26)
Para o exemplo protótipo, tem-se que:
( ) ( ) ( ) 7.075.0*8.025.0*4.0)osecpoço(P.osecpoçoUSSP)petroleo(P.petroleoUSSPUSSP =+=+= (27)
( ) ( ) ( ) 3.075.0*2.025.0*6.0)osecpoço(P.osecpoçoFSSP)petroleo(P.petroleoFSSPFSSP =+=+= (28)
( ) 90USSoConstataçãPayoffE == (29)
( ) 300FSSoConstataçãPayoffE == (30)
Com isso, o Payoff Esperado Com Experimentação é:
153)300(3.0)90(7.0açaoExperimentComEsperadoPayoff =+= (31)
O Valor Esperado da Experimentação (EVE) é dado então por:
açaoExperimentSemEsperadoPayoffaçaoExperimentComEsperadoPayoffEVE −= (32)
Para o exemplo protótipo, fica:
Modelagem e Simulação - Análise de Decisão
Notas de Aula - Fernando Nogueira 14
53100153EVE =−= (33)
Uma vez que este valor excede 30 (o custo do levantamento geofísico), a
experimentação deverá ser realizada.
4. Árvores de Decisão
Árvores de Decisão fornecem uma maneira útil de visualmente mostrar o problema
e então organizar o trabalho computacional descrito nas seções anteriores. Tais árvores são
úteis quando uma seqüência de decisões precisa ser realizada.
O exemplo protótipo envolve uma seqüência de duas decisões:
1. O levantamento geofísico deverá ser realizado?
2. Qual ação (perfurar ou vender a terra) deverá ser realizada?
Nestas árvores, os nós são denominados bifurcações (forks) e os arcos são
denominados galhos (branches). Uma bifurcação de decisão (decision fork), representada
aqui por um quadrado, indica que uma decisão precisa ser feita naquele ponto do processo.
Uma bifurcação de chance (chance fork), representada por um círculo, indica que um
evento randômico ocorre naquele ponto.
A árvore da figura 3 mostra a árvore para o exemplo protótipo.
Fig. 3 - Árvore de Decisão para o exemplo protótipo.
Modelagem e Simulação - Análise de Decisão
Notas de Aula - Fernando Nogueira 15
Na árvore da figura 3, a primeira decisão é representada pela bifurcação a. A
bifurcação b é a bifurcação de chance representando o evento randômico do resultado do
levantamento geofísico. Os dois galhos provenientes da bifurcação b representam os dois
resultados possíveis do levantamento. Após, vem a segunda decisão (bifurcações c,d e e)
com duas escolhas possíveis. Se a decisão é perfurar, então resultará em outras bifurcações
de chance (f, g e h), que se conectam a dois galhos que representam os dois Estados da
Natureza.
O próximo passo na construção da árvore de decisão é inserir o fluxo de dinheiro e
as probabilidades referentes a cada galho (arco). Na figura 4, as probabilidades estão em
azul dentro de parênteses e o fluxo de dinheiro (em milhares de $) em vermelho e em verde,
no canto direito da figura encontra-se os valores de Payoff para cada ação.
Fig. 4 - Árvore de Decisão para o exemplo protótipo com fluxo de dinheiro e probabilidades.
Modelagem e Simulação - Análise de Decisão
Notas de Aula - Fernando Nogueira 16
4.1 Realizando a Análise
De posse da Árvore de Decisão (como na figura 4), pode-se realizar a análise, de
acordo com os seguintes passos:
1. Começar no lado direito da Árvore e mover para a esquerda uma coluna de cada
vez. Para cada coluna, utilizar o passo 2 ou passo 3, dependendo se a bifurcação na
coluna é uma bifurcação de chance ou uma bifurcação de decisão.
2. Para cada bifurcação de chance calcular seu Payoff Esperado multiplicando o Payoff
Esperado de cada galho (em verde, na figura 4) pela probabilidade de cada galho e
então somar estes produtos. Armazenar este Payoff Esperado para cada bifurcação
de decisão (também em verde na figura 5) e designar esta quantidade como sendo o
Payoff Esperado para o galho oriundo desta bifurcação.
3. Para cada bifurcação de decisão comparar o Payoff Esperado de seus galhos e
escolher a alternativa cujo galho tem maior Payoff Esperado. Em cada caso,
armazenar a escolha na Árvore de Decisão inserindo barras duplas (representando
uma barreira) em cada galho rejeitado (ver figura 5).
Para começar o procedimento, considere a coluna mais à direita cujos galhos originam-
se das bifurcações f, g e h. Aplicando o passo 2, seus Payoff Esperados (EP) são
calculados como:
7.15)130(7
6)670(
7
1EP −=−+= para bifurcação f (34)
270)130(2
1)670(
2
1EP =−+= para bifurcação g (35)
100)100(4
3)700(
4
1EP =−+= para bifurcação h (36)
Estes Payoff Esperados são colocados acima destas bifurcações (ver figura 5).
Dando seqüência, move-se uma coluna para a esquerda, o que consiste em alcançar
as bifurcações de decisão c,d e e. Através do passo 3 obtém-se:
Bifurcação c: perfurar com EP = -15.7
vender com EP = 60
60>-15.7, portanto escolher vender
Modelagem e Simulação - Análise de Decisão
Notas de Aula - Fernando Nogueira 17
Bifurcação d: perfurar com EP = 270
vender com EP = 60
270>60, portanto escolher perfurar
Bifurcação e: perfurar com EP = 100
vender com EP = 90
100>90, portanto escolher perfurar
Estes Payoff Esperados são colocados acima destas bifurcações de decisão (ver
figura 5). A alternativa escolhida também está indicando para inserir barras duplas nos
galhos rejeitados.
Movendo mais uma coluna a esquerda alcança-se a bifurcação de chance b.
Aplicando o passo 2, os Payoff Esperados de seus galhos encontram-se armazenados
sobre as seguintes bifurcações de decisão (c e d). Portanto, o Payoff Esperado é:
123)270(3.0)60(7.0EP =+= para bifurcação b (37)
Finalmente, alcança-se a bifurcação de decisão a. Aplicando o passo 3, resulta em:
Bifurcação a: fazer levantamento geofísico com EP = 123.
não fazer levantamento geofísico com EP = 100
123>100, portanto escolher fazer levantamento.
O Payoff Esperado de 123 deve ser colocado sobre a bifurcação a e uma barra dupla
indicando o galho rejeitado.
Modelagem e Simulação - Análise de Decisão
Notas de Aula - Fernando Nogueira 18
Fig. 5 - Árvore de Decisão final para o exemplo protótipo.
Uma vez concluída a Árvore, move-se da esquerda para a direita através apenas dos
caminhos abertos (sem barras duplas), o que resulta na seguinte política ótima:
Política Ótima:
Fazer levantamento geofísico,
Se resultado é desfavorável, vender a terra, senão perfurar.
O Payoff Esperado (incluindo os custos do levantamento) é 123 ($123.000,00).
Esta solução ótima (única) é a mesma que pode ser obtida sem o beneficio da
Árvore de Decisão aplicando a expressão 37 para os valores da tabela 2.
Modelagem e Simulação - Análise de Decisão
Notas de Aula - Fernando Nogueira 19
5. Teoria da Utilidade
Nas seções anteriores, considerou-se que o Payoff Esperado em termos monetários é
uma medida apropriada das conseqüências de tomar uma ação. Entretanto, em muitas
situações esta consideração não reflete o "verdadeiro" Payoff Esperado que o tomador de
decisões deseja. O parágrafo abaixo explica o porquê disto.
Supondo que seja oferecido a um indivíduo um investimento (jogo, negócio,...) no
qual há (1) uma chance de 50% de ganhar $100.000,00 ou (2) receber $40.000,00 com
garantia (chance de 100%). Muitas pessoas devem preferir a opção 2 (receber $40.000,00
com garantia), mesmo embora o Payoff Esperado de ganhar $100.000,00 em uma chance de
50% é $50.000,00.
Este exemplo não invalida a Regra de Decisão de Bayes porque existe uma maneira
de transformar os valores monetários para uma escala apropriada que reflete as preferências
do tomador de decisão. Esta escala é denominada Função de Utilidade para o Dinheiro.
A figura 6 mostra um exemplo desta função para um indivíduo (organização) que
tem "aversão ao risco" (verde), "indiferente ao risco" (azul), "atração ao risco" (vermelho).
As funções na figura 6 indicam que o valor do dinheiro M possui uma utilidade
u(M). De maneira textual, para a curva "aversão ao risco", por exemplo, um ganho de 600
(M = 600) possui uma utilidade de apenas algo em torno de 300 (u(M) = 300), enquanto um
prejuízo de 600 (M = -600) possui uma utilidade em torno de -2500 (u(M) = - 2500). Para
as demais curvas o raciocínio é análogo.
Um modelo bastante comum utilizado para a Função de Utilidade u(M) é dado
abaixo:
( )
−=
−R
M
e1RMu (38)
onde:
M é o valor do dinheiro;
R é a tolerância ao risco do indivíduo.
Assim, uma grande aversão ao risco corresponde para um pequeno valor de R,
enquanto uma atração ao risco corresponde para um alto valor de R.
Neste contexto é comum apresentar as curvas da figura 6 como na figura 7.
Modelagem e Simulação - Análise de Decisão
Notas de Aula - Fernando Nogueira 20
-600 -400 -200 0 200 400 600
-3000
-2000
-1000
0
1000
2000
3000
M
u(M)
Função de Utilidade
aversão ao risco
atração ao risco
indiferença ao risco
Fig. 6 - Exemplo de Função de Utilidade para o Dinheiro.
atração ao risco
indiferença ao risco
aversão ao risco
Fig. 7 - Função de Utilidade tipicamente apresentada.
Como exemplo desta teoria, tem-se a Função de Utilidade do Dinheiro para o
exemplo protótipo da companhia GoferBroke de acordo com a figura 8. A companhia
GoferBroke possui aversão ao risco (curva verde).
O procedimento para utilizar a árvore de decisão para analisar o problema de
tomada de decisão é idêntico ao descrito na seção 4, exceto que os Payoff monetários são
substituídos pelos valores de utilidade u(M).
Modelagem e Simulação - Análise de Decisão
Notas de Aula - Fernando Nogueira 21
-600 -400 -200 0 200 400 600 -800
-600
-400
-200
0
200
400
600
800
M
u(
M)
Funçao de Utilidade para o dinheiro da GoferBroke
aversão ao risco
indiferença ao risco
Fig. 8 - Função de Utilidade para o Dinheiro da companhia GoferBroke.
A tabela abaixo mostra os valores dos Payoff monetários e seus respectivos valores
de utilidade.
Tabela 4 - Utilidade para a companhia GoferBroke
Payoff Monetário Utilidade
-130 -150
-100 -105
60 60
90 90
670 580
700 600
A Árvore de Decisão agora fica:
Modelagem e Simulação - Análise de Decisão
Notas de Aula - Fernando Nogueira 22
Fig. 9 - Árvore de Decisão para o exemplo protótipo com valores de utilidade.
A Política Ótima obtida com os valores de utilidade neste exemplo é a mesma obtida
com os Payoff monetários, apenas com a diferença no valor da Utilidade Esperada (que
corresponde ao Payoff Esperado no caso de utilizar Payoff monetário).
Política Ótima (utilidade):
Fazer levantamento geofísico,
Se resultado é desfavorável, vender a terra, senão perfurar.
A Utilidade Esperada (incluindo os custos do levantamento) é 106.5 ($106.500,00).
Modelagem e Simulação - Análise de Decisão
Notas de Aula - Fernando Nogueira 23
FONTE: Hiller & Lieberman, CAP. 15
Modelagem e Simulação - Análise de Decisão
Notas de Aula - Fernando Nogueira 24
Exercícios - Análise de Decisão qualquer erro, favor enviar e-mail para [email protected]
1) Uma companhia desenvolveu um novo chip de computador que a habilita a produzir computadores. Alternativamente, está firma pode vender os direitos do chip por $15.000.000,00. Se a companhia escolhe produzir os computadores, a lucratividade dependerá da habilidade da companhia para vender os computadores. Devido a informações dos distribuidores, a companhia irá vender com certeza 10.000 computadores, porém se o produto "emplacar", a companhia poderá vender 100.000 computadores. Para propósitos de análise, estes dois níveis de vendas são dois resultados possíveis, porém, suas probabilidades a priori não são conhecidas. O custo de instalação da linha de produção é de $6.000.000,00. O lucro sobre cada computador vendido é $600,00.
a) Identifique as ações (alternativas), os estados da natureza e a tabela de Payoff.
b) Desenvolva um gráfico dos Payoff Esperados para cada ação alternativa versus a probabilidade a priori de vender 10.000.
c) Determine o ponto de Crossover para o gráfico acima. Qual o significado deste ponto?
d) Assumindo que as probabilidades a priori dos dois níveis de venda são ambos iguais a 0.5, qual ação deveria ser tomada?
2) Dada a seguinte tabela de investimentos:
Economia Crescente
Economia Estável
Economia Decrescente
Investimento Conservador
$30.000,00 $5.000,00 $-10.000,00
Investimento Especulativo
$40.000,00 $10.000,00 $-30.000,00
Investimento Cíclico $-10.000,00 $0,00 $15.000,00
Probabilidade a Priori 0.1 0.5 0.4
Qual investimento deve ser escolhido segundo cada um dos critérios abaixo:
a) Maximin Payoff
b) Máxima Verossimilhança
c) Decisão de Bayes
3) Reconsidere o problema 1 agora considerando que uma pesquisa de mercado ao custo de $1.000.000,00 pode ser realizada para prever qual dos dois níveis de
Modelagem e Simulação - Análise de Decisão
Notas de Aula - Fernando Nogueira 25
demanda é mais provável ocorrer. Experiências prévias indicam que tais pesquisas são corretas em dois terços das vezes em que são realizadas.
a) Encontre o EVPI para este problema. Considere a probabilidade a priori de vender 10.000 igual a probabilidade a priori de 100.000 igual a 0.5.
b) A resposta em a) indica que compensa realizar a pesquisa de mercado ?
c) Desenvolva um diagrama em árvore de probabilidade para obter as probabilidades a posteriori dos dois níveis de demanda para cada dos dois resultados possíveis da pesquisa de mercado.
d) Encontre EVE.
4) José toma decisões de acordo com a regra de decisão de Bayes. José construiu a seguinte tabela de Payoff :
Estado da Natureza
Alternativa S1 S2 S3
A1 50 100 -100
A2 0 10 -10
A3 20 40 -40
Probabilidade a Priori 0.5 0.3 0.2
a) Qual alternativa José deve escolher?
b) Encontre EVPI
c) Qual é o máximo que José deve pagar para obter maiores informações sobre qual estado da natureza irá ocorrer?
5) Suponha que você more em uma região sujeita a terremotos, assim você está considerando comprar um seguro para sua casa ao custo anual de $180,00. A probabilidade de um terremoto danificar sua casa durante um ano é 0.001. Se isto acontece, você estima que o custo dos danos (totalmente cobertos pelo seguro) é $160.000,00. Seus bens (incluindo a sua casa) totalizam $250.000,00.
a) Aplique a regra de decisão de Bayes para determinar qual alternativa (comprar ou não o seguro) maximiza seus bens esperados após 1 ano.
b) Você agora tem construído uma função de utilidade que mede o valor dos seus bens (x) em $. Está função é dada por ( ) xxu = . Compare a utilidade de reduzir seus bens totais no próximo ano pelo custo do seguro contra terremotos com a utilidade esperada no próximo ano de não comprar o seguro contra terremoto. Você deveria comprar o seguro?
Modelagem e Simulação - Análise de Decisão
Notas de Aula - Fernando Nogueira 26
6) Faça um programa que calcule, dado uma matriz de Payoff para n estados da natureza e m alternativas, os payoff´s seguindo os critérios de Maximin, Maxima Verossimilhança e Bayes.
7) Faça um programa que gere, a cada iteração, uma matriz de Payoff com valores aleatórios para os intervalos dado na tabela abaixo:
Estado
Alternativa
Payoff
Poço com Petróleo Poço Seco
Perfurar M11 M12
Vender a terra M21 M22
Probabilidade à
Prior
p1 p2
onde:
M11 = [300,1000]
M12 = [-300,-50]
M21 = M22 = [50,120]
p1 = [0.05,0.40]
p2 = 1- p1
A cada iteração o programa deverá determinar os Payoff´s seguindo os critérios de Maximin, Maxima Verossimilhança e Bayes. Após várias iterações, verificar qual dos critérios resultou em melhor payoff a cada iteração e os payoff´s médios para cada critério.
Modelagem e Simulação - Análise de Decisão
Notas de Aula - Fernando Nogueira 27
Respostas
1.a)
1.b)
( )[ ] ( ) 54p54p154p0esComputadoroduzirPrPayoffE +−=−+=
( )[ ] ( ) 15p115p15DireitosVenderPayoffE =−+=
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 10
10
20
30
40
50
60Analise de Sensibilidade
Probabilidade a Priori para Vender 10.000
Pa
yoff E
spera
do
1.c)
( )[ ] ( )[ ] 7222.054
39p1554p54DireitosVenderPayoffEesComputadoroduzirPrPayoffE ==⇒=+−⇒=
O significado do ponto de crossover é que se a probabilidade a priori de vender 10.000 computadores for menor que 0.7222, a decisão a ser tomada, segundo o critério de Bayes é Produzir Computadores, caso contrário, é Vender Direitos.
1.d) Obviamente, Produzir Computadores.
Alternativas
Estado da Natureza
Vender 10.000 Vender 100.000
Produzir Computadores 0 54
Vender Direitos 15 15
Modelagem e Simulação - Análise de Decisão
Notas de Aula - Fernando Nogueira 28
2.a)
Economia Crescente
Economia Estável
Economia Decrescente
Mínimo em Linha
Investimento Conservador
$30.000,00 $5.000,00 $-10.000,00 -10.000,00 Maximin
Investimento Especulativo
$40.000,00 $10.000,00 $-30.000,00 -30.000,00
Investimento Cíclico
$-10.000,00 $0,00 $15.000,00 -10.000,00 Maximin
Investimento Conservador ou Investimento Cíclico.
2.b)
Economia Crescente
Economia Estável
Economia Decrescente
Investimento Conservador
$30.000,00 $5.000,00 $-10.000,00
Investimento Especulativo
$40.000,00 $10.000,00 $-30.000,00 Máximo
Investimento Cíclico $-10.000,00 $0,00 $15.000,00
Probabilidade a Priori
0.1 0.5 0.4
Máximo
Investimento Especulativo.
2.c)
( )[ ] ( ) 00,500.100,000.10*4.000,000.5*5.000,000.30*1.0rConservadoPayoffE =−++=
( )[ ] ( ) 00,000.300,000.30*4.000,000.10*5.000,000.40*1.0voEspeculatiPayoffE −=−++=
( )[ ] ( ) 00,000.500,000.15*4.000,0*5.000,000.10*1.0CíclicoPayoffE =++−= Máximo
Investimento Cíclico.
Modelagem e Simulação - Análise de Decisão
Notas de Aula - Fernando Nogueira 29
3.a)
5.34)54(5.0)15(5.0EVWPI =+=
Alternativas
Estado da Natureza
Vender 10.000
Vender 100.000
Payoff Esperado
Produzir Computadores
0 54 0*0.5 + 54*0.5 = 27 Máximo
Vender Direitos 15 15 15*0.5 + 15*0.5 = 15
Probabilidade a Priori 0.5 0.5
27EVWOE =
5.7275.34EVWOEEVWPIEVPI =−=−=
3.b) Uma vez que 7.500.000,00 é maior que 1.000.000,00, a pesquisa deve ser realizada segundo este critério.
3.c)
Alternativas
Estado da Natureza
Vender 10.000 Vender 100.000
Produzir Computadores 0 54
Vender Direitos 15 15
Probabilidade a Priori 0.5 0.5
Máximo Payoff 15 54
Modelagem e Simulação - Análise de Decisão
Notas de Aula - Fernando Nogueira 30
( ) ( ) ( ) 5.05.0*3
15.0*
3
2)100V(P.100V10PesqP)10V(P.10V10PesqP10PesqP =+=+=
( ) ( ) ( ) 5.05.0*3
25.0*
3
1)100V(P.100V100PesqP)10V(P.10V100PesqP100PesqP =+=+=
3.d)
Regra de Bayes com probabilidade a posteriori.
Payoff Esperado se constatação é Pesq10:
( )[ ] ( ) ( ) 171543
10
3
210PesqoConstataçãoduzirPrPayoffE =−+==
( )[ ] ( ) ( ) 141153
115
3
210PesqoConstataçãVenderPayoffE =−+==
Payoff Esperado se constatação é Pesq100:
( )[ ] ( ) ( ) 351543
20
3
1100PesqoConstataçãoduzirPrPayoffE =−+==
( )[ ] ( ) ( ) 141153
215
3
1100PesqoConstataçãVenderPayoffE =−+==
Modelagem e Simulação - Análise de Decisão
Notas de Aula - Fernando Nogueira 31
Politica Ótima com Experimentação sob a Regra de Decisão de Bayes.
Constatação a
partir da Pesquisa
Ação Ótima Payoff Esperado
excluindo custos de
levantamento
Payoff Esperado
incluindo custos de
levantamento
Pesq10 produzir 18 17
Pesq100 produzir 36 35
2736*5.018*5.0)36(*)100pesq(P)18(*)10pesq(PaçaoExperimentComEsperadoPayoff =+=+=
O Valor Esperado da Experimentação (EVE) é dado por:
02727EVE
açaoExperimentSemEsperadoPayoffaçaoExperimentComEsperadoPayoffEVE
=−=
−=
Uma vez que 0 é menor que 1.000.000,00, a pesquisa não deve ser realizada segundo este
critério.
4.a) ( )[ ] ( ) 35100*2.0100*3.050*5.01APayoffE =−++= Máximo
( )[ ] ( ) 110*2.010*3.00*5.02APayoffE =−++=
( )[ ] 14)40(*2.040*3.020*5.03APayoffE =−++=
4.b)
Estado da Natureza
Alternativa S1 S2 S3
A1 50 100 -100
A2 0 10 -10
A3 20 40 -40
Probabilidade a Priori 0.5 0.3 0.2
Máximo Payoff 50 100 -10
53)10(*2.0100*3.050*5.0EVWPI =−++=
35EVWOE =
183553EVWOEEVWPIEVPI =−=−=
4.c) José deverá gastar no máximo 18.
5.a)
Modelagem e Simulação - Análise de Decisão
Notas de Aula - Fernando Nogueira 32
Portanto, não comprar seguro.
5.b)
Portanto, comprar seguro.
Alternativas
Estado da Natureza Payoff Esperado
Haver terremoto
Não haver terremoto
Comprar Seguro
249820,00 249820,00 249820,00
Não Comprar Seguro
90.000,00 250.000,00 249840,00 Máximo
Probabilidade a Priori
0.001 0.999
Alternativas
Estado da Natureza Payoff Esperado
Haver terremoto
Não haver terremoto
Comprar Seguro
499.82 499.82 499.82 Máximo
Não Comprar Seguro
300 500 499.80
Probabilidade a Priori
0.001 0.999