sesión 12: redes de decisión - inaoeccc.inaoep.mx/~esucar/clases-mgp/pgm-13-rdec.pdf · 4....
TRANSCRIPT
![Page 1: Sesión 12: Redes de Decisión - INAOEccc.inaoep.mx/~esucar/Clases-mgp/pgm-13-rdec.pdf · 4. Substitución – si el agente es indiferente entre dos loterías A y B, entonces es indiferente](https://reader033.vdocuments.net/reader033/viewer/2022042212/5eb63480176487072e5b813b/html5/thumbnails/1.jpg)
Modelos Gráficos ProbabilistasL. Enrique Sucar
INAOE
Sesión 12: Redes de Decisión
“un agente racional ideal es aquel que, para cada posible secuencia de percepciones, realiza la acción que maximiza su medida de rendimiento esperada, basado en la evidencia y su conocimiento.” [Russell 95]
![Page 2: Sesión 12: Redes de Decisión - INAOEccc.inaoep.mx/~esucar/Clases-mgp/pgm-13-rdec.pdf · 4. Substitución – si el agente es indiferente entre dos loterías A y B, entonces es indiferente](https://reader033.vdocuments.net/reader033/viewer/2022042212/5eb63480176487072e5b813b/html5/thumbnails/2.jpg)
© L.E. Sucar: MGP - redes decisión 2
Redes de Decisión• Teoría de Decisiones
– Utilidad– Axiomas de utilidad– Utilidad del dinero
• Modelos para soporte de decisiones– Árboles de decisión– Redes de decisión– Redes de decisión dinámicas
![Page 3: Sesión 12: Redes de Decisión - INAOEccc.inaoep.mx/~esucar/Clases-mgp/pgm-13-rdec.pdf · 4. Substitución – si el agente es indiferente entre dos loterías A y B, entonces es indiferente](https://reader033.vdocuments.net/reader033/viewer/2022042212/5eb63480176487072e5b813b/html5/thumbnails/3.jpg)
© L.E. Sucar: MGP - redes decisión 3
Teoría de Decisiones• Marco teórico para tomar decisiones en
forma racional• Agente Racional – toma sus decisiones de
forma que maximize la utilidad de sus acciones en función de sus objetivos y su conocimiento acerca del mundo
![Page 4: Sesión 12: Redes de Decisión - INAOEccc.inaoep.mx/~esucar/Clases-mgp/pgm-13-rdec.pdf · 4. Substitución – si el agente es indiferente entre dos loterías A y B, entonces es indiferente](https://reader033.vdocuments.net/reader033/viewer/2022042212/5eb63480176487072e5b813b/html5/thumbnails/4.jpg)
© L.E. Sucar: MGP - redes decisión 4
Utilidad
• La utilidad expresa que tan deseable es el resultado de cada posible acción
• Ya que normalmente se tiene incertidumbre, se utiliza la utilidad esperada:
U(a) = Σr U(r) P(r|a,e)• Donde:
– a = posibles acciones– r = posibles resultados– e = evidencia disponible
![Page 5: Sesión 12: Redes de Decisión - INAOEccc.inaoep.mx/~esucar/Clases-mgp/pgm-13-rdec.pdf · 4. Substitución – si el agente es indiferente entre dos loterías A y B, entonces es indiferente](https://reader033.vdocuments.net/reader033/viewer/2022042212/5eb63480176487072e5b813b/html5/thumbnails/5.jpg)
© L.E. Sucar: MGP - redes decisión 5
Lotería
• A cada posible resultado (escenario) se la asocia una probabilidad de ocurrencia, al conjunto de estos se le denomina una lotería
• Cada estado de la lotería tiene una utilidad, de forma que se pueden ordenar de acuerdo a la preferencia del agente:– Prefiere A a B – A > B– Indiferente – A ~ B
![Page 6: Sesión 12: Redes de Decisión - INAOEccc.inaoep.mx/~esucar/Clases-mgp/pgm-13-rdec.pdf · 4. Substitución – si el agente es indiferente entre dos loterías A y B, entonces es indiferente](https://reader033.vdocuments.net/reader033/viewer/2022042212/5eb63480176487072e5b813b/html5/thumbnails/6.jpg)
© L.E. Sucar: MGP - redes decisión 6
Axiomas de Utilidad
1. Orden – dados dos estados, se prefiere uno u otro, o se es indiferente
2. Transitividad – si A > B y B > C, entonces A > C
3. Continuidad – Si A>B>C, existe algún valor de probabilidad, p, de forma que es indiferente entre obtener B o la lotería A, p y C, 1-p
![Page 7: Sesión 12: Redes de Decisión - INAOEccc.inaoep.mx/~esucar/Clases-mgp/pgm-13-rdec.pdf · 4. Substitución – si el agente es indiferente entre dos loterías A y B, entonces es indiferente](https://reader033.vdocuments.net/reader033/viewer/2022042212/5eb63480176487072e5b813b/html5/thumbnails/7.jpg)
© L.E. Sucar: MGP - redes decisión 7
Axiomas de Utilidad4. Substitución – si el agente es indiferente entre
dos loterías A y B, entonces es indiferente entre dos loterías más complejas que son iguales excepto en que A es substituida por Ben una de ellas
5. Monotonicidad – si hay dos loterías con los mismos resultados, A y B, y el agente prefiere A, entonces debe preferir la lotería en que Atiene mayor probabilidad
6. Descomposición – loterías compuestas se pueden reducir a loterías más simples usando las leyes de probabilidad
![Page 8: Sesión 12: Redes de Decisión - INAOEccc.inaoep.mx/~esucar/Clases-mgp/pgm-13-rdec.pdf · 4. Substitución – si el agente es indiferente entre dos loterías A y B, entonces es indiferente](https://reader033.vdocuments.net/reader033/viewer/2022042212/5eb63480176487072e5b813b/html5/thumbnails/8.jpg)
© L.E. Sucar: MGP - redes decisión 8
Principio de Utilidad• Se prefiere la acción (decisión) que de la mayor
utilidad esperada:U(A) > U(B) A > B (A es mejor que B)
• Si la utilidad es la misma se es indiferente:U(A) = U(B) A ~ B (indiferencia)
• Normalmente se mide la utilidad en términos monetarios, aunque la relación de utilidad y $ no es lineal!
![Page 9: Sesión 12: Redes de Decisión - INAOEccc.inaoep.mx/~esucar/Clases-mgp/pgm-13-rdec.pdf · 4. Substitución – si el agente es indiferente entre dos loterías A y B, entonces es indiferente](https://reader033.vdocuments.net/reader033/viewer/2022042212/5eb63480176487072e5b813b/html5/thumbnails/9.jpg)
© L.E. Sucar: MGP - redes decisión 9
Utilidad del Dinero• Ejemplo:
– “En un concurso ya tienes $1,000,000. Tienes la oportunidad de quedarte con esto o lanzar una moneda – si cae águila ganas $3,000,000, si no pierdes lo que tenías”
• ¿Qué escogerías?• Valor monetario esperado:
• Quedarse – VME = $1,000,000• Apostar – VME = 0.5x0 + 0.5x$3,000,000 = $1,500,000
![Page 10: Sesión 12: Redes de Decisión - INAOEccc.inaoep.mx/~esucar/Clases-mgp/pgm-13-rdec.pdf · 4. Substitución – si el agente es indiferente entre dos loterías A y B, entonces es indiferente](https://reader033.vdocuments.net/reader033/viewer/2022042212/5eb63480176487072e5b813b/html5/thumbnails/10.jpg)
© L.E. Sucar: MGP - redes decisión 10
Utilidad del Dinero• Se ha encontrado empíricamente para la mayor
parte de las personas hay existe una relación logarítmica entre VME y la utilidad.
$
U
![Page 11: Sesión 12: Redes de Decisión - INAOEccc.inaoep.mx/~esucar/Clases-mgp/pgm-13-rdec.pdf · 4. Substitución – si el agente es indiferente entre dos loterías A y B, entonces es indiferente](https://reader033.vdocuments.net/reader033/viewer/2022042212/5eb63480176487072e5b813b/html5/thumbnails/11.jpg)
© L.E. Sucar: MGP - redes decisión 11
Utilidad del Dinero• Sin embargo, para diferentes personas (empresas)
puede haber diferentes relaciones entre U y VME dependiendo de la situación y el contexto
$
UBusca elRiesgo Neutro
Evita elRiesgo
![Page 12: Sesión 12: Redes de Decisión - INAOEccc.inaoep.mx/~esucar/Clases-mgp/pgm-13-rdec.pdf · 4. Substitución – si el agente es indiferente entre dos loterías A y B, entonces es indiferente](https://reader033.vdocuments.net/reader033/viewer/2022042212/5eb63480176487072e5b813b/html5/thumbnails/12.jpg)
© L.E. Sucar: MGP - redes decisión 12
Árboles de Decisión• Un árbol de decisión es una representación
gráfica de las alternativas disponibles para el agente y los aspectos que son inciertos
• Un árbol de decisión tiene dos tipos de nodos:– Nodos de decisión (cuadrados)– Nodos aleatorios (círculos)
![Page 13: Sesión 12: Redes de Decisión - INAOEccc.inaoep.mx/~esucar/Clases-mgp/pgm-13-rdec.pdf · 4. Substitución – si el agente es indiferente entre dos loterías A y B, entonces es indiferente](https://reader033.vdocuments.net/reader033/viewer/2022042212/5eb63480176487072e5b813b/html5/thumbnails/13.jpg)
© L.E. Sucar: MGP - redes decisión 13
Árboles de Decisión• El árbol de decisión se puede ver como una “guía”
para el tomador de decisiones:– Al encontrar un nodo de decisión debe seleccionar una
de las alternativas– Al encontrar un nodo aleatorio no tiene control, la
trayectoria esta determinada por las probabilidades• Cada alternativa en un nodo aleatorio tiene
asociada una probabilidad• Los nodos terminales (hojas) del árbol tienen un
costo o utilidad (normalmente en unidades monetarias)
![Page 14: Sesión 12: Redes de Decisión - INAOEccc.inaoep.mx/~esucar/Clases-mgp/pgm-13-rdec.pdf · 4. Substitución – si el agente es indiferente entre dos loterías A y B, entonces es indiferente](https://reader033.vdocuments.net/reader033/viewer/2022042212/5eb63480176487072e5b813b/html5/thumbnails/14.jpg)
© L.E. Sucar: MGP - redes decisión 14
Ejemplo de Árbol de Decisión
Decisión
pronósticos
Ganar (0.1)
Ganar (0.2)
Perder (0.9)
Perder (0.8)
100
- 15
melate 50
-10
![Page 15: Sesión 12: Redes de Decisión - INAOEccc.inaoep.mx/~esucar/Clases-mgp/pgm-13-rdec.pdf · 4. Substitución – si el agente es indiferente entre dos loterías A y B, entonces es indiferente](https://reader033.vdocuments.net/reader033/viewer/2022042212/5eb63480176487072e5b813b/html5/thumbnails/15.jpg)
© L.E. Sucar: MGP - redes decisión 15
Evaluación• A partir de los nodos terminales (de las
hojas hacia la raíz):– Para los nodos aleatorios, se calcula la utilidad
(costo) esperado en función de los costos de cada alternativa y sus probabilidades asociadas
– Para los nodos de decisión, se selecciona la alternativa de mayor utilidad (menor costo) esperado
![Page 16: Sesión 12: Redes de Decisión - INAOEccc.inaoep.mx/~esucar/Clases-mgp/pgm-13-rdec.pdf · 4. Substitución – si el agente es indiferente entre dos loterías A y B, entonces es indiferente](https://reader033.vdocuments.net/reader033/viewer/2022042212/5eb63480176487072e5b813b/html5/thumbnails/16.jpg)
© L.E. Sucar: MGP - redes decisión 16
Ejemplo de Evaluación
Decisión
pronósticos
Ganar (0.1)
Ganar (0.2)
Perder (0.9)
Perder (0.8)
-3.5
2
100
- 15
50melate
-10
![Page 17: Sesión 12: Redes de Decisión - INAOEccc.inaoep.mx/~esucar/Clases-mgp/pgm-13-rdec.pdf · 4. Substitución – si el agente es indiferente entre dos loterías A y B, entonces es indiferente](https://reader033.vdocuments.net/reader033/viewer/2022042212/5eb63480176487072e5b813b/html5/thumbnails/17.jpg)
© L.E. Sucar: MGP - redes decisión 17
Redes de Decisión• Alternativa a los árboles de decisión que es
más expresiva y a la vez permite construir modelos más compactos basados en modelos gráficos
• Se pueden ver como una extensión a las redes bayesianas, incorporando nodos de decisión y nodos de utilidad
![Page 18: Sesión 12: Redes de Decisión - INAOEccc.inaoep.mx/~esucar/Clases-mgp/pgm-13-rdec.pdf · 4. Substitución – si el agente es indiferente entre dos loterías A y B, entonces es indiferente](https://reader033.vdocuments.net/reader033/viewer/2022042212/5eb63480176487072e5b813b/html5/thumbnails/18.jpg)
© L.E. Sucar: MGP - redes decisión 18
Tipos de Nodos
• Nodos Aleatorios – (óvalos)• Nodos de Decisión – (rectángulos)• Nodos de Utilidad – (rombos)
![Page 19: Sesión 12: Redes de Decisión - INAOEccc.inaoep.mx/~esucar/Clases-mgp/pgm-13-rdec.pdf · 4. Substitución – si el agente es indiferente entre dos loterías A y B, entonces es indiferente](https://reader033.vdocuments.net/reader033/viewer/2022042212/5eb63480176487072e5b813b/html5/thumbnails/19.jpg)
© L.E. Sucar: MGP - redes decisión 19
Ejemplo
A
B C
D
Decisión
Utilidad
![Page 20: Sesión 12: Redes de Decisión - INAOEccc.inaoep.mx/~esucar/Clases-mgp/pgm-13-rdec.pdf · 4. Substitución – si el agente es indiferente entre dos loterías A y B, entonces es indiferente](https://reader033.vdocuments.net/reader033/viewer/2022042212/5eb63480176487072e5b813b/html5/thumbnails/20.jpg)
© L.E. Sucar: MGP - redes decisión 20
Nodos Aleatorios
• Representan variables aleatorias como en redes bayesianas
• Pueden ser observadas o estimadas
Costo
![Page 21: Sesión 12: Redes de Decisión - INAOEccc.inaoep.mx/~esucar/Clases-mgp/pgm-13-rdec.pdf · 4. Substitución – si el agente es indiferente entre dos loterías A y B, entonces es indiferente](https://reader033.vdocuments.net/reader033/viewer/2022042212/5eb63480176487072e5b813b/html5/thumbnails/21.jpg)
© L.E. Sucar: MGP - redes decisión 21
Nodo de Decisión• Representan los puntos de decisión del agente• Tiene un conjunto de valores que corresponden a
las opciones en ese punto• Los arcos hacia nodos de decisión son de
información, indican precedencia en el tiempo• Pueden tener arcos (influenciar) a los nodos
aleatorios o a los nodos de utilidad• Puede haber varios nodos de decisión en una red
de decisiónUbicación
![Page 22: Sesión 12: Redes de Decisión - INAOEccc.inaoep.mx/~esucar/Clases-mgp/pgm-13-rdec.pdf · 4. Substitución – si el agente es indiferente entre dos loterías A y B, entonces es indiferente](https://reader033.vdocuments.net/reader033/viewer/2022042212/5eb63480176487072e5b813b/html5/thumbnails/22.jpg)
© L.E. Sucar: MGP - redes decisión 22
Nodo de Utilidad• Representan la función de utilidad del agente• Tienen como padres los nodos aleatorios y de decisión
que afectan directamente la utilidad• La utilidad se puede definir como:
– Una matriz con un valor por cada combinación de los padres– Una función matemática
• En los modelos básicos hay un nodo de utilidad, pero puede haber más. Generalmente se asume que la utilidad es la suma (pesada) de los nodos de utilidad
Utilidad
![Page 23: Sesión 12: Redes de Decisión - INAOEccc.inaoep.mx/~esucar/Clases-mgp/pgm-13-rdec.pdf · 4. Substitución – si el agente es indiferente entre dos loterías A y B, entonces es indiferente](https://reader033.vdocuments.net/reader033/viewer/2022042212/5eb63480176487072e5b813b/html5/thumbnails/23.jpg)
© L.E. Sucar: MGP - redes decisión 23
Ejemplo – modelo para decidir la ubicación de un Aeropuerto
tráfico
Ubicaciónaeropuerto
Utilidad
Constr.
demanda
costo
ruido
accidentes
![Page 24: Sesión 12: Redes de Decisión - INAOEccc.inaoep.mx/~esucar/Clases-mgp/pgm-13-rdec.pdf · 4. Substitución – si el agente es indiferente entre dos loterías A y B, entonces es indiferente](https://reader033.vdocuments.net/reader033/viewer/2022042212/5eb63480176487072e5b813b/html5/thumbnails/24.jpg)
© L.E. Sucar: MGP - redes decisión 24
Evaluación (un nodo de decisión)
1. Asignar valores a todos los nodos aleatorios conocidos (evidencia)
2. Para cada posible decisión:• Asignar dicho valor al nodo de decisión• Propagar las probabilidades• Calcular la utilidad
3. Seleccionar la alternativa de mayor utilidad
![Page 25: Sesión 12: Redes de Decisión - INAOEccc.inaoep.mx/~esucar/Clases-mgp/pgm-13-rdec.pdf · 4. Substitución – si el agente es indiferente entre dos loterías A y B, entonces es indiferente](https://reader033.vdocuments.net/reader033/viewer/2022042212/5eb63480176487072e5b813b/html5/thumbnails/25.jpg)
© L.E. Sucar: MGP - redes decisión 25
Evaluación (más de un nodo de decisión)
• Si hay varios nodos de decisión se van evaluando uno por uno en “orden”
• Para ello se requiere hacer un ordenamiento mediante una transformación de la red
• El algoritmo de evaluación se basa en una serie de transformaciones del grafo –remover nodos e invertir arcos, tal que no modifican la política óptima
![Page 26: Sesión 12: Redes de Decisión - INAOEccc.inaoep.mx/~esucar/Clases-mgp/pgm-13-rdec.pdf · 4. Substitución – si el agente es indiferente entre dos loterías A y B, entonces es indiferente](https://reader033.vdocuments.net/reader033/viewer/2022042212/5eb63480176487072e5b813b/html5/thumbnails/26.jpg)
© L.E. Sucar: MGP - redes decisión 26
Red de decisión regular• Una red de decisión es regular si:
1. Es un grafo acíclico dirigido2. El nodo de utilidad no tiene sucesores3. Hay una trayectoria dirigida que contiene a
todos los nodos de decisión• La tercera condición implica un
ordenamiento total de todas las decisiones
![Page 27: Sesión 12: Redes de Decisión - INAOEccc.inaoep.mx/~esucar/Clases-mgp/pgm-13-rdec.pdf · 4. Substitución – si el agente es indiferente entre dos loterías A y B, entonces es indiferente](https://reader033.vdocuments.net/reader033/viewer/2022042212/5eb63480176487072e5b813b/html5/thumbnails/27.jpg)
© L.E. Sucar: MGP - redes decisión 27
Transformaciones• Eliminar nodos aleatorios o de decisión que sean
nodos hoja (barren nodes)- no afectan las decisiones
• Eliminar nodos aleatorios que son padres del nodo de utilidad y no tienen otros hijos – se recalcula el nodo de utilidad en base a los padres del nodo eliminado
• Eliminar nodos de decisión que sean padres del nodo de utilidad y que sus padres también sean padres del nodo de utilidad – tomar la decisión de mayor utilidad y guardarla en el nodo de utilidad
![Page 28: Sesión 12: Redes de Decisión - INAOEccc.inaoep.mx/~esucar/Clases-mgp/pgm-13-rdec.pdf · 4. Substitución – si el agente es indiferente entre dos loterías A y B, entonces es indiferente](https://reader033.vdocuments.net/reader033/viewer/2022042212/5eb63480176487072e5b813b/html5/thumbnails/28.jpg)
© L.E. Sucar: MGP - redes decisión 28
Transformaciones
• Inversión de arcos: se puede invertir el arco entre los nodoa aleatorios i j si no hay otra trayectoria entre i – j– se invierte el arco j i y cada nodo hereda los
padres del otro
![Page 29: Sesión 12: Redes de Decisión - INAOEccc.inaoep.mx/~esucar/Clases-mgp/pgm-13-rdec.pdf · 4. Substitución – si el agente es indiferente entre dos loterías A y B, entonces es indiferente](https://reader033.vdocuments.net/reader033/viewer/2022042212/5eb63480176487072e5b813b/html5/thumbnails/29.jpg)
© L.E. Sucar: MGP - redes decisión 29
Ejemplo de transformación
![Page 30: Sesión 12: Redes de Decisión - INAOEccc.inaoep.mx/~esucar/Clases-mgp/pgm-13-rdec.pdf · 4. Substitución – si el agente es indiferente entre dos loterías A y B, entonces es indiferente](https://reader033.vdocuments.net/reader033/viewer/2022042212/5eb63480176487072e5b813b/html5/thumbnails/30.jpg)
© L.E. Sucar: MGP - redes decisión 30
Ejemplo de transformación
![Page 31: Sesión 12: Redes de Decisión - INAOEccc.inaoep.mx/~esucar/Clases-mgp/pgm-13-rdec.pdf · 4. Substitución – si el agente es indiferente entre dos loterías A y B, entonces es indiferente](https://reader033.vdocuments.net/reader033/viewer/2022042212/5eb63480176487072e5b813b/html5/thumbnails/31.jpg)
© L.E. Sucar: MGP - redes decisión 31
Ejemplo de transformación
![Page 32: Sesión 12: Redes de Decisión - INAOEccc.inaoep.mx/~esucar/Clases-mgp/pgm-13-rdec.pdf · 4. Substitución – si el agente es indiferente entre dos loterías A y B, entonces es indiferente](https://reader033.vdocuments.net/reader033/viewer/2022042212/5eb63480176487072e5b813b/html5/thumbnails/32.jpg)
© L.E. Sucar: MGP - redes decisión 32
Ejemplo de transformación
![Page 33: Sesión 12: Redes de Decisión - INAOEccc.inaoep.mx/~esucar/Clases-mgp/pgm-13-rdec.pdf · 4. Substitución – si el agente es indiferente entre dos loterías A y B, entonces es indiferente](https://reader033.vdocuments.net/reader033/viewer/2022042212/5eb63480176487072e5b813b/html5/thumbnails/33.jpg)
© L.E. Sucar: MGP - redes decisión 33
Ejemplo de transformación
![Page 34: Sesión 12: Redes de Decisión - INAOEccc.inaoep.mx/~esucar/Clases-mgp/pgm-13-rdec.pdf · 4. Substitución – si el agente es indiferente entre dos loterías A y B, entonces es indiferente](https://reader033.vdocuments.net/reader033/viewer/2022042212/5eb63480176487072e5b813b/html5/thumbnails/34.jpg)
© L.E. Sucar: MGP - redes decisión 34
Ejemplo de transformación
![Page 35: Sesión 12: Redes de Decisión - INAOEccc.inaoep.mx/~esucar/Clases-mgp/pgm-13-rdec.pdf · 4. Substitución – si el agente es indiferente entre dos loterías A y B, entonces es indiferente](https://reader033.vdocuments.net/reader033/viewer/2022042212/5eb63480176487072e5b813b/html5/thumbnails/35.jpg)
© L.E. Sucar: MGP - redes decisión 35
Ejemplo de transformación
![Page 36: Sesión 12: Redes de Decisión - INAOEccc.inaoep.mx/~esucar/Clases-mgp/pgm-13-rdec.pdf · 4. Substitución – si el agente es indiferente entre dos loterías A y B, entonces es indiferente](https://reader033.vdocuments.net/reader033/viewer/2022042212/5eb63480176487072e5b813b/html5/thumbnails/36.jpg)
© L.E. Sucar: MGP - redes decisión 36
Ejemplo de transformación
![Page 37: Sesión 12: Redes de Decisión - INAOEccc.inaoep.mx/~esucar/Clases-mgp/pgm-13-rdec.pdf · 4. Substitución – si el agente es indiferente entre dos loterías A y B, entonces es indiferente](https://reader033.vdocuments.net/reader033/viewer/2022042212/5eb63480176487072e5b813b/html5/thumbnails/37.jpg)
© L.E. Sucar: MGP - redes decisión 37
Ejemplo de transformación
![Page 38: Sesión 12: Redes de Decisión - INAOEccc.inaoep.mx/~esucar/Clases-mgp/pgm-13-rdec.pdf · 4. Substitución – si el agente es indiferente entre dos loterías A y B, entonces es indiferente](https://reader033.vdocuments.net/reader033/viewer/2022042212/5eb63480176487072e5b813b/html5/thumbnails/38.jpg)
© L.E. Sucar: MGP - redes decisión 38
Método alternativo
• Otra forma de resolver una red de decisión es transformarla a una red bayesiana:– Los nodos de decisión se convierten a nodos aleatorios
con una distribución uniforme– Los nodos de utilidad se convierten a nodos aleatorios
binarios, para los que su probabilidad es proporcional a la utilidad
• Entonces el problema se reduce a propagar en la red bayesiana para todas las combinaciones de los nodos de decisión, de forma que se maximice la probabilidad del nodo(s) de utilidad
![Page 39: Sesión 12: Redes de Decisión - INAOEccc.inaoep.mx/~esucar/Clases-mgp/pgm-13-rdec.pdf · 4. Substitución – si el agente es indiferente entre dos loterías A y B, entonces es indiferente](https://reader033.vdocuments.net/reader033/viewer/2022042212/5eb63480176487072e5b813b/html5/thumbnails/39.jpg)
© L.E. Sucar: MGP - redes decisión 39
Ejemplo en Hugin:¿Llevar paraguas?
• Nodos aleatorios:– predicción del clima– clima
• Nodos de decisión:– escuchar el pronóstico– llevar paraguas
• Nodo de utilidad:– considera el compromiso entre el costo de
llevar el paraguas vs. el costo de mojarse
![Page 40: Sesión 12: Redes de Decisión - INAOEccc.inaoep.mx/~esucar/Clases-mgp/pgm-13-rdec.pdf · 4. Substitución – si el agente es indiferente entre dos loterías A y B, entonces es indiferente](https://reader033.vdocuments.net/reader033/viewer/2022042212/5eb63480176487072e5b813b/html5/thumbnails/40.jpg)
© L.E. Sucar: MGP - redes decisión 40
Redes de decisión dinámicas• Este concepto se puede extender a la toma
de decisiones en el tiempo – redes de decisión dinámicas
• Incorporan nodos de decisión y de utilidad a las redes bayesianas dinámicas
• Normalmente se tienen una serie de decisiones en el tiempo y una cierta utilidad en el futuro
![Page 41: Sesión 12: Redes de Decisión - INAOEccc.inaoep.mx/~esucar/Clases-mgp/pgm-13-rdec.pdf · 4. Substitución – si el agente es indiferente entre dos loterías A y B, entonces es indiferente](https://reader033.vdocuments.net/reader033/viewer/2022042212/5eb63480176487072e5b813b/html5/thumbnails/41.jpg)
© L.E. Sucar: MGP - redes decisión 41
St St+1 St+2 St+3
Dt-1
Ut
Redes de Decisión Dinámicas
E E E E
Dt Dt+1 Dt+2
Ut+1 Ut+2
![Page 42: Sesión 12: Redes de Decisión - INAOEccc.inaoep.mx/~esucar/Clases-mgp/pgm-13-rdec.pdf · 4. Substitución – si el agente es indiferente entre dos loterías A y B, entonces es indiferente](https://reader033.vdocuments.net/reader033/viewer/2022042212/5eb63480176487072e5b813b/html5/thumbnails/42.jpg)
© L.E. Sucar: MGP - redes decisión 42
Redes de decisión dinámicas
• Una red de decisión dinámica es equivalente a un MDP – proceso de decisión de Markov
• Sin embargo, en un MDP puede haber un número infinito de decisiones o etapas temporales
![Page 43: Sesión 12: Redes de Decisión - INAOEccc.inaoep.mx/~esucar/Clases-mgp/pgm-13-rdec.pdf · 4. Substitución – si el agente es indiferente entre dos loterías A y B, entonces es indiferente](https://reader033.vdocuments.net/reader033/viewer/2022042212/5eb63480176487072e5b813b/html5/thumbnails/43.jpg)
© L.E. Sucar: MGP - redes decisión 43
Procesos de Decisión de Markov
• Los procesos de decisión en el tiempo, conocidos también como procesos de decisión secuenciales, se modelan y resuelven como modelos de decisión de Markov (MDP) – que veremos en la siguiente sesión
![Page 44: Sesión 12: Redes de Decisión - INAOEccc.inaoep.mx/~esucar/Clases-mgp/pgm-13-rdec.pdf · 4. Substitución – si el agente es indiferente entre dos loterías A y B, entonces es indiferente](https://reader033.vdocuments.net/reader033/viewer/2022042212/5eb63480176487072e5b813b/html5/thumbnails/44.jpg)
© L.E. Sucar: MGP - redes decisión 44
Referencias• [Russell & Norvig] – Cap. 16• Hiller & Lieberman, Introduction to Operations
Research, Holden-Day – Cap. 15• Warner, A tutorial introduction to decision theory,
en Readings on Uncertain Reasoning, Morgan-Kaufmann
• Shachter, Evaluating influence diagrams, en Readings on Uncertain Reasoning, Morgan-Kaufmann
![Page 45: Sesión 12: Redes de Decisión - INAOEccc.inaoep.mx/~esucar/Clases-mgp/pgm-13-rdec.pdf · 4. Substitución – si el agente es indiferente entre dos loterías A y B, entonces es indiferente](https://reader033.vdocuments.net/reader033/viewer/2022042212/5eb63480176487072e5b813b/html5/thumbnails/45.jpg)
© L.E. Sucar: MGP - redes decisión 45
Actividades
• Continuar desarrollando el proyecto final