inteligencia artificial - gsi.dit.upm.esanto/slides/980610/ia_apr_kdd.pdf · miento e inferencia...
TRANSCRIPT
Inteligencia Artificial, Aprendizaje y Minería de Datos. Pág. 1Junio 1998
Antonio J. Gómez Flechoso
INTELIGENCIA ARTIFICIAL ,
APRENDIZAJE
Y MINERÍA DE DATOS
Antonio José Gómez Flechoso(http://www.gsi.dit.upm.es/~anto)
Madrid, Junio 1998
Inteligencia Artificial, Aprendizaje y Minería de Datos. Pág. 2Junio 1998
Antonio J. Gómez Flechoso
ÍNDICE
Inteligencia Artificial: definición, evolución histórica (resolución problemas,SBC, aprendizaje, ...)
Aprendizaje: definición, interés, tipos, métodos, ...
• Redes neuronales
• Algoritmos genéticos
• Aprendizaje simbólico: árboles de decisión, inducción de reglas
Descubrimiento en bases de datos (KDD) y minería de datos
• FZFOIL
• Ejemplo de aplicación
Resumen y conclusiones
Inteligencia Artificial, Aprendizaje y Minería de Datos. Pág. 3Junio 1998
Antonio J. Gómez Flechoso
INTELIGENCIA ARTIFICIAL
Definición
¿Qué es IA?
♦ IA / aplicaciones:
Manera de hacer que las máquinas ejecuten tareas inteligentes
♦ IA / ciencia (investigación psicológica):
Estudio de la naturaleza de la inteligencia mediante el uso de modelos computacionales
♦ IA / negocio !!!
¿Qué es inteligencia?
calculadoras mecánicas→ lenguajes simbólicos→ sistemas expertos→ aprendizaje
automático → ?
Inteligencia Artificial, Aprendizaje y Minería de Datos. Pág. 4Junio 1998
Antonio J. Gómez Flechoso
samiento
)
retos
Shaw y Simon (1959)
ón
INTELIGENCIA ARTIFICIAL
Perspectiva histórica
V a.C (griegos): sueño de mecanizar procesos del pen
1950: ¿pueden pensar las máquinas?→ Test de Turing
(1951: UNIVAC I, primer ordenador comercial, 159000 $
1956: conferencia de Dartmouth, “nacimiento” de la IA
años 60:
• sistemas simbólicos en dominios de conocimiento conc
• Solucionador General de Problemas (GPS) de Newell,
descripción dominio
problema concreto soluciGPS
erales de inferencia
Expertos (SE)
ionista
ión
cación
cación
ación:otipoemaema integrado
final años 70:
• importancia del conocimiento frente a mecanismos gen
• Sistemas Basados en Conocimiento (SBC) y Sistemas
años 80 - actualidad:
• renacimiento de computación neuronal
• consolidación de técnicas anteriores
• importancia creciente de aprendizaje simbólico y conex
problema concreto SE, SBC(conocimientodominio)
soluc+
+justifi
expli
HERRAMIENTAS
ingenieros conocimiento
expertos
Aplic- prot- sist- sist
Inteligencia Artificial, Aprendizaje y Minería de Datos. Pág. 6Junio 1998
Antonio J. Gómez Flechoso
INTELIGENCIA ARTIFICIAL
Resolución de problemas
Problema =
= Espacio del problema (estados y operadores cambio estado)
+ Estado inicial (EI)
+ Estados finales (EF)
Resolución de problemas = búsqueda soluciones
• búsqueda en espacio del problema
• búsqueda de conocimiento
Inteligencia Artificial, Aprendizaje y Minería de Datos. Pág. 7Junio 1998
Antonio J. Gómez Flechoso
Resolución de problemas
Espacio problema
EF
EI
Poco conocimiento
Espacio problema
EF
EI
búsqueda ciega búsqueda heurística
Mucho conocimiento del dominio del dominio
Inteligencia Artificial, Aprendizaje y Minería de Datos. Pág. 8Junio 1998
Antonio J. Gómez Flechoso
INTELIGENCIA ARTIFICIAL
Búsqueda heurística
HEURÍSTICO:
♦ Diccionario:
Que sirve para inventar
♦ En IA:
• Como adjetivo:por contraste a “algorítmico” en determinados teoremas
Enfoque algorítmico: ir sacando todo lo posible hasta, eventualmente, obtener una
solución (búsqueda exhaustiva o “a ciegas”).
Enfoque heurístico: “imaginar” una posible solución y tratar de demostrarla.
• Como sustantivo:“truco” o regla empírica que ayuda a encontrar la solución de un
problema.
Inteligencia Artificial, Aprendizaje y Minería de Datos. Pág. 9Junio 1998
Antonio J. Gómez Flechoso
La búsqueda heurística permite abordar problemas NP-completos:
• Ajedrez:
árbol de búsqueda = 10120 nodos
máquina a 3 nodos/ns⇒ 1021 años para generar todo el árbol
• Damas: 1040 nodos
• Viajante de comercio: n! posibilidades (para n ciudades)
• 8-puzzle: 9! = 362880, (“16-puzzle”: 16!)
Tipos de búsqueda heurística:
♦ Exploración de alternativas (método del gradiente, primero el mejor, algoritmo
A*).
♦ Búsqueda con adversarios (búsqueda MINIMAX).
♦ Análisis de medios-fines (definido en el GPS).
Inteligencia Artificial, Aprendizaje y Minería de Datos. Pág. 10Junio 1998
Antonio J. Gómez Flechoso
Búsqueda heurística: exploración de alternativas (funcíón evaluación)
f(estadoj) = nj
f suele ser una medida de la distancia al objetivo, ejemplo (8-puzzle):
fev1 = nº piezas situadas correctamente
fev2 = distancia de Manhattan
2 3 1 2 3 1 2 3
1 8 4 8 4 8 4
7 6 5 7 6 5 7 6 5
fev1(Ei) = 6 fev1 = 7 fev1(Ef) = 8
fev2(Ei) = 2 fev2 = 1 fev2(Ef) = 0
Inteligencia Artificial, Aprendizaje y Minería de Datos. Pág. 11Junio 1998
Antonio J. Gómez Flechoso
Búsqueda heurística: exploración de alternativas (estrategias de búsqueda)
♦ Método del gradiente: maximizar/minimizar fev desde estado inicial
(aplicable en 8-puzzle, finales de ajedrez, búsqueda de mínimos locales, etc)
♦ Búsqueda primero-el-mejor: gradiente +backtracking
(permite superar mínimos locales; pero no considera camino recorrido)
♦ Algoritmo A*: consideración camino recorrido + primero-el-mejor
f(n) = g(n) + h(n)
g(n) = costereal del caminohasta nodo n
h(n) = costeestimado del camino óptimodesde n hasta meta
(h = 0⇒ búsqueda en extensión; g = 0⇒ búsqueda “primero-el-mejor”)
Inteligencia Artificial, Aprendizaje y Minería de Datos. Pág. 12Junio 1998
Antonio J. Gómez Flechoso
Búsqueda heurística: búsqueda con adversarios
♦ Representación mediante árboles Y-O:
• enlaces O: movimientos realizables en un momento
• enlaces Y: movimientos del adversario
• nodos hojas: ganar (+1), perder (-1) o empatar (0).
♦ Estrategia MINIMAX:
• cada vez que juega MAX, elegir rama en que todas las jugadas de MIN dan la victoria
a MAX
- 1 +1 +1 +1 - 10
A = MAX
B = MIN
f(n)
Inteligencia Artificial, Aprendizaje y Minería de Datos. Pág. 13Junio 1998
Antonio J. Gómez Flechoso
Búsqueda heurística: análisis de medios-fines
• Estrategia más general, basada en psicología cognitiva. Definida inicialmente en el
contexto del GPS (1957).
• Distingue losmedios u operadores y losfines o meta.
• Proceso:
1 - analizar continuamente diferencias entre estado inicial y meta
2 - ordenar diferencias de mayor a menor importancia
3 - consultar tabla con operadores para reducir cada diferencia:
3.a) operador aplicable⇒ aplicarlo e iterar en 3 (mientras haya diferencias)
3.b) operador no aplicable⇒ submeta = “alcanzar estado para aplicar operador”
Inteligencia Artificial, Aprendizaje y Minería de Datos. Pág. 14Junio 1998
Antonio J. Gómez Flechoso
INTELIGENCIA ARTIFICIAL
Sistemas Basados en Conocimiento (SBC)
Años 70: Surge paradigma desistemaexperto(sistemas que emulen a expertoshumanos, en actividades muy concretas y restringidas) y paradigma delcono-
cimiento(lo que caracteriza a un experto es su conocimiento del problema, nosu capacidad general de resolver problemas).
Ejemplos:
• MYCIN (1974): diagnóstico y tratamiento de algunas enfermedades infecciosas
• PROSPECTOR (1978): descubrimiento de yacimientos de minerales
• XCON (1980): configuración de sistemas informáticos VAX y PDP.
Inteligencia Artificial, Aprendizaje y Minería de Datos. Pág. 15Junio 1998
Antonio J. Gómez Flechoso
Sistemas expertos
Definición:
“Un sistema experto es un programa inteligente, que usa procedimientos deconoci-
miento einferencia para solucionar problemas que son suficientemente difíciles como
para requerir experiencia humana en su solución. El conocimiento necesario para operar
en tal nivel, añadido a los procedimientos de inferencia utilizados, puede ser conside-
rado como un modelo de la experiencia de los mejores operadores en dicho campo”.
Base deConocimiento
Motor deInferencia
Base deHechosIngeniero
deConocimiento
Interfazdatosexternos
Interfazusuariofinal
Experto
Usuario
Módulo deaprendizaje
Subsistema deexplicación
Inteligencia Artificial, Aprendizaje y Minería de Datos. Pág. 16Junio 1998
Antonio J. Gómez Flechoso
MYCIN (ejemplo de S.E.)
Ejemplo de reglas:
SI: 1. la infección es bacteremia primaria y
2. la toma de material de cultivo es una toma estéril y
3. la puerta de entrada del organismo es tracto gastrointestinal
ENTONCES: hay bastante evidencia (0.7) de que la identidad del organismo
sea Bacteriodes
Inteligencia Artificial, Aprendizaje y Minería de Datos. Pág. 17Junio 1998
Antonio J. Gómez Flechoso
MYCIN (ejemplo de S.E.)
Fragmento de consulta:
• M: ¿Nombre del paciente?
• U: Pedro Alonso
• M: ¿Edad?
• ...
• M: ¿Qué organismo es el causante de la infección?
• U: No sé
• M: ¿Crece el organismo en medio aerobio?
• U: Sí
• M: ¿Cuál se supone que ha sido la puerta de entrada?
• ...
Inteligencia Artificial, Aprendizaje y Minería de Datos. Pág. 18Junio 1998
Antonio J. Gómez Flechoso
MYCIN (ejemplo de S.E.)
Fragmento de diálogo:
• M: ¿La meningitis se ha contraído en un hospital?
• U: ¿Por qué?
• M: Ello me ayudaría a determinar los organismos, ya que he concluido que:
1. la infección es meningitis
2. el tipo de infección es bacteriana
3. En la historia del paciente no hubo neurocirugía
4. La edad del paciente es superior a 10 díasPor tanto, si
5. El paciente contrajo la infección en un hospital, entonces (regla 545) los orga-nismos causantes podrían ser: E.Coli(0.75), Estafilococo coagulante (0.3) o Pseudomo-nas aeruginosa (0.3)
• U: ¿Cómo 2?
• M: Por las reglas: regla 500 (0.51), regla 526(0.98), regla 501 (0.59), regla 504 (0.97).
Inteligencia Artificial, Aprendizaje y Minería de Datos. Pág. 19Junio 1998
Antonio J. Gómez Flechoso
Adquisición de conocimiento en S.E.
Diálogo con experto humano:
• Se precisa ingeniero de conocimiento
• Proceso lento y laborioso
• Dificultad de los expertos para explicar sus mecanismos inductivos/deductivos/abduc-
tivos
Inducción automática:
• El experto interactúa con procedimientos de inducción
• El experto refina reglas y su propio conocimiento
• Facilidad de los expertos para enseñar a través de ejemplos
Inteligencia Artificial, Aprendizaje y Minería de Datos. Pág. 20Junio 1998
Antonio J. Gómez Flechoso
INTELIGENCIA ARTIFICIAL: APRENDIZAJE
Perspectiva histórica
Años 50: interés por aprendizaje de las máquinas (codificaciones numéricas yajustes de parámetros) relacionado conreconocimiento de patrones.
Años 60:aprendizaje de conceptos y adquisición de lenguajes
Final años 70: formación de clasificaciones, aprendizaje por descubrimiento,razonamiento basado en casos, etc. Los S.E. permiten probar métodos exis-tentes y provocannuevas necesidades (“cuello de botella” de Feigenbaum yampliación del alcance de los S.E.)
Últimos años:inducción automáticadeconocimientoenBasesdeDatos (mine-
ría de datos).
Inteligencia Artificial, Aprendizaje y Minería de Datos. Pág. 21Junio 1998
Antonio J. Gómez Flechoso
APRENDIZAJE
Definición
Definiciones conductistas
Aprendizaje: capacidad de experimentar cambios adaptativos paramejorar rendimiento
Definiciones cognoscitivas o simbólicas
Aprendizaje: construcción/modificación de conceptos o derepresentación conocimiento
Sistemaaprendiz
Crítico omaestro t
rendimiento
Sistemaaprendiz
Crítico omaestro
BaseConocimiento
Órganosejecución
Inteligencia Artificial, Aprendizaje y Minería de Datos. Pág. 22Junio 1998
Antonio J. Gómez Flechoso
Interés del aprendizaje en ordenadores
Científico:
• no hay inteligencia sin aprendizaje
• teorías del aprendizaje natural
Ingenieril:
• adquisición de conocimiento para SBC
• inducción de conocimiento en grandes BD (data mining)
• visión artificial, reconocimiento lenguaje natural, enseñanza inteligente asistida por
ordenador, ...
Dificultad del aprendizaje en ordenadores:• Falta de paradigmas constructivos (al menos para enfoques simbólicos)
Inteligencia Artificial, Aprendizaje y Minería de Datos. Pág. 23Junio 1998
Antonio J. Gómez Flechoso
Métodos de aprendizaje [Michalski, 87]
1.- Implantación directa (“rote learning”):
- programación
- memorización
2.- Instrucción
3.- Deducción
4.- Analogía
5.- Inducción:
- con ejemplos
- por observación y descubrimiento
Inteligencia Artificial, Aprendizaje y Minería de Datos. Pág. 24Junio 1998
Antonio J. Gómez Flechoso
Sistemas con aprendizaje inductivo
Sistemas conexionistas: redes neuronales
Sistemas evolucionistas: algoritmos genéticos
Sistemas simbólicos: aprendizaje de conceptos
Inteligencia Artificial, Aprendizaje y Minería de Datos. Pág. 25Junio 1998
Antonio J. Gómez Flechoso
Sistemas Conexionistas: Redes Neuronales
Neurona formal (McCulloch y Pitts, 43)
Aprendizaje por “correlación” (Hebb, 49)
• el cerebro aprende modificando las conexiones entre neuronas
• las neuronas están conectadas por sinapsis que se pueden adaptar/modificar
• cuando una neurona funciona bien se refuerza
• cuando dos neuronas se activan a la vez, se refuerza la conexión entre ellas
W1
i 1=
n
∑
a1
W2a2
Wnan
. . .
s =0 siΣai wi < θ1 siΣai wi ≥ θ
Inteligencia Artificial, Aprendizaje y Minería de Datos. Pág. 26Junio 1998
Antonio J. Gómez Flechoso
Redes neuronales
Algoritmo de aprendizaje para el perceptrón (Rossenblatt, 58): entrenamientoincremental-proporcional
Algoritmo de descenso de gradiente (LMS) y estructura ADALINE (Widrow yHoff, 60)
Condiciones de convergencia del perceptrón (Minsky y Papert, 69):
• redes monocapa (ej. perceptrón) sólo pueden aprender conceptos con separabilidad
lineal (función OR, AND, ...),
• pero no puede aprender el XOR por ejemplo,
• se puede añadir una segunda capa (capa AND) y una tercera (capa OR) para conse-
guirlo, pero NO SE SABE CÓMO ENTRENAR REDES MULTICAPA
Inteligencia Artificial, Aprendizaje y Minería de Datos. Pág. 27Junio 1998
Antonio J. Gómez Flechoso
Redes neuronales: separabilidad
monocapa
dos capas
tres capas
A
AB
B
A
AB
B
Partición deespacio porhiperplano
Regiones convexas(abiertas o cerradas)
Arbitraria
AB
AB
AB
ESTRUCTURA TIPO REGIÓN DEDECISIÓN
PROBLEMAOR EXCLUSIVO
PROBLEMAGENERAL
REGIONESGENERALES
A
AB
B
Inteligencia Artificial, Aprendizaje y Minería de Datos. Pág. 28Junio 1998
Antonio J. Gómez Flechoso
Redes Neuronales: red de Hopfield (1982)
Funcionamiento:
- se programan los pesos wij (no se entrena)
- se mete una entrada (x1 x2 ... xn) y se deja que la red evolucione
- la red converge hacia un invariante (O1 O2 ... On)
Aplicaciones: memorias asociativas, memorias direccionables por contenido
Ejemplo: reconocimiento de personas a partir de fotos distorsionadas
x1x2 x3
O1 O2 O3
w11 w12 w13w21 w22 w23
w31 w32 w33
Feed back(flujo realimentado)
capacidad = 0.15 * N
Inteligencia Artificial, Aprendizaje y Minería de Datos. Pág. 29Junio 1998
Antonio J. Gómez Flechoso
Redes Neuronales: redes multicapa (PMC)
Retropropagación (Backpropagation): basade en descenso de gradiente
1. Inicializar pesos y umbrales (valores aleatorios)
2. Presentar entradas (e1 e2 ... en) y salidas deseadas (d1 d2 ... dm)
3. Calcular salida (s1 s2 ... sm)
4. Adaptar pesos y umbrales y volver a paso 2
wij(t+1) = wij(t) + η δj x’ i
flujo de información (feed forward)
capaentrada
capaoculta
capasalida
entradas salidas
¡Universalidad!
Inteligencia Artificial, Aprendizaje y Minería de Datos. Pág. 30Junio 1998
Antonio J. Gómez Flechoso
Redes Neuronales: aspectos prácticos
preprocesado (ej. reescalado)
codificación datos salida: que valores de salida no alcancen límites de funciónno lineal: -0.9 (en vez de -1); 0.9 (en vez de 1); 0.1 (en vez de 0)
nº capas: 3 (con tres se tiene universalidad)
nº nodos en capa oculta: ensayo y error (datos entrenamiento, validación ytest)
si demasiadas neuronas⇒ memorización
si nº adecuado: ⇒ generalización correcta
si pocas neuronas: ⇒ no converge
mínimos locales: pueden evitarse con conjuntos aleatorios de pesos iniciales
Inteligencia Artificial, Aprendizaje y Minería de Datos. Pág. 31Junio 1998
Antonio J. Gómez Flechoso
Sistemas Evolucionistas: Algoritmos Genéticos
Se basan en ideas sobre la evolución de las especies (selección natural, heren-cia, mutaciones, etc.) aplicadas sobre unapoblación artificial de individuos,para conseguir su adaptación al entorno.
♦ Tipo de individuos de la población depende del problema.
♦ Cada individuo tendrá un valor (fuerza), para medir su adaptación al entorno.
♦ Evolución = búsqueda en paralelo de individuos bien adaptados
• Operadores genéticos (selección, entrecruzamiento y mutación)
• Criterios paravariar la fuerza de cada individuo
Aplicaciones:
• Optimización: maximización/minimización de funciones
• Aprendizaje inductivo: clasificadores, reglas de producción
Inteligencia Artificial, Aprendizaje y Minería de Datos. Pág. 32Junio 1998
Antonio J. Gómez Flechoso
Algoritmos genéticos
Operadores:
• Entrecruzamiento:
A ∧ B ∧ C → D A ∧ B ∧ Y → Z
X ∧ Y → Z X ∧ C → D
• Inversión:
A ∧ B ∧ C → D A ∧ C ∧ B → D
• Mutación:
A ∧ B ∧ C → D A ∧ C ∧ M → D
• . . .
Inteligencia Artificial, Aprendizaje y Minería de Datos. Pág. 33Junio 1998
Antonio J. Gómez Flechoso
Sistemas Simbólicos: aprendizaje de conceptos
Representación del conocimiento fácil de entender: representaciones estructu-radas, ejemplos, lógica (de proposiciones, de primer orden, borrosa, ...)
Aprendizaje = aprendizaje de conceptos
Concepto = clase de entidades con algún principio común (y con descripción simple)
♦ Adquisición de conceptos:
- árboles de decisión (ID3)
- búsqueda de descripciones (AQ11, INDUCE, FOIL)
♦ Formación de conceptos (inducción a partir de la observación)
- agrupamiento conceptual (CLUSTER)
- descubrimiento cuantitativo (BACON, RX)
- descubrimiento cualitativo (AM, EURISKO)
Inteligencia Artificial, Aprendizaje y Minería de Datos. Pág. 34Junio 1998
Antonio J. Gómez Flechoso
Árboles de decisión: ID3 (Quinlan, 79)
Problema:
• dado E = {ei} con ei = {v(a1), v(a2) ... cj}
• generar árbol de decisiónmínimo en el que los nodos son atributos y los arcos valores
de atributos
Ejemplo:
ALTURA PELO OJOS CLASE
bajo rubio verdes +
alto rubio oscuros -
alto castaño verde +
bajo negro verde -
alto negro verde -
alto rubio verde +
alto negro oscuro -
bajo rubio oscuro -
PELO
OJOS
negro castaño rubio
− +
verdes oscuros
+ −
Inteligencia Artificial, Aprendizaje y Minería de Datos. Pág. 35Junio 1998
Antonio J. Gómez Flechoso
ID3: definición de entropía
Entropía (H) = información necesaria para describir un conjunto
Por ejemplo: clase C1 con n1 ejemplos
clase C2 con n2 ejemplos
Ejemplo:
n+ = 3
n- = 5
0 10.5
p1 = n1 / (n1 + n2 )
1
Entropía
Entropía = - (p1 log2 p1 + p2 log2 p2)
siendo: p1 = n1 / (n1 + n2 )p2 = n2 / (n1 + n2 )
H = - ( 3/8 log2 (3/8) + 5/8 log2 (5/8) ) = 0.954 bits
Inteligencia Artificial, Aprendizaje y Minería de Datos. Pág. 36Junio 1998
Antonio J. Gómez Flechoso
ID3: Ejemplo
ALTURA
alto bajo
n+ = 2n- = 3
H = 0.971
n+ = 1n- = 2
H = 0.918
H = 0.954PELO
negro rubio
n+ = 0n- = 3
H = 0
n+ = 2n- = 2
H = 1
H = 0.954
castaño
n+ = 1n- = 0
H = 0
G = 0.954 - 5/8 · 0.971 - 3/8 · 0.918 =0.003 bits G = 0.954 - 4/8 ·1 =0.5 bits
OJOS
verdes oscuros. . .
G = 0.347 bits Mejor atributo: PELO
Inteligencia Artificial, Aprendizaje y Minería de Datos. Pág. 37Junio 1998
Antonio J. Gómez Flechoso
Definiciones lógicas: FOIL
FOIL: First Order Inductive Learner ([Quinlan, 90])
♦ Búsqueda por especialización en grafos refinados
♦ Aplicable sobre BD relacionales
♦ Definición lógica de relación objetivo, formada por cláusulas de Horn
p(V1, ..., Vk) :- L1, L2, ..., Ln
Algunas definiciones preliminares
♦ Satisfacción de L = q(V1, ..., Vn): |=t (L) ⇔ <t(V1), ... t(Vn)> ∈ Q
♦ Conjunto cubierto por C = [L0 :- L1, ... Ln]: Tc(C) = {t | |=t(L1∧...∧Ln)}
♦ Consistencia: C consistente ⇔ (∀t ∈ T−) (¬ |=t(L1∧...∧Ln))
♦ Completitud: C completa ⇔ (∀t ∈ T+) (|=t(L1∧...∧Ln))
Inteligencia Artificial, Aprendizaje y Minería de Datos. Pág. 38Junio 1998
Antonio J. Gómez Flechoso
FOIL: Ejemplo
Ejemplo de los grafos orientados:
• A partir de:
conectado(X,Y) = {(0,1),(0,3), (1,2), ...}
alcanzable(X, Y) = {(0,1), (0,2), ...}
• FOIL induce:
alcanzable(X,Y) :- conectado(X,Y)
alcanzable(X,Y) :- conectado(X,Z), alcanzable(Z,Y)
0
1
2
3 4 6 8
7
5
Inteligencia Artificial, Aprendizaje y Minería de Datos. Pág. 39Junio 1998
Antonio J. Gómez Flechoso
FOIL: planteamiento
Dados:
♦ Q = {qi(V1, ..., Vri)} (predicados definidos extensionalmente)
♦ p(X1, ..., Xk) ∈ Q (predicado “p” a definir intensionalmente)
♦ T = {T+, T -} = {t}, t = <a 1... ak> (definición extensional de “p”)
Problema:
Encontrar una o varias cláusulas de Horn:
p(X1, ...,Xk) :- L1, ..., Ln
con Li de alguna de las formas: Xj = Vm, Xj ≠ Vm, q(V1,..., Vr), ¬q(V1,..., Vr)
tales que definan intensionalmente T
Inteligencia Artificial, Aprendizaje y Minería de Datos. Pág. 40Junio 1998
Antonio J. Gómez Flechoso
FOIL: algoritmo
Clausula& construyeC(TR,T-,p, ...);
C:= p;
repetir
Li = buscaAntecedente();
Ci =Ci-1 ∨ ¬Li; /*nuevo antec*/
Ti+1 = actualizarT(Ti, Li);
hasta consistente(Ci);
return Ci;
Bucle interno: cláusulaconsistenteBucle externo: definicióncompleta
Definicion& FOIL (T+,T-, p, q1, q2...);
D0:= FALSE;
TC0 = ∅;
repetir
Clausula C = construyeC();
Di = Di-1 ∨ C; /* nueva cláusula */
TCi = TC
i-1 ∪ TC(C)
hasta completa(Di);
return Di;
Inteligencia Artificial, Aprendizaje y Minería de Datos. Pág. 41Junio 1998
Antonio J. Gómez Flechoso
FOIL: heurísticos
FOIL: Heurísticos
♦ Para evaluar literales:
Ganancia(Li) = Ni++ ⋅ (Info(Ti) - Info(Ti+1))
siendo: Info(Ti) = −log2(Ni+/(Ni
+ + Ni-))
♦ Para buscar literales:
• Li debe tener al menos una variable existente (en la cláusula en construcción)
• Restricción de argumentos de Li en definiciones recursivas
• Uso de “literales determinados”
• Poda alpha-beta para simplificar la búsqueda
• Definiciones inconsistentes y/o incompletas (principio de Rissanen: LDI < LDE)
Inteligencia Artificial, Aprendizaje y Minería de Datos. Pág. 42Junio 1998
Antonio J. Gómez Flechoso
DESCUBRIMIENTO DE CONOCIMIENTO ENBD (KDD)
Procesos de KDD
Base de
Datospreprocesados
Datostransformados
Patrones
Conocimiento
Datosobjetivo
Selección
Preprocesado
Transformación
Minería de datos
Interpretación/Evaluación
Datos
Inteligencia Artificial, Aprendizaje y Minería de Datos. Pág. 43Junio 1998
Antonio J. Gómez Flechoso
DESCUBRIMIENTO DE CONOCIMIENTO ENBD (KDD)
Factores para análisis automático de datos
Incremento de la potencia de los ordenadores:
• Potencia de cálculo
• Capacidad de almacenamiento de datos
Incremento del ritmo de adquisición de datos:
• Abaratamiento de discos y sistemas de almacenamiento masivo
• Automatización en adquisición de datos (¡información se duplica cada 20 meses!)
Nuevos métodos de aprendizaje y representación del conocimiento
Inteligencia Artificial, Aprendizaje y Minería de Datos. Pág. 44Junio 1998
Antonio J. Gómez Flechoso
DESCUBRIMIENTO DE CONOCIMIENTO ENBD (KDD)
Limitaciones del aprendizaje sobre BD
Datos dinámicos
→ funcionamiento incremental
Datos incompletos
→ capacidad de manejar datos incompletos
Ruido e incertidumbre
→ robustez ante el ruido
→ manejo de incertidumbre
Tamaño de las BD
→ eficiencia algorítmica
→ conocimiento previo
Inteligencia Artificial, Aprendizaje y Minería de Datos. Pág. 45Junio 1998
Antonio J. Gómez Flechoso
FZFOIL (FUZZY FOIL)
♦ Mejoras en heurísticos de evaluación
• Nuevos heurísticos de evaluación (función Interés)
• Proyección de conjuntos de entrenamiento
♦ Introducción de conocimiento de base (relaciones intensionales)
♦ Extensión hacia la lógica borrosa:
• Aplicable sobre BD relacionales borrosas
• Induce conocimiento con incertidumbre
Inteligencia Artificial, Aprendizaje y Minería de Datos. Pág. 46Junio 1998
Antonio J. Gómez Flechoso
FZFOIL: EVALUACIÓN DE LITERALES
Medida de interés (RI)(Piatetsky-Shapiro,89)
SeaA → B una regla lógica
Entonces N ≡ tamaño conjunto entrenamiento (nº tuplas)
NA, NB ≡ nº tuplas satisfacen condición A, B
NA∧Β ≡ nº tuplas satisfacen condición A∧B
Requisitos de RI:
• A y B independientes⇒ RI = 0
• NA, NB ↓ ⇒ RI ↑
• NA∧B ↑ ⇒ RI ↑
RI1 NA B∧ NA NB⋅( ) N⁄–=
RI2NA B∧ NA NB⋅( ) N⁄–
NA NB 1 NA N⁄–( ) 1 NB N⁄–( )⋅ ⋅ ⋅----------------------------------------------------------------------------------------------=
Inteligencia Artificial, Aprendizaje y Minería de Datos. Pág. 47Junio 1998
Antonio J. Gómez Flechoso
FZFOIL: EVALUACIÓN DE LITERALES (2)
Interés* = Interés + conjuntos proyectados
Li
T1
Ti Ti+1
T1[i]
T1[i+1]
Ni+ = Ti
+Ni
− = Ti−
Ni[i+1]+ = Ti
[i+1]+Ni
[i+1]− = Ti[i+1]−
T1[i] = TC(Ci-1) ⊆ T1
Inteligencia Artificial, Aprendizaje y Minería de Datos. Pág. 48Junio 1998
Antonio J. Gómez Flechoso
FZFOIL: ejemplo
a1 a2 a3 a4
b1 b2 b3 b4
c1 c3c2 c5c4
d1 d2 d4d3
a1 a2 a3 a4
b1 b2 b3 b4
c1 c3c2 c5c4
d1 d2 d4d3
Relación “padre_de” Relación “jefe_de”
Relaciones:enfermo = <b3>, <b4>, <c3>, <c4>, <c5>, <d2>, <d3>, <d4>padre_de = <a1,b1>, <a1,b2>, <a2,b1>, <a2,b2>, <b1,c1>, <b1, c2>, ...jefe_de = <a1,b1>, <b1,c1>, <c1,d1>, <c2,d1>, <a2,b2>, <a3,b2>, <a4,b3>, ...fumador = <b3>, <b4>, <d2>barbudo = <a3>, <b3>, <b4>, <c1>, <c2>, <c4>, <d1>, <d2>
Inteligencia Artificial, Aprendizaje y Minería de Datos. Pág. 49Junio 1998
Antonio J. Gómez Flechoso
FZFOIL: r esultados del ejemplo♦ Regla inducida por FOIL:
enfermo(A):- jefe_de(B,A), enfermo(B), ¬fumador(B)enfermo(A):- fumador(A)enfermo(A):- jefe_de(B,A), enfermo(B), padre_de(B,A)(consistente peroincompleta: no cubre 2 tuplas⊕)
♦ Regla inducida modificando FOIL con función Interés:
enfermo(A):- padre_de(B,A), barbudo(B), fumador(A)enfermo(A):- padre_de(B,A), enfermo(B)(consistente y completa, perocompleja)
♦ Regla inducida modificando FOIL con función Interés*:
enfermo(A):- padre_de(B,A), enfermo(B)enfermo(A):- fumador(A)(consistente, completa y sencilla)
Inteligencia Artificial, Aprendizaje y Minería de Datos. Pág. 50Junio 1998
Antonio J. Gómez Flechoso
LÓGICA BORROSA Y MUNDO REAL
Complejidad del mundo real = volumen + incertidumbre ⇒ Compromisoinformación / incertidumbre
♦ Conceptos humanos≈ conjuntos borrosos [Zadeh,65]
♦ Lenguaje humano impreciso (incompatibilidad precisión / significación)
Lógica borrosa [Zadeh,75] (isomorfa con conjuntos borrosos)
♦ Necesaria para inferencias imprecisas
♦ Método natural de representar el mundo real
Sistemas expertos borrosos, BD relacionales borrosas, etc
Inteligencia Artificial, Aprendizaje y Minería de Datos. Pág. 51Junio 1998
Antonio J. Gómez Flechoso
*padre_de (persona,persona)
a1,b1
a2,b1
a1,b2
a2,b2
a3,b3
a3,b4
a4,b3
a4,b4
b1,c1
b1,c2
b2,c3
b3,c3
b4,c4
b4,c5
c1,d1
c2,d1
c2,d2
c2,d3
c4,d2
c4,d3
c5,d4
enf
b3
b4
c3
c4
c5
d2
d3
d4
*fumador (persona)
b3 :0.95
b4 :0.8
d4 :0.75
*ba
a3 :
a4 :
b4 :
c1 :
d2 :0.4
c1 :0.2
a2 :0.3
FZFOIL: Ejemplo borroso
[D1] {8.951 bits} TC: [6.58/7.04]; TR: [0.12]
[C1] {7.953 bits} [6.70/19.00]-> [5.04/5.37]
enfermo (A) :-
padre_de (B A),
ALGO_enfermo (B).
[C2] {3.584 bits} [1.62/13.00]-> [1.54/1.67]
enfermo (A) :-
MUY_fumador (A).
*jefe_de (persona,persona)
a1,b1
a2,b2
a2,b3
a3,b2
a3,b3
a4,b3
b1,c1
b2,c2
c2,d1
c3,d2
c3,d3
c3,d4
c4,d2
c4,d3
c4,d4
c5,d4
ermo (persona)
: 0.9
: 0.72
:0.9
:0.8
:0.88
:0.9
:0.85
: 0.75
rbudo (persona)
0.4
0.7
0.88
0.9
*I_nieto_de(persona, persona)
nieto_de(A,B):-
padre_de(C,A), padre_de(B,C)
c2 :0.5
c4 :0.95
d1 :0.6
d2 :1
b2,c3
b2,c4
b3,c2
b3,c3
b3,c4
b4,c4
b4,c5
c1,d1
1)
83”
consultas de usuarios
lao, Av. América, etc)
bre”
”
tiempo”,
RESULTADOS: PROYECTOSEIC (
SEIC (Servicio de Información Ciudadana) “PASO, PC-1
Problema “Usos y Demandas”: Análisis inteligente de
Datos de entrada: 40000 consultas, con 14 atributos:
• Ubicación de PIC (Alonso Martínez, Atocha Renfe, Cal
• Mes: “Julio”, “Agosto”, “Septiembre”, “Octubre”, “Noviem
• Día del mes: [1 ... 31]
• Día de semana: “Lunes”, ..., “Domingo”
• Origen/destino: “Aquí”, “Calle”, “Cruce”, “Estación metro
• Modo transporte: “Cualquiera”, “sólo bus”, “sólo metro”
• Criterio de camino: “Óptimo”, “mín. transbordos”, “mín.
• etc.
Inteligencia Artificial, Aprendizaje y Minería de Datos. Pág. 53Junio 1998
Antonio J. Gómez Flechoso
RESULTADOS: PROYECTOSEIC (2)
Selección y preprocesado: muestreo y 10 atributos ordinarios (2 borrosos)
Transformación de los datos:
• 8 relaciones ordinarias:destino, origen, fecha, rest_tte, rest_optim, etc.
• 6 relaciones borrosas: cuando_mañana, cuando_tarde, cuando_noche,duración_larga, duración_corta, duración_media
2 4 6 8 10 12 14 16 18 20 22 24 Hora_día
µ
1
0
Noche Mañana Tarde Noche
Relaciones intensionales:
bus_mintransbordos(X):-
rest_tte(X,Y), Y=”solo_bus”, rest_optim(X,Z), Z=”min_transbordos”
Inteligencia Artificial, Aprendizaje y Minería de Datos. Pág. 54Junio 1998
Antonio J. Gómez Flechoso
3)
.71]
00]
RESULTADOS: PROYECTOSEIC (
Algunas definiciones borrosas:
[C1] {17.062 bits} [694.00/1694.00]→ [346.28/772
min_tiempo ( A ) :-
cuando_tarde ( A B C ),
¬ =_const ( C Viernes )...
[C1] {5.392 bits} [232.00/1232.00]→ [232.00/232.
bus_mintransbordos ( A ) :-
sólo_bus ( A ).
Inteligencia Artificial, Aprendizaje y Minería de Datos. Pág. 55Junio 1998
Antonio J. Gómez Flechoso
4)
niciones borrosas son más
las definiciones ordinarias.
ocasiones, también son más
retar desde el punto de vista
relaciones borrosas no tiene
RESULTADOS: PROYECTOSEIC (
♦ A igualdad de longitud de las definiciones, las defi
completas y, en ocasiones, más consistentes que
♦ Las definiciones borrosas generalizan mejor y, en
precisas.
♦ Las definiciones borrosas son más fáciles de interp
humano.
♦ El coste computacional asociado a la evaluación de
por qué ser superior.
Inteligencia Artificial, Aprendizaje y Minería de Datos. Pág. 56Junio 1998
Antonio J. Gómez Flechoso
RESUMEN Y CONCLUSIONES
♦ KDD se perfila como la aplicación dominante de la IA en poco tiempo
♦ Dentro de KDD, la minería de datos es una parte fundamental
♦ La minería de datos se basa en métodos de aprendizaje tradicionales, especial-
mente sistemas simbólicos (programación lógica inductiva).
♦ Las bases de datos, y el mundo real en general, presentan nuevos retos para los
sistemas de aprendizaje.
♦ La lógica borrosa (y otras teorías sobre incertidumbre) ofrece mecanismos para
modelar la complejidad del mundo real