TECNOLOGÍAS INTELIGENTES PARA EXPLOTACIÓN DE INFORMACIÓN Dr. Ramón García-Martínez
TECNOLOGÍAS INTELIGENTESPARA EXPLOTACIÓN DE INFORMACIÓN
PROCESOS Y CASOS DE ESTUDIO
Dr. Ramón García-MartínezCURSO DE DOCTORADO
TECNOLOGÍAS INTELIGENTES PARA EXPLOTACIÓN DE INFORMACIÓN Dr. Ramón García-Martínez
PROCESOS EI
CORRESPONDENCIA ENTRE PROCESOS DE EXPLOTACION DE INFORMACION, TECNOLOGIAS INTELIGENTES E INTELIGENCIA DE NEGOCIO
Predicción
Agrupamiento
Ponderación
Inducción
Agrupamiento + InducciónInducción + PonderaciónAgrupamiento + Ponderación
Redes BP
Redes SOM
Redes Bayesianas
Algoritmos TDIDT
SOM + TDIDT
TDIDT + Redes BayesianasSOM + Redes Bayesianas
TECNOLOGIAS PROCESO EXPLOTACION DE INFO PARA INTELIGENCIA DE NEGOCIO
Descubrimiento de reglas de comportamiento
Descubrimiento de grupos
Ponderación de interdependencia de atributosDescubrimiento de reglas de pertenencia a gruposPonderación de atributos relevantes en reglas de comportamientoPonderación de atributos relevantes en cada grupo descubierto
Predicción de valores de atributos
TECNOLOGÍAS INTELIGENTES PARA EXPLOTACIÓN DE INFORMACIÓN Dr. Ramón García-Martínez
Aplica cuando en un patrón <atributos de entrada, atributos de salida> se requiere predecir el valor de los atributos de salida para unos atributos de entrada dados.
Predicción de flujo de ventas
PROCESO: PREDICCION DE VALORES DE ATRIBUTOS
Ejemplos de problemas que requieren este proceso:
Predicción de flujo de demanda
Predicción del variables geofisicas en prospección petrolera.
TECNOLOGÍAS INTELIGENTES PARA EXPLOTACIÓN DE INFORMACIÓN Dr. Ramón García-Martínez
PROCESO: PREDICCION DE VALORES DE ATRIBUTOS
Identificaciónde atributosde entrada y
de salida
Archivos con atributosde entrada y salida identificados (patrones)
Entrenamiento de Red BP para el reconocimiento de correspondencia de atributos de salida con los de entrada
Red BP entrenada
TECNOLOGÍAS INTELIGENTES PARA EXPLOTACIÓN DE INFORMACIÓN Dr. Ramón García-Martínez
PROCESO: PREDICCION DE VALORES DE ATRIBUTOS
Inferir anomalías y variaciones de velocidades en capas con espesores muy por debajo de la resolución sísmica a partir de la sección sísmica y datos de pozo. Utilizando la predicción de datos faltantes.
Cersosimo, S., Ravazzoli, C., García-Martínez, R., 2006. Identification of Velocity Variations in a Seismic Cube UsingNeural Networks. IFIP Series, 218: 11-19.
CASO:
REFERENCIAS:
TECNOLOGÍAS INTELIGENTES PARA EXPLOTACIÓN DE INFORMACIÓN Dr. Ramón García-Martínez
Aplica cuando se requiere identificar una partición en la masa de información disponible sobre el dominio de problema.
Identificación de segmentos de clientes para bancos y financieras
PROCESO: DESCUBRIMENTO DE GRUPOS
Ejemplos de problemas que requieren este proceso:
identificación de tipos de llamadas de clientes para empresas de telecomunicaciónidentificación de grupos sociales con las mismas característicasidentificación de grupos de estudiantes con características homogéneas
Gentileza: M.Ing. Paola Britos
TECNOLOGÍAS INTELIGENTES PARA EXPLOTACIÓN DE INFORMACIÓN Dr. Ramón García-Martínez
PROCESO: DESCUBRIMENTO DE GRUPOSGentileza: M.Ing. Paola Britos
SOM
Generación de archivos de grupos
TECNOLOGÍAS INTELIGENTES PARA EXPLOTACIÓN DE INFORMACIÓN Dr. Ramón García-Martínez
PROCESO: DESCUBRIMENTO DE GRUPOS
Britos, P., Grosser, H., Rodríguez, D., Garcia-Martinez, R. (2008). Detecting Unusual Changes of Users Consumption. IFIP Series, 276: 297-306.
CASO:
REFERENCIAS:
Se desea descubrir los patrones de llamadas de un usuario dado para llamadas locales, llamadas nacionales o y llamadas internacionales en orden a detectar desvios en dichos patrones.
El perfil de usuario se estará representando con la distribución de frecuencia en la cuál un determinado usuario realiza un tipo de llamada determinada, mostrando esta estructura dedatos el patrón de consumo del mismo.
Las redes SOM) pueden tomar esta información y construir estos patrones de manera no supervisada por criterios de semejanza, sin saber nada a priori de los datos.
Para evitar ruidos en los datos, se utilizan 3 redes SOM que generen patrones para representar a las llamadas LOC, NAT e INT respectivamente.
El perfil de usuario se construye utilizando todos los patrones generados por las 3 redes.
TECNOLOGÍAS INTELIGENTES PARA EXPLOTACIÓN DE INFORMACIÓN Dr. Ramón García-Martínez
PROCESO: DESCUBRIMENTO DE GRUPOS
Patrones generados llamadas locales
05
101520253035
0 5 10 15 20 25
Hora
Dur
ació
n
Distribución de frecuencias CUP
0
0,005
0,01
0,015
1 17 33 49 65 81 97 113 129 145 161 177 193 209 225 241
PATRONES(1-144: LOC, 145-208: NAT, 209-244: INT)
Frec
uenc
ia
Distribución de frecuencias UPH
0
0.002
0.004
0.006
0.008
0.01
1 16 31 46 61 76 91 106
121
136
151
166
181
196
211
226
241
PATRONES(1-144: LOC, 145-208: NAT, 209-244: INT)
Frec
uenc
ia
PATRONES DE CONSUMO DE LA POBLACION DE USUARIOS
PATRONES DE CONSUMO DE UN USUARIO DADO EN EL TIEMPO T
PATRONES DE CONSUMO DE UN USUARIO DADO EN EL TIEMPO T+P
TECNOLOGÍAS INTELIGENTES PARA EXPLOTACIÓN DE INFORMACIÓN Dr. Ramón García-Martínez
Aplica cuando se requiere identificar cuales son las condicionespara obtener determinado resultado en el dominio del problema.
Identificación de características del local mas visitado por los clientes
PROCESO: DESCUBRIMENTO DE REGLAS DE COMPORTAMIENTO
Ejemplos de problemas que requieren este proceso:
Identificación de factores que inciden en el alza las ventas de un producto dadoEstablecimiento de características o rasgos de los clientes con alto grado de fidelidad a la marcaEstablecimiento de atributos demográficos y psicográficos que distinguen a los visitantes de un website
Gentileza: M.Ing. Paola Britos
TECNOLOGÍAS INTELIGENTES PARA EXPLOTACIÓN DE INFORMACIÓN Dr. Ramón García-Martínez
PROCESO:Gentileza: M.Ing. Paola Britos
Identificaciónde atributoClase
DESCUBRIMENTO DE REGLAS DE COMPORTAMIENTO
Reglas de Comportamiento
Aplicaciónde TDIDT
TECNOLOGÍAS INTELIGENTES PARA EXPLOTACIÓN DE INFORMACIÓN Dr. Ramón García-Martínez
PROCESO: DESCUBRIMENTO DE REGLAS DE COMPORTAMIENTO
Britos, P. Abasolo, M., García-Martínez, R. y Perales, F. 2005. Identification of MPEG-4 Patterns in Human Faces UsingData Mining Techniques. Proceedings 13 th InternationalConference in Central Europe on Computer Graphics, Visualization and Computer Vision: 9-10.
CASO:
REFERENCIAS:
A partir de una base de datos con medidas antropométricas del rostro humano (MPEG4 FDP Face Definition Parameters) desarrolladas por la Universidad de las Islas Baleares se busca ver si existen reglas que permitan caracterizar diferencias en los rostros segun el sexo.
TECNOLOGÍAS INTELIGENTES PARA EXPLOTACIÓN DE INFORMACIÓN Dr. Ramón García-Martínez
PROCESO: DESCUBRIMENTO DE REGLAS DE COMPORTAMIENTO
TECNOLOGÍAS INTELIGENTES PARA EXPLOTACIÓN DE INFORMACIÓN Dr. Ramón García-Martínez
Aplica cuando se requiere identificar cuales son los factores con mayor incidencia (o frecuencia de ocurrencia) sobre un determinado resultado del problema.
Factores con incidencia sobre las ventas
PROCESO: PONDERACION DE INTERDEPENDENCIADE ATRIBUTOS
Ejemplos de problemas que requieren este proceso:
Rasgos distintivos de clientes con alto grado de fidelidad a la marca
Atributos claves que convierten en vendible a un determinado productoCaracterísticas sobresalientes que tienen los visitantes de un website
Gentileza: M.Ing. Paola Britos
TECNOLOGÍAS INTELIGENTES PARA EXPLOTACIÓN DE INFORMACIÓN Dr. Ramón García-Martínez
PROCESO:Gentileza: M.Ing. Paola Britos
Identificaciónde atributoClase
Aplicaciónde TDIDT
PONDERACION DE INTERDEPENDENCIADE ATRIBUTOS
TECNOLOGÍAS INTELIGENTES PARA EXPLOTACIÓN DE INFORMACIÓN Dr. Ramón García-Martínez
Aplica cuando se requiere identificar cuales son las condicionesde pertenencia a cada una de las clases en una partición desconocida “a priori”, pero presente en la masa de información disponible sobre el dominio de problema.
Tipología de perfiles de clientes y caracterización de cada tipología
PROCESO: DESCUBRIMIENTO DE REGLAS DE PERTENENCIA A GRUPOS
Ejemplos de problemas que requieren este proceso:
Distribución y estructura de los datos de mi website
Segmentación etaria de mis estudiantes y comportamiento de cada segmentoClases de llamadas telefónicas en una región y caracterización de cada clase
Gentileza: M.Ing. Paola Britos
TECNOLOGÍAS INTELIGENTES PARA EXPLOTACIÓN DE INFORMACIÓN Dr. Ramón García-Martínez
PROCESO:Gentileza: M.Ing. Paola Britos
DESCUBRIMIENTO DE REGLAS DE PERTENENCIA A GRUPOS
SOM
Generación de archivos de grupos
Identificación de atributo
clase
Aplicación TDIDT
Reglas de Comportamiento de cada Grupo
TECNOLOGÍAS INTELIGENTES PARA EXPLOTACIÓN DE INFORMACIÓN Dr. Ramón García-Martínez
PROCESO: DESCUBRIMIENTO DE REGLAS DE PERTENENCIA A GRUPOS
Cogliati, M., Britos, P., García-Martínez, R. 2006. Patterns in Temporal Series of Meteorological Variables Using SOM & TDIDT. IFIP Series, 217: 305-314.
CASO:
REFERENCIAS:
En un grupo de series cronológicas de variables meteorológicas (temperatura, presión, intensidad dirección de viento) en Allen, en el Alto Valle del Río Negro se busca encontrar correlaciones entre características de la dirección e intensidad del viento, y el comportamiento de la temperatura del aire y la presiónatmosférica.
TECNOLOGÍAS INTELIGENTES PARA EXPLOTACIÓN DE INFORMACIÓN Dr. Ramón García-Martínez
PROCESO: DESCUBRIMIENTO DE REGLAS DE PERTENENCIA A GRUPOS
Conjunto de registros de fenómenos meteorológicos
Clusters de registros de fenómenos meteorológicos
SOM
TDIDT TDIDT
TDI DT
TDIDT
TDIDTTDIDT
TDIDT
TDIDT
HELADASRADIATIVAS
TECNOLOGÍAS INTELIGENTES PARA EXPLOTACIÓN DE INFORMACIÓN Dr. Ramón García-Martínez
Aplica cuando se requiere identificar cuales son las condicionescon mayor incidencia (o frecuencia de ocurrencia) en la determinación de una clase (cuyo comportamiento está descriptoen términos de reglas)
Rasgo con mayor presencia en los clientes con alto grado de fidelidad a la marca
PROCESO:
Ejemplos de problemas que requieren este proceso:
Frecuencia de ocurrencia de cada perfil de de clientes
Gentileza: M.Ing. Paola Britos
PONDERACIÓN DE ATRIBUTOS RELEVANTES EN REGLAS DE COMPORTAMIENTO
TECNOLOGÍAS INTELIGENTES PARA EXPLOTACIÓN DE INFORMACIÓN Dr. Ramón García-Martínez
PROCESO:
Gentileza: M.Ing. Paola Britos
PONDERACIÓN DE ATRIBUTOS RELEVANTES EN REGLAS DE COMPORTAMIENTO
Identificación del atributo
clase
Identificación del atributos antecedentes y consecuentes clase
Base con atributos
relevantes y y clase
asociada
TECNOLOGÍAS INTELIGENTES PARA EXPLOTACIÓN DE INFORMACIÓN Dr. Ramón García-Martínez
PROCESO:PONDERACIÓN DE ATRIBUTOS RELEVANTES EN REGLAS DE COMPORTAMIENTO
Jiménez Rey, E., Rodríguez, D., Britos, P., García-Martínez, R. (2008). Identificación de Problemas de Aprendizaje de Programación con Explotación de Información. Proceedingsdel XIV Congreso Argentino de Ciencias de la Computación, Workshop de Tecnología Informática Aplicada en Educación, Artículo 1881. ISBN 978-987-24611-0-2.
Britos, P., Jiménez Rey, E., García-Martínez, E. (2008). Work in Progress: Programming Misunderstandings Discovering Process Based On Intelligent Data Mining Tools. Proceedings 38th ASEE/IEEE Frontiers in Education Conference. Session F4H: Assessing and Understanding Student Learning. ISBN 978-1-4244-1970-8.
CASO:
REFERENCIAS:
El Profesor de un curso de programación básica desea explorar qué conceptos mal aprendidos están relacionados con el hecho de que los estudiantes no logren descubrir el algoritmo correctoasociado al problema propuesto y cuales de aquellos tienen mayor incidencia
VARIABLE DE CLASE ¿Logra Descubrir el Algoritmo?
¿Descubre la Naturaleza del Problema? ¿Comprende el Objetivo del Problema? ¿Consigue Generalizar la Solución? ¿Aplica Método de Refinamientos Sucesivos? ¿Logra Funcionamiento del Programa? ¿Obtiene una Solución Lógica? ¿Controla Condición Fin de Ciclo Repetitivo? ¿Usa Conectores Lógicos en forma correcta?
VARIABLES PREDICTORAS
TECNOLOGÍAS INTELIGENTES PARA EXPLOTACIÓN DE INFORMACIÓN Dr. Ramón García-Martínez
PROCESO:PONDERACIÓN DE ATRIBUTOS RELEVANTES EN REGLAS DE COMPORTAMIENTO(TDIDT)
TECNOLOGÍAS INTELIGENTES PARA EXPLOTACIÓN DE INFORMACIÓN Dr. Ramón García-Martínez
PROCESO:PONDERACIÓN DE ATRIBUTOS RELEVANTES EN REGLAS DE COMPORTAMIENTO(Redes Bayesianas)
Se aplican redes bayesianas a las variables que aparecen en las distintas reglas identificadas
-100%
20%80%
96%4%
86%14%
El estudiante descubre el algoritmo = síEl estudiante descubre el algoritmo = no
-100%
-
7%87%7%
25%62%12%
57%29%14%
El estudiante logra funcionamiento del programa = síEl estudiante logra funcionamiento del programa = noEl estudiante logra funcionamiento del programa = sí, con algún error
-100%
47%53%
100%-
86%14%
El estudiante generaliza la solución = síEl estudiante generaliza la solución = no
79%21%
93%7%
100%-
86%14%
El estudiante comprende el objetivo del problema = síEl estudiante comprende el objetivo del problema = no
24%76%
87%13%
100%-
86%14%
El estudiante descubre la naturaleza del problema = síEl estudiante descubre la naturaleza del problema = no
67%14%19%
67%20%13%
79%17%4%
100%--
El estudiante usa conectores lógicos correctamente = síEl estudiante usa conectores lógicos correctamente = noEl estudiante usa conectores lógicos correctamente = no evaluado
43%43%
-
67%13%20%
67%8%25%
86%14%
-
El estudiante controla finalización ciclo repetitivo = síEl estudiante controla finalización ciclo repetitivo = noEl estudiante controla finalización ciclo repetitivo = no siempre
86%5%
10%
60%20%20%
58%17%25%
86%-
14%
El estudiante programó alguna vez = noEl estudiante programó alguna vez = sí, en lenguaje Pascal El estudiante programó alguna vez = sí, en otro lenguaje
14%69%17%
33%67%
-
50%38%12%
71%14%14%
El estudiante aplica método de refinamientos sucesivos = síEl estudiante aplica método de refinamientos sucesivos = incompletoEl estudiante aplica método de refinamientos sucesivos = no
MalaRegularBuenaMuy Buena
El estudiante obtiene una solución lógicaVARIABLES
TECNOLOGÍAS INTELIGENTES PARA EXPLOTACIÓN DE INFORMACIÓN Dr. Ramón García-Martínez
Aplica cuando se requiere identificar cuales son las condicionescon mayor incidencia (o frecuencia de ocurrencia) en los atributos descriptores de un grupo.
Identificación del factor dominante que incide en el alza las ventas de un producto dado
PROCESO:
Ejemplos de problemas que requieren este proceso:
Identificación del tipo de llamada mas frecuente en una región
Gentileza: M.Ing. Paola Britos
PONDERACIÓN DE ATRIBUTOS RELEVANTES EN GRUPOS DESCUBIERTOS
TECNOLOGÍAS INTELIGENTES PARA EXPLOTACIÓN DE INFORMACIÓN Dr. Ramón García-Martínez
PROCESO:
Gentileza: M.Ing. Paola Britos
PONDERACIÓN DE ATRIBUTOS RELEVANTES EN GRUPOS DESCUBIERTOS
Aplicaciónde SOM
Identificación del atributos y grupo asociado