minería de datos dr. francisco j. mata 1 razonamiento basado en memoria teoría tema 13
TRANSCRIPT
Minería de datosDr. Francisco J. Mata 1
Razonamiento basado en memoria
Teoría
Tema 13
Minería de datosDr. Francisco J. Mata 2
Razonamiento basado en memoria
Minería de datosDr. Francisco J. Mata 3
Razonamiento basado en memoria
Minería de datosDr. Francisco J. Mata 4
Razonamiento basado en memoria
Minería de datosDr. Francisco J. Mata 5
Razonamiento basado en memoria
Minería de datosDr. Francisco J. Mata 6
Razonamiento basado en memoria
Minería de datosDr. Francisco J. Mata 7
Razonamiento basado en memoria
FuncionamientoAlmacenar los registros pre-clasificadosPara un registro nuevo, encontrar los vecinos
más cercanosUtilizar los vecinos para decidir qué valor
asignarle al nuevo registro
Minería de datosDr. Francisco J. Mata 8
Razonamiento basado en memoria
Minería de datosDr. Francisco J. Mata 9
Razonamiento basado en memoria
Minería de datosDr. Francisco J. Mata 10
Razonamiento basado en memoria
Minería de datosDr. Francisco J. Mata 11
Razonamiento basado en memoria
Minería de datosDr. Francisco J. Mata 12
Razonamiento basado en memoria
Minería de datosDr. Francisco J. Mata 13
Razonamiento basado en memoria
Minería de datosDr. Francisco J. Mata 14
Razonamiento basado en memoria
Minería de datosDr. Francisco J. Mata 15
Razonamiento basado en memoria
Minería de datosDr. Francisco J. Mata 16
Razonamiento basado en memoria
Minería de datosDr. Francisco J. Mata 17
Razonamiento basado en memoria
Minería de datosDr. Francisco J. Mata 18
Razonamiento basado en memoria
Vecino Distancia Peso Códigos
1 0.076 0.924 R/FE, R/CA, R/CO
2 0.346 0.654 R/FE, R/JA, R/CA
3 0.369 0.631 R/FE, R/JA, R/MI
4 0.393 0.607 R/FE, R/JA, R/CA
Minería de datosDr. Francisco J. Mata 19
Razonamiento basado en memoria
Código 1 2 3 4 Score
R/CA 0.924 0.645 0 0.607 2.176
R/CO 0.924 0 0 0 0.924
R/FE 0.924 0.654 0.631 0.607 2.816
R/JA 0 0.654 0.631 0.607 1.892
R/MI 0 0 0.631 0 0.631
Minería de datosDr. Francisco J. Mata 20
Razonamiento basado en memoria
Minería de datosDr. Francisco J. Mata 21
Razonamiento basado en memoria
Minería de datosDr. Francisco J. Mata 22
Razonamiento basado en memoria
Requerimientos de variablesUna variable “target”
Binaria, nominal o intervalo Ordinal debe ser convertida a intervalo
Variables “input” Numéricas, ortogonales y estandarizadas
Utilizar el nodo “Princomp/Dmneural” para obtener una descomposición mediante valores principales
Minería de datosDr. Francisco J. Mata 23
Razonamiento basado en memoria
Creación de un archivo de entrenamientoNúmero similar de registros para cada clase
de la variable “target”Docenas de ejemplos mejor si son cientos o
miles
Minería de datosDr. Francisco J. Mata 24
Razonamiento basado en memoria
Muchosregistrosbaja efi-ciencia
Pocosregistrosmejora eficiencia
Minería de datosDr. Francisco J. Mata 25
Razonamiento basado en memoria
Minería de datosDr. Francisco J. Mata 26
Razonamiento basado en memoria
Minería de datosDr. Francisco J. Mata 27
Razonamiento basado en memoria
Minería de datosDr. Francisco J. Mata 28
Razonamiento basado en memoria
Minería de datosDr. Francisco J. Mata 29
Razonamiento basado en memoria
FortalezasResultados son fácilmente entendibles
No son reglas del tipo if-then Sino del tipo se hace esta predicción considerando
los resultados de estos registros los cuales son muy parecidos al nuevo
Minería de datosDr. Francisco J. Mata 30
Razonamiento basado en memoria
FortalezasFunciona bien con cualquier número de
variables El rendimiento del razonamiento basado en
memoria depende más del conjunto de datos de adiestramiento que en el número de variables
Ventaja sobre rede neuronales y regresión
Minería de datosDr. Francisco J. Mata 31
Razonamiento basado en memoria
DebilidadesComputacionalmente costoso a la hora del
“scoring” Encontrar los vecinos más cercanos es
computacionalmente costoso si el conjunto de adiestramiento es muy grande
Árboles de decisión y redes neuronales no utilizan el conjunto de adiestramiento a la hora de hacer el “scoring”
Minería de datosDr. Francisco J. Mata 32
Razonamiento basado en memoria
DebilidadesDependencia de la función de distancia, de la
función de combinación y del número de vecinos
Resultados dependen de estos parámetros
Minería de datosDr. Francisco J. Mata 33
Razonamiento basado en memoria
Cuando utilizarlo Cuando los patrones en los datos son muchos y muy locales y
reglas y funciones globales no tienen sentido Ejemplo: ¿Por qué clientes dejan de comprar de un catálogo?
Nuevos almacenes se abren en el vecindario Están inundados de otros catálogos Pierden el trabajo, etc.
Cuando no utilizarlo Cuando hay pocas razones para algo y reglas son globales
Ejemplo: ¿Por qué clientes compran en diciembre? Para dar regalos