semana3 3 introduccion bi

of 18 /18
Dr. Manuel Sánchez Chero Rapid Miner INTELIGENCIA DE NEGOCIO Minería de Datos [email protected]

Author: nicoleanarella

Post on 24-Dec-2015

224 views

Category:

Documents


3 download

Embed Size (px)

DESCRIPTION

Introduccion BI

TRANSCRIPT

CONCEPTUALIZACION

Dr. Manuel Snchez Chero

Rapid MinerINTELIGENCIA DE NEGOCIOMinera de [email protected]

INTELIGENCIA DE NEGOCIO

INDICEMINERIA DE DATOS

RAPID MINER

INTELIGENCIA DE NEGOCIOS1.2.

Habilidad para transformar los datos en informacin, y la informacin en conocimiento, de forma que se pueda optimizar el proceso de toma de decisiones en los negocios.Es bsicamente un proceso de tratamiento e integracin de los datos para convertirlos en informacin relevante que involucra conceptos, mtodos de trabajo y herramientas.

EjecutivoReportes OperacionalesExport Excel, pdfOrigen de DatosAlmacn de DatosINTELIGENCIA DE NEGOCIOS

Un almacn de datos se prepara para admitir: Procesamiento analtico en lnea, Minera de datos

INTELIGENCIA DE NEGOCIOS

INTELIGENCIA DE NEGOCIOS

Plataformas de Inteligencia de Negocios

MINERIA DE DATOSConjunto de tcnicas y tecnologas que permiten explorar grandes bases de datos, de manera automtica, con el objetivo de encontrar patrones repetitivos, tendencias o reglas que expliquen el comportamiento de los datos en un determinado contexto.Esta tcnica es posible por que se fundamenta en tres campos de la tecnologa suficientemente maduros como:

RECOLECCIN MASIVA DE DATOSALTA CAPACIDAD DE COMPUTOALGORITMOS DE DATA MINING

En s la minera de datos produce 5 tipos de informacinASOCIACIONESSECUENCIASCLASIFICACIONESAGRUPAMIENTOSPRONSTICOS

MINERIA DE DATOSPROCESO DE LA MINERIA DE DATOSDataObjetivo

DataPre-procesadaDataTransformadaPatrones

Fuentes de datosPre-procesamientoExploracin y transformacinReconocimiento de PatronesEvaluacin e Interpretacin

DatacrudaDHWDBMS

Texto

Evaluacin y Entendimiento

Muestreo y SeleccinMuestreo SeleccinLimpieza de DatosDatos que no existenDatos no clasificadosIdentificacin de extremosEliminacin de Ruido Transformacin de DatosReduccin de DimensionalidadCreacin de CaractersticasNormalizacin de DatosVariables CorrelacionadasDiscretizacinReportes y Visualizacin

ModeladoClasificacinRegresinAgrupamientoAsociacinSecuenciacin

PREPARACIN DE LOS DATOS LIMPIEZA DE LOS DATOSMINERIA DE DATOSLimpieza de datosIntegracin de DatosTransformacin de datosReduccin de datos

Valores extremosValores nullValores con ruidoValores inconsistentesValores mal clasificadosProblemas de semntica significa lo mismo?Problemas de temporalidad cundo fue registrado?Problemas de codificacin y formato.Problemas de idioma.Problemas de duplicidad cul vale?Problema de medio de almacenamiento.Filas: suma y agregacin de datos Columnas: log, sin, exp, tan, etcFunciones entre columnas.

60% del tiempo

MINERIA DE DATOSCONSTRUCCIN DEL MODELOQu tcnicas de modelado usar para el proyecto?Usar experiencias de otrosCalibrar los parmetros del modelo.El modelado es un proceso iterativo.Es un proceso de prueba y error.Es diferente del aprendizaje supervisado y no supervisadoSe modela para describir o predecir.

DPModelos de prediccin para regresin y clasificacin

Algoritmos de regresin, predecir resultado numrico.Modelos descriptivos para agrupamiento y bsqueda de asociacionesAlgoritmos de Clustering y asociacin y secuenciacin

MINERIA DE DATOSClasificacin. Clasificar objetos en clases (categrico)Regresin. Mapeo de variables (continuo) Pronstico. Series de tiempo.Agrupamiento. Identificar grupos en los datosReglas de Buscar relaciones en los datos Asociacin.Secuenciacin Identificar el siguiente de la secuencia.PDDDPMODELOS DE MINERIA DE DATOS

MINERIA DE DATOSHERRAMIENTASPRIVADASIBM Intelligent Miner for Data.SPSS Clementina.DB2 DataWarehouse Suite.Statica Data Miner.

LIBRESRapid Miner.Orange.Weka.Knime.Jhep Work

RAPID MINERPrograma Informtico para el anlisis y minera de Datos

Hospedado

Se DistribuyeAGPL-Diseada para asegurar la cooperacin con la comunidad en el caso de software que corra en servidores de red

RAPID MINERCARACTERSTICAS

RAPID MINERFUNCIONALIDADESProgramacin basado en controles.Operadores conjuntos de algoritmos estandarizados.Repositorio corresponden almacn de datos y de proyectos.

RAPID MINERTECNICASDichas tcnicas, no son ms que algoritmos, que se aplican sobre un conjunto de datos para obtener unos resultados.IAESTADISTICAProvienenrbol de decisiones

REDES NEURONALESREGRESIN LINEAL

Dr. Manuel Snchez Chero

Rapid MinerINTELIGENCIA DE NEGOCIOMinera de [email protected]

Data Mining: Practical Machine Learning Tools and Techniques. Ian H. Witten, Eibe Frank. Morgan Kaufmann; 2st edition (June 8, 2005). 560 pp.

Data Mining with SQL Server 2005. ZhaoHui Tang, Jamie MacLennan. Wiley Publishing Inc. (2004).

Data Mining: Concepts and Techniques, Jiawei Han, Micheline Kamber. Morgan Kaufmann; 1st edition (August, 2000), 500 pp.

Introduccin a la minera de datos. J. Hernndez, J. Ramrez.