semana3 3 introduccion bi
Embed Size (px)
DESCRIPTION
Introduccion BITRANSCRIPT
CONCEPTUALIZACION
Dr. Manuel Snchez Chero
Rapid MinerINTELIGENCIA DE NEGOCIOMinera de [email protected]
INTELIGENCIA DE NEGOCIO
INDICEMINERIA DE DATOS
RAPID MINER
INTELIGENCIA DE NEGOCIOS1.2.
Habilidad para transformar los datos en informacin, y la informacin en conocimiento, de forma que se pueda optimizar el proceso de toma de decisiones en los negocios.Es bsicamente un proceso de tratamiento e integracin de los datos para convertirlos en informacin relevante que involucra conceptos, mtodos de trabajo y herramientas.
EjecutivoReportes OperacionalesExport Excel, pdfOrigen de DatosAlmacn de DatosINTELIGENCIA DE NEGOCIOS
Un almacn de datos se prepara para admitir: Procesamiento analtico en lnea, Minera de datos
INTELIGENCIA DE NEGOCIOS
INTELIGENCIA DE NEGOCIOS
Plataformas de Inteligencia de Negocios
MINERIA DE DATOSConjunto de tcnicas y tecnologas que permiten explorar grandes bases de datos, de manera automtica, con el objetivo de encontrar patrones repetitivos, tendencias o reglas que expliquen el comportamiento de los datos en un determinado contexto.Esta tcnica es posible por que se fundamenta en tres campos de la tecnologa suficientemente maduros como:
RECOLECCIN MASIVA DE DATOSALTA CAPACIDAD DE COMPUTOALGORITMOS DE DATA MINING
En s la minera de datos produce 5 tipos de informacinASOCIACIONESSECUENCIASCLASIFICACIONESAGRUPAMIENTOSPRONSTICOS
MINERIA DE DATOSPROCESO DE LA MINERIA DE DATOSDataObjetivo
DataPre-procesadaDataTransformadaPatrones
Fuentes de datosPre-procesamientoExploracin y transformacinReconocimiento de PatronesEvaluacin e Interpretacin
DatacrudaDHWDBMS
Texto
Evaluacin y Entendimiento
Muestreo y SeleccinMuestreo SeleccinLimpieza de DatosDatos que no existenDatos no clasificadosIdentificacin de extremosEliminacin de Ruido Transformacin de DatosReduccin de DimensionalidadCreacin de CaractersticasNormalizacin de DatosVariables CorrelacionadasDiscretizacinReportes y Visualizacin
ModeladoClasificacinRegresinAgrupamientoAsociacinSecuenciacin
PREPARACIN DE LOS DATOS LIMPIEZA DE LOS DATOSMINERIA DE DATOSLimpieza de datosIntegracin de DatosTransformacin de datosReduccin de datos
Valores extremosValores nullValores con ruidoValores inconsistentesValores mal clasificadosProblemas de semntica significa lo mismo?Problemas de temporalidad cundo fue registrado?Problemas de codificacin y formato.Problemas de idioma.Problemas de duplicidad cul vale?Problema de medio de almacenamiento.Filas: suma y agregacin de datos Columnas: log, sin, exp, tan, etcFunciones entre columnas.
60% del tiempo
MINERIA DE DATOSCONSTRUCCIN DEL MODELOQu tcnicas de modelado usar para el proyecto?Usar experiencias de otrosCalibrar los parmetros del modelo.El modelado es un proceso iterativo.Es un proceso de prueba y error.Es diferente del aprendizaje supervisado y no supervisadoSe modela para describir o predecir.
DPModelos de prediccin para regresin y clasificacin
Algoritmos de regresin, predecir resultado numrico.Modelos descriptivos para agrupamiento y bsqueda de asociacionesAlgoritmos de Clustering y asociacin y secuenciacin
MINERIA DE DATOSClasificacin. Clasificar objetos en clases (categrico)Regresin. Mapeo de variables (continuo) Pronstico. Series de tiempo.Agrupamiento. Identificar grupos en los datosReglas de Buscar relaciones en los datos Asociacin.Secuenciacin Identificar el siguiente de la secuencia.PDDDPMODELOS DE MINERIA DE DATOS
MINERIA DE DATOSHERRAMIENTASPRIVADASIBM Intelligent Miner for Data.SPSS Clementina.DB2 DataWarehouse Suite.Statica Data Miner.
LIBRESRapid Miner.Orange.Weka.Knime.Jhep Work
RAPID MINERPrograma Informtico para el anlisis y minera de Datos
Hospedado
Se DistribuyeAGPL-Diseada para asegurar la cooperacin con la comunidad en el caso de software que corra en servidores de red
RAPID MINERCARACTERSTICAS
RAPID MINERFUNCIONALIDADESProgramacin basado en controles.Operadores conjuntos de algoritmos estandarizados.Repositorio corresponden almacn de datos y de proyectos.
RAPID MINERTECNICASDichas tcnicas, no son ms que algoritmos, que se aplican sobre un conjunto de datos para obtener unos resultados.IAESTADISTICAProvienenrbol de decisiones
REDES NEURONALESREGRESIN LINEAL
Dr. Manuel Snchez Chero
Rapid MinerINTELIGENCIA DE NEGOCIOMinera de [email protected]
Data Mining: Practical Machine Learning Tools and Techniques. Ian H. Witten, Eibe Frank. Morgan Kaufmann; 2st edition (June 8, 2005). 560 pp.
Data Mining with SQL Server 2005. ZhaoHui Tang, Jamie MacLennan. Wiley Publishing Inc. (2004).
Data Mining: Concepts and Techniques, Jiawei Han, Micheline Kamber. Morgan Kaufmann; 1st edition (August, 2000), 500 pp.
Introduccin a la minera de datos. J. Hernndez, J. Ramrez.