introducció í datos - albertorivera.files.wordpress.com · microsoft sql server 2008 minería de...
TRANSCRIPT
Microsoft SQL Server 2008
Una nueva generación en plataforma de datos Minería de datos
Alberto Rivera
MVP sql Server.
Microsoft SQL Server 2008 Minería de Datos
Que vamos a ver?
Minería de datos en SQL Server 2008
Integración con Microsoft Office Excel 2007
Integración con los servicios de inteligencia de Negocios de SQL Server
Microsoft SQL Server 2008 Minería de Datos
Cuál es el Rol de la Minería de Datos
Pocos Datos
Muchos
Co
mp
leja
s Sim
ple
s Fo
rmu
las
Bases de Datos Ho
jas
de C
alc
ulo
Minería de Datos
Microsoft SQL Server 2008 Minería de Datos
Qué NO es Minería de Datos
Análisis Multi-
Dimensional
Notificaciones de Eventos
Queries Ad Hoc
Estadísticas
Microsoft SQL Server 2008 Minería de Datos
Qué Es Minería de Datos
Grandes Data Sets
No trivial Util
Microsoft SQL Server 2008 Minería de Datos
Algoritmos
Naïve Bayes
Linear Regression
Logistic Regression
Microsoft SQL Server 2008 Minería de Datos
Clasificación
Regresión
Segmentación
Asociación
Pronósticos
Preguntas típicas de Negocio
¿Qué tipo de tarjeta de membrecía debería ofrecer?
¿Qué clientes responderán a mi correo directo?
¿Es esta transacción fraudulenta?
¿Perderé a este cliente?
¿Será este producto defectuoso?
Algoritmos Preferidos
Árboles de decisión
Naïve Bayes
Redes Neuronales
Además Clustering
Sequence Clustering
Reglas de Asociación
Tareas
Microsoft SQL Server 2008 Minería de Datos
Preguntas Típicas de Negocio
¿Cuántos Ingresos obtendré de este cliente?
Cuanto tiempo estará este activo en servicio?
Algoritmos Preferidos
Árboles de decisión
Redes Neuronales
Además Clustering
Sequence Clustering
Clasificación
Regresión
Segmentación
Asociación
Pronósticos
Tareas
Microsoft SQL Server 2008 Minería de Datos
Preguntas Típicas de Negocio
¿Cómo puedo diferenciar mis clientes?
¿Cómo puedo organizar mis datos de tal forma que tengan sentido?
Algoritmos Preferidos
Clustering
Sequence Clustering
Además
Redes Neuronales
Clasificación
Regresión
Segmentación
Asociación
Pronósticos
Tareas
Microsoft SQL Server 2008 Minería de Datos
Preguntas Típicas de Negocio
Análisis de Canasta de mercado/Venta Cruzada
¿Qué Ítems se compran juntos?
¿Qué productos debería recomendar a mi cliente?
Algoritmos Preferidos
Reglas de Asociación
Árboles de Decisión (Catálogos pequeños)
Además
Clustering, Sequence Clustering, Naïve Bayes, Redes Neuronales
Clasificación
Regresión
Segmentación
Asociación
Pronósticos
Tareas
Microsoft SQL Server 2008 Minería de Datos
Preguntas Típicas de Negocio
Cual es el ingreso proyectado para todos los productos?
¿Cuáles serán los niveles de inventario para el próximo mes?
Algoritmos
Series de Tiempo
Clasificación
Regresión
Segmentación
Asociación
Pronósticos
Tareas
Microsoft SQL Server 2008 Minería de Datos
Selección del algoritmo para cada tarea
Classification Regression Segmentation Association Sequence
Analysis
Association
Clustering
Decision Trees
Naive Bayes
Neural Network Sequence
Clustering
Time Series
Linear Regression Logistic
Regression
Microsoft SQL Server 2008 Minería de Datos
“Poniendo Data Mining a Trabajar”
“Haciendo Data Mining”
El proceso de Minería de Datos
Implantación
Evaluación
Diseño de modelos
Preparación de datos
Entendimiento de datos
Entendimiento del negocio
Datos
Microsoft SQL Server 2008 Minería de Datos
Validación cruzada
Estructuras Mejoradas
Mejor soporte a Series de Tiempo
ARTXP – corto plazo
ARIMA – largo plazo
Add-Ins para Microsoft Office 2007
Principales Novedades