maching learning vs ssas data mining
TRANSCRIPT
#SQSummit
Maching Learning vs SSAS Data Mining
Daniel Gil - DPS ([email protected])
Pau Sempere – DPA ([email protected])
Contenido de la sesión
• Introducción• Enfrentando las herramientas
• Limitaciones y diferencias• Market Basket Analysis• Clasificación• Series temporales
Contenido de la sesión
• Introducción• Enfrentando las herramientas
• Limitaciones y diferencias• Market Basket Analysis• Clasificación• Series temporales
Introducción
SSAS Data Mining• On premises• Integrado en SSAS • 9 algoritmos disponibles• DMX
Introducción
Azure Machine Learning• Cloud• Múltiples orígenes, todos desde nube• Transformaciones específicas• 25+ algoritmos disponibles• Integra Python y R• Servicios web
Contenido de la sesión
• Introducción• Enfrentando las herramientas
• Limitaciones y diferencias• Market Basket Analysis• Clasificación• Series temporales
¡Enfrentando las herramientas!
Contenido de la sesión
• Introducción• Enfrentando las herramientas
• Limitaciones y diferencias• Market Basket Analysis• Clasificación• Series temporales
Diferencias - Orígenes
Azure ML • Hive• SQL Database• Blob Storage• Table Storage• Odata• HTTP
SSAS Data Mining• Bases de datos• Cubos SSAS
Diferencias - Dimensionamiento
Azure ML • 10 GB en total• Hay módulos que
aceptan menos• Recomendadores• SMOTE• Scripts (R, Python, SQL)• Cross-validation, Tune
Model Hyperparameters
SSAS Data Mining• Dependiente del
hardware
Diferencias - Tiempos
Azure ML • 1 hora en versión free
• 7 días de ejecución• 24 horas por módulo
SSAS Data Mining• Ilimitado
Contenido de la sesión
• Introducción• Enfrentando las herramientas
• Limitaciones y diferencias• Market Basket Analysis• Clasificación• Series temporales
Market Basket Analysis
¿Qué compran nuestros usuarios?
¿Cómo lo compran? ¿Siguen un patrón?
Market Basket Analysis
Usuario Producto Cantidad
Dani Disfraz 1
Pau Disfraz 1
Dani Capa 1
Pau Cables 2
Pau Switch 1
Pau Capa 1
Usuario Edad Sueldo
Daniel 25 Poco
Pau 29 Menos aun
Market Basket Analysis
Usuario Edad Sueldo Producto Cantidad
Daniel 25 Poco Disfraz 1
Capa 1
Pau 29 Menos aun Disfraz 1
Capa 1
Cables 2
Switch 1
Market Basket Analysis
• Association rules / Árboles de decisión• Podemos añadir clustering para identificar
patrones de compra
DemoMarket Basket Analysis con SSAS
Market Basket Analysis
• No hay un algoritmo específico• Preprocesado del dato para darle otra forma
Matriz de productos / Usuarios
Dani Pau
Disfraz 1 1
Capa 1 1
Cable 0 1
Switch 0 1
DemoMarket Basket Analysis con Azure ML
Contenido de la sesión
• Introducción• Enfrentando las herramientas
• Limitaciones y diferencias• Market Basket Analysis• Clasificación• Series temporales
Clasificación
• Predicción de categorías• Muerto / vivo• Solvente / deudor• Comprador / no comprador• …
Clasificación
Clasificación
• Varios algoritmos: • Árboles de decision
• Múltiples modos de ejecución• Regresión logística• Red neural• Clustering
• Análisis de precisión• Lift chart• Profit chart• Red de dependencias
Clasificación
• Múltiples algoritmos• Boosted decision tree• Red neural• Regresión logística• Máquina bayesiana• …
• Análisis de precisión• ROC• Lift chart• Puntuaciones ponderadas
DemoClasificación binaria
Contenido de la sesión
• Introducción• Enfrentando las herramientas
• Limitaciones y diferencias• Market Basket Analysis• Clasificación• Series temporales
Series temporales
• Datos sobre un eje temporal / numérico• Cumplen patrones cíclicos
Series temporales
• Dos algoritmos nativos• ARTXP• ARIMA
• Comprar contra casos conocidos (training-test) • Visualmente• Métricas de error
Series temporales
• No hay un algoritmo nativo• Pero siempre está …
• ARIMA• ETS• Otros
• Mismo método para estimar la precision que en SSAS
DemoSeries temporales
Conclusiones
Azure ML • Fuentes Azure• Variedad de algoritmos• R! Python!• 100 % Online• Todo en 1
SSAS Data Mining• On premises• Sin limite de datos y
tiempos• Menos algoritmos nativos• Necesidad de
herramientascomplementarias
¿PREGUNTAS?
También puedes preguntar tus dudas con el hashtag #SQSummit en Twitter
ADAPTIVE BI FRAMEWORKTe ayudaremos a mejorar la velocidad de desarrollo de tu plataforma de analítica de negocio basada en nuestra experiencia:•Diseña antes de construir•Automatización de procesos por ETL•Servicios de mentoring para ayudarte a conseguir mejores prácticas para la construcción de procesos específicos y plataformas de analítica de negocio
•Muy fácil de mantener
SOLIDQ FLEX SERVICESCon SolidQ Flex Services evitarás sustos, consiguiendo que tus sistemas sean estables. Desde una solución sencilla de monitorización, hasta un servicio de atención de incidencias 24/7, mantenimiento proactivo, resolución de problemas y línea de soporte. Todo con un coste fijo mensual… y tú dedica el tiempo a las cosas importantes.
¡Gracias!