¿qué es machine learning? usos de machine learning

Download ¿Qué es Machine Learning? Usos de Machine Learning

Post on 25-Jan-2016

218 views

Category:

Documents

2 download

Embed Size (px)

TRANSCRIPT

Introduction to Azure Machine Learning

Machine Learning:Bscandole el sentido a nuestros datosDiego Poza @diegopozaMariano Vazquez @marianodvazquez

AgendaQu es Machine Learning?Azure Machine LearningDemo: Creando un Web Service de Machine LearningDemo: Twitter Sentiment Analysis

2Sistemas computacionales que se vuelven ms inteligentes con la experienciaExperiencia = datos pasados + input humanoSon capaces de adaptarse independientemente y aprender

Utiliza algoritmos que aprenden de los datos sin la necesidad de programar reglas individualesObjetivo: predecir cual sera el resultado mas probable (insights)

til en casos donde no es factible disear o programar algoritmos explcitosCuando las decisiones tomados en base a grandes cantidades de datos tienden a ser las mejores decisiones

Qu es Machine Learning?Se basa en la induccin sobre modelos complejos (no lineales)til para Big DataPara descubrir patrones en los datosPara predecir resultados (insights) y ayudar a tomar mejores decisiones de negocioTres grandes categorasAprendizaje supervisadoAprendizaje no supervisadoAprendizaje por refuerzoTcnicas: clasificacin, clustering, regresin (prediccin)Son abstracciones de datosUsos de Machine LearningUseful when: Human expertise does not exist or is hard to explain (speech recognition, you dont have to be a master of backgammon to create a backgammon game)Solution changes in timeSolution needs to be adapted to particular cases

Three broad categoriesSupervised learning: use training data to map input and output data (labeled data)Unsupervised learning: data with no labels, the goal is to find relationship in the dataReinforcement learning: the algorithm gets to choose an action in response to each data point. Then it modifies its strategy in order to achieve the highest reward (robotics, IoT).

4Ejemplos5Recomendacin de pelculas en Netflix (The Netflix price, ofrecan $1M para mejorar la precisin en un 10%)

Filtros de spam, que usan tcnicas de clasificacin de texto (como Naive Bayes spam filtering)

Los vehculos auto-manejados de Google, que usanComputer vision, procesamiento de imgenes y algoritmos de machine learning para aprender del comportamiento de los conductores.Ejemplos de Machine LearningOther cases:Image search (similarityFraud detection (credit card providers)Decision making (bank/insurance sector)Speech understanding (Siri, Cortana)Face detection (Facebooks photo tagging)6Azure ML Studio (https://studio.azureml.net)

Herramienta colaborativa y drag-and-drop, para administrar ExperimentosNo es necesario programarSe pueden usar datasets de ejemplos o subir uno propioMdulos predefinidos y posibilidad de programar tu propio mdulo en R y PythonPublicar tus experimentos a un Web Service (API)

https://azure.microsoft.com/en-us/documentation/articles/machine-learning-data-science-how-to-create-machine-learning-service/7DemoCreando un Web Service de Machine LearningDataset de la UCI de Tarjetas de crdito de Alemania: 1000 filas de datos.Los clientes del banco solicitan crditos, y el modelo tiene que predecir si la operacin es de alto o bajo riesgo. 1 es bajo riesgo 2 es alto riesgoEscenarioDataset URL: http://archive.ics.uci.edu/ml/datasets/Statlog+(German+Credit+Data)9Experimento PredictivoObtener los datosSubir tu dataset (CSV, TSV, texto)Leer un dataset existente (HTTP, Azure SQL/Table/Blob)Usar datasets de ejemploPre-procesar los datosUsar mdulos de Pre-procesamientoProyectar ColumnasLimpiar Datos faltantesNormalizar DatosEditor de MetadataDefinir caractersticasUna caracterstica es una propiedad de la entidad.Elegir el subconjunto de todas las caractersticas que son relevantes para nuestro escenario.Entrenar al modeloElegir el algoritmo predictivo.Los dos tipos de algoritmos mas importantes son clasificacin y regresin.Crear experimento de scoringUna vez que el modelo es entrenado se puede crear el experimento de scoringLos elementos usados solo para entrenamiento son eliminadosPublicar Web ServiceSe crea un endpoint para consumir el servicioUn libro de Excel es creado para ver como los valores cambian el resultado en tiempo real

Dataset URL: http://archive.ics.uci.edu/ml/datasets/Statlog+(German+Credit+Data)10

Twitter Sentiment Analysis11Gracias!12

Recommended

View more >