presentación paul embrechts

29
PRESENTACIÓN ARTÍCULO: “CLUSTERIZACIÓN DE ESTUDIANTES DE LA REGIÓN DEL MAULE” Daniela Lazo 1

Upload: daniela-lazo-toledo

Post on 17-Dec-2015

9 views

Category:

Documents


1 download

DESCRIPTION

Presentación Paul Embrechts

TRANSCRIPT

Diapositiva 1

Presentacin artculo:

Clusterizacin de estudiantes de la regin del Maule

Daniela Lazo

1Clusterizacin de estudiantes de la regin del MauleEste artculo tiene como objetivo descubrir caractersticas de los estudiantes de la regin del Maule, a travs de la visualizacin y clusterizacin de stos. Aplicacin de SOM. Los datos estn relacionados con la prueba SIMCE de matemtica.2SimceEl SIMCE fue creado en el ao 1988 como una evaluacin externa cuyo propsito consiste en contribuir al mejoramiento de la calidad y equidad de la educacin. Desde el 2012, SIMCE pas a ser el sistema de evaluacin que la Agencia de Calidad de la Educacin utiliza para evaluar los resultados de aprendizaje de los establecimientos

3SIMCENivel de Aprendizaje Adecuado: puntaje SIMCE: 295 puntos o ms. Nivel de Aprendizaje Elemental: corresponden al rango 245 puntos o ms, y menos de 295 puntos.Nivel de Aprendizaje Insuficiente: puntaje SIMCE: menos de 245 puntos.

4somUn SOM es red neuronal de aprendizaje no supervisado Convierte las relaciones no lineales entre datos estadsticos de alta dimensin en relaciones geomtricas simples de sus puntos de imagen en una pantalla de baja dimensin (Kohonen, Self-Organizing maps, 1995)5

METODOLOGALa metodologa utilizada se basa en la sugerida por (Vesanto, Himberg, Alhoniemi, & Parhankangas, 1999) en la aplicacin de SOM. Los pasos consisten en la preparacin de los datos, inicializacin y entrenamiento y visualizacin de datos. Para la aplicacin del algoritmo SOM en se utiliza el paquete Kohonen disponible en R.Obtencin de datos: Cuestionarios SIMCE.6METODOLOGALa metodologa de preparacin de los datos consta de los siguientes pasos: Limpieza de datosReemplazo de datos faltantesModificaciones de atributosNormalizacin de atributosSeleccin de atributos: GainRatioAttributeEval, chisquared, oneR, del paquete FSelector de R.

7METODOLOGAParmetros SOM en R:gridrlenalfainit8Metodologa visualizacinMatriz UEste grfico permite observar la distancia entre cada nodo y sus vecinos. Por lo general se ve con una paleta de escala de grises, en la que mientras ms oscuro es el color entre dos neuronas, menor es la distancia entre ellas.

9

Metodologa VISUALIZACINVectores de referencia10

metodologa VISUALIZACINMapas de calor11

Metodologa clusterizacinPara realizar la clusterizacin en primer lugar se define el nmero adecuado de clusters. Regla del codoEl nmero de clusters se estima mediante el criterio Calinski

12

rESULTADOS13

Resultado:som14Para el entrenamiento SOM se ha seleccionado un mapa de dimensiones 20x20, el nmero de iteraciones 1.000, la forma en la que decrece el aprendizaje es lineal con parmetros 0,05 y 0,01 y la es topologa hexagonal.

rESULTADOS:som15

rESULTADOS: visualizacin16

rESULTADOS: visualizacin17

rESULTADOS: mapas de calor18

rESULTADOS: mapas de calor19

rESULTADOS: clusterizacin20

rESULTADOS: clusterizacin21

rESULTADOS: clusterizacin22

rESULTADOS: clusterizacin23

resultados24Grupo verde: bajos puntajes de simce y promedio general, existe una frecuencia aplicacin de estrategias a nivel medio.Grupo azul: agrupa la mayor parte de los estudiantes, existen altos niveles de utilizacin de estrategias pedaggicas. Los puntajes son variables, sin embargo, los puntajes ms altos se encuentran en este grupo. Grupo anaranjado: en este grupo, existen bajos niveles de utilizacin de estrategias y puntajes bajos de SIMCE.

resultados25Los resultados del SIMCE estn directamente relacionados con el promedio general.La aplicacin de metodologas y estrategias influyen en el puntaje del SIMCE.

conclusiones26El mapa auto-organizado permite visualizar a los estudiantes en unidades de referencia.La visualizacin SOM permite establecer relaciones entre las variables.Es necesario explorar topologas y distintos conjuntos de variables.

bibliografa27Agencia de calidad de la Educacin. (2012). SIMCE. Obtenido de www.dsstgo.cl/contenidos2012/documentos2012/inicio/simce.pdfKohonen, T. (1982). Self-Organized Formation of Topologically Correct Feature Maps. Biological cybernetics, 59-69.Kohonen, T. (1995). Self-Organising maps. Finland: Springer.Lynn, S. (3 de Febrero de 2014). SELF-ORGANIZING MAPS FOR CUSTOMER SEGMENTATION USING R. Recuperado el 1 de Octubre de 2014, de http://shanelynn.ie/index.php/self-organising-maps-for-customer-segmentation-using-r/Marin, D. J. (2014). Los mapas auto-organizados de Kohonen. Obtenido de Sitio Web Universidad Carlos III de Madrid: http://halweb.uc3m.es/esp/Personal/personas/jmmarin/esp/DM/tema5dm.pdfMatich, D. J. (2001). Redes Neuronales: Conceptos Bsicos y Aplicaciones. Obtenido de Ctedra de Informtica Aplicada a la Ingeniera de ProcesosOrientacin I.: http://www.frro.utn.edu.ar/repositorio/catedras/quimica/5_anio/orientadora1/monograias/matich-redesneuronales.pdfMINEDUC. (2013). Estndares de aprendizaje Matemtica. Recuperado el 17 de Octubre de 2014, de http://www.curriculumenlineamineduc.cl/605/articles-33859_recurso_7.pdfSIMCE. (2008). Niveles de Logro 4 Bsico Educacin Matemtica. Recuperado el 17 de Octubre de 2014, de http://www.agenciaeducacion.cl/wp-content/uploads/2013/01/NL_Matematica_4%C2%B0basico.pdfSushmita Mitra, T. A. (2005). Data mining multimedia, soft computing and bioinformatics.Vesanto, J., Himberg, J., Alhoniemi, E., & Parhankangas, J. (1999). Self-organizing map in Matlab: the SOM Toolbo. Proceddings of the Matlab DSP Conference, 35-40.Wehrens, R. (4 de Agosto de 2014). Package kohonen. Recuperado el 20 de Octubre de 2014, de sitio Web r-project: http://cran.r-project.org/web/packages/kohonen/kohonen.pdfWehrens, R., & Buydens, L. (2007). Self and super-organizing maps in R: The kohonen Package. Journal of Statistical Software, 1-19.

bibliografa28MINEDUC. (2013). Estndares de aprendizaje Matemtica. Recuperado el 17 de Octubre de 2014, de http://www.curriculumenlineamineduc.cl/605/articles-33859_recurso_7.pdfSIMCE. (2008). Niveles de Logro 4 Bsico Educacin Matemtica. Recuperado el 17 de Octubre de 2014, de http://www.agenciaeducacion.cl/wp-content/uploads/2013/01/NL_Matematica_4%C2%B0basico.pdfSushmita Mitra, T. A. (2005). Data mining multimedia, soft computing and bioinformatics.Vesanto, J., Himberg, J., Alhoniemi, E., & Parhankangas, J. (1999). Self-organizing map in Matlab: the SOM Toolbo. Proceddings of the Matlab DSP Conference, 35-40.Wehrens, R. (4 de Agosto de 2014). Package kohonen. Recuperado el 20 de Octubre de 2014, de sitio Web r-project: http://cran.r-project.org/web/packages/kohonen/kohonen.pdfWehrens, R., & Buydens, L. (2007). Self and super-organizing maps in R: The kohonen Package. Journal of Statistical Software, 1-19.

29