universidad interamericana departamento de matemÁticas y ciencias aplicadas recinto de san germÁn
DESCRIPTION
UNIVERSIDAD INTERAMERICANA DEPARTAMENTO DE MATEMÁTICAS Y CIENCIAS APLICADAS RECINTO DE SAN GERMÁN SAN GERMÁN, PUERTO RICO PREPARACIÓN DE DATA Y SUBSECUENTE ANÁLISIS EN INVESTIGACIÓN DE MERCADOS - PowerPoint PPT PresentationTRANSCRIPT
![Page 1: UNIVERSIDAD INTERAMERICANA DEPARTAMENTO DE MATEMÁTICAS Y CIENCIAS APLICADAS RECINTO DE SAN GERMÁN](https://reader035.vdocuments.net/reader035/viewer/2022062422/56812ba3550346895d8fd2bf/html5/thumbnails/1.jpg)
UNIVERSIDAD INTERAMERICANADEPARTAMENTO DE MATEMÁTICAS Y CIENCIAS APLICADAS
RECINTO DE SAN GERMÁNSAN GERMÁN, PUERTO RICO
PREPARACIÓN DE DATA Y SUBSECUENTE ANÁLISIS EN INVESTIGACIÓN DE MERCADOS
Trabajo sometido como requisito parcialCurso MATH 6400
Estadística Matemática AvanzadaProfesor: Dr. Balbino García Bernal
PorÁngel M. Carreras JusinoWilfredo Daleccio Torres
Rafael A. Vega Santana 5 de mayo de 2009
![Page 2: UNIVERSIDAD INTERAMERICANA DEPARTAMENTO DE MATEMÁTICAS Y CIENCIAS APLICADAS RECINTO DE SAN GERMÁN](https://reader035.vdocuments.net/reader035/viewer/2022062422/56812ba3550346895d8fd2bf/html5/thumbnails/2.jpg)
Capítulo 15
Codificar, editar y preparar la información para análisis
![Page 3: UNIVERSIDAD INTERAMERICANA DEPARTAMENTO DE MATEMÁTICAS Y CIENCIAS APLICADAS RECINTO DE SAN GERMÁN](https://reader035.vdocuments.net/reader035/viewer/2022062422/56812ba3550346895d8fd2bf/html5/thumbnails/3.jpg)
Objetivos• Ilustrar el proceso de preparar data para el análisis
preliminar.• Demostrar el procedimiento para asegurar la
validación de la data.• Ilustrar el proceso de editar y codificar data obtenida
a través de una encuesta.• Mencionar los procedimientos de data entry.• Ilustrar el proceso para detectar errores en data
entry.• Discutir técnicas usadas para la tabulación y análisis
de data.
![Page 4: UNIVERSIDAD INTERAMERICANA DEPARTAMENTO DE MATEMÁTICAS Y CIENCIAS APLICADAS RECINTO DE SAN GERMÁN](https://reader035.vdocuments.net/reader035/viewer/2022062422/56812ba3550346895d8fd2bf/html5/thumbnails/4.jpg)
Preparación de la data para análisis
• Es el proceso de convertir información de un cuestionario de manera que pueda ser leída por una computadora.
• Este proceso está compuesto normalmente por cinco pasos.
![Page 5: UNIVERSIDAD INTERAMERICANA DEPARTAMENTO DE MATEMÁTICAS Y CIENCIAS APLICADAS RECINTO DE SAN GERMÁN](https://reader035.vdocuments.net/reader035/viewer/2022062422/56812ba3550346895d8fd2bf/html5/thumbnails/5.jpg)
Paso # 1 Validación de la data
Proceso que determina -hasta donde sea posible- si las entrevistas, encuestas u observaciones fueron conducidas correctamente y están libres de fraude o vicios.
fraude “screening” procedimiento completado cortesía
![Page 6: UNIVERSIDAD INTERAMERICANA DEPARTAMENTO DE MATEMÁTICAS Y CIENCIAS APLICADAS RECINTO DE SAN GERMÁN](https://reader035.vdocuments.net/reader035/viewer/2022062422/56812ba3550346895d8fd2bf/html5/thumbnails/6.jpg)
Paso # 2 Editar y codificar data
a) Editar – proceso mediante el cual la data cruda es verificada en busca de errores cometidos ya sea por el entrevistador o por el encuestado.Importante en este proceso, establecer que las preguntas sean hechas y contestadas en la secuencia apropiada.
![Page 7: UNIVERSIDAD INTERAMERICANA DEPARTAMENTO DE MATEMÁTICAS Y CIENCIAS APLICADAS RECINTO DE SAN GERMÁN](https://reader035.vdocuments.net/reader035/viewer/2022062422/56812ba3550346895d8fd2bf/html5/thumbnails/7.jpg)
Paso # 2 Editar y codificar data A través del escaneo manual de cada
entrevista completada, el entrevistador puede verificar ciertas áreas de interés. 1. Hacer las preguntas apropiadas2. Registrar las respuestas apropiadamente3. Hacer las preguntas de “screening apropiadas
4. Respuestas a preguntas abiertas
![Page 8: UNIVERSIDAD INTERAMERICANA DEPARTAMENTO DE MATEMÁTICAS Y CIENCIAS APLICADAS RECINTO DE SAN GERMÁN](https://reader035.vdocuments.net/reader035/viewer/2022062422/56812ba3550346895d8fd2bf/html5/thumbnails/8.jpg)
Paso # 2 Editar y codificar data
b) Codificar – agrupar y asignar valor a varias respuestas del instrumento de encuestas. Entraña la asignación de valores numéricos a cada respuesta individual para cada pregunta de la encuesta. Un cuestionario bien planificado y construido puede reducir la cantidad de tiempo destinado a codificar mientras aumenta la precisión del proceso.
![Page 9: UNIVERSIDAD INTERAMERICANA DEPARTAMENTO DE MATEMÁTICAS Y CIENCIAS APLICADAS RECINTO DE SAN GERMÁN](https://reader035.vdocuments.net/reader035/viewer/2022062422/56812ba3550346895d8fd2bf/html5/thumbnails/9.jpg)
Paso # 2 Editar y codificar data
Codificar debe estar incorporado en el diseño del cuestionario. Ejemplo de respuestas codificadas son las que dan valor del 1 al 5 según el grado de acuerdo o desacuerdo con lo preguntado. EjemploSi el cuestionario no contiene este tipo de respuestas codificadas, el investigador deberá establecer un código maestro en el que asigne valores numéricos. Ejemplo
![Page 10: UNIVERSIDAD INTERAMERICANA DEPARTAMENTO DE MATEMÁTICAS Y CIENCIAS APLICADAS RECINTO DE SAN GERMÁN](https://reader035.vdocuments.net/reader035/viewer/2022062422/56812ba3550346895d8fd2bf/html5/thumbnails/10.jpg)
Paso # 2 Editar y codificar dataLas preguntas cerradas son normalmente precodificadas al momento del diseño del cuestionario.Las preguntas abiertas no permiten una lista exacta de respuestas potenciales. El investigador puede usar un proceso de 4 pasos para desarrollar códigos para las respuestas anticipadas. 1)generar una lista 2) consolidación Ejemplo 3) asignar un valor numérico por código 4) asignar un valor codificado a cada respuesta
![Page 11: UNIVERSIDAD INTERAMERICANA DEPARTAMENTO DE MATEMÁTICAS Y CIENCIAS APLICADAS RECINTO DE SAN GERMÁN](https://reader035.vdocuments.net/reader035/viewer/2022062422/56812ba3550346895d8fd2bf/html5/thumbnails/11.jpg)
Paso # 3 Data entrySon aquellas tareas envueltas con la entrada directa de la data codificada a un programa de computadoras específico que finalmente le permitirá al analista manipular y transformar la data cruda en información útil. Hay 4 formas de entrar data codificada a una computadora.
1)a través del teclado 3)bolígrafo de luz 2)pantalla táctil 4)escaneo óptico
![Page 12: UNIVERSIDAD INTERAMERICANA DEPARTAMENTO DE MATEMÁTICAS Y CIENCIAS APLICADAS RECINTO DE SAN GERMÁN](https://reader035.vdocuments.net/reader035/viewer/2022062422/56812ba3550346895d8fd2bf/html5/thumbnails/12.jpg)
Paso # 4 Detección de error
El primer paso en la detección de error es determinar si el programa usado para data entry y tabulación le permitirá al investigador desempeñar rutinas de editar errores. Estas rutinas pueden identificar tipos de datos incorrectos.
![Page 13: UNIVERSIDAD INTERAMERICANA DEPARTAMENTO DE MATEMÁTICAS Y CIENCIAS APLICADAS RECINTO DE SAN GERMÁN](https://reader035.vdocuments.net/reader035/viewer/2022062422/56812ba3550346895d8fd2bf/html5/thumbnails/13.jpg)
Paso # 4 Detección de error
Otra forma de detección de error es que el investigador revise una representación impresa de la data entrada. Una manera adicional es producir una tabla con lista de datos en columnas.
Ejemplo
![Page 14: UNIVERSIDAD INTERAMERICANA DEPARTAMENTO DE MATEMÁTICAS Y CIENCIAS APLICADAS RECINTO DE SAN GERMÁN](https://reader035.vdocuments.net/reader035/viewer/2022062422/56812ba3550346895d8fd2bf/html5/thumbnails/14.jpg)
Paso # 5 Tabulación de data
Tabulación es el simple proceso de contar el número de observaciones (casos) que son clasificados dentro de ciertas categorías. Se usan dos formas de tabulación en los proyectos de investigación de mercadeo.
Tabulación en una direcciónTabulación cruzada
![Page 15: UNIVERSIDAD INTERAMERICANA DEPARTAMENTO DE MATEMÁTICAS Y CIENCIAS APLICADAS RECINTO DE SAN GERMÁN](https://reader035.vdocuments.net/reader035/viewer/2022062422/56812ba3550346895d8fd2bf/html5/thumbnails/15.jpg)
Paso # 5 Tabulación de data
Tabulación en una dirección – indica el número de encuestados que dieron una posible contestación a cada pregunta del cuestionario. Es la categorización de variables simples en el estudio.
Ejemplo1 2
![Page 16: UNIVERSIDAD INTERAMERICANA DEPARTAMENTO DE MATEMÁTICAS Y CIENCIAS APLICADAS RECINTO DE SAN GERMÁN](https://reader035.vdocuments.net/reader035/viewer/2022062422/56812ba3550346895d8fd2bf/html5/thumbnails/16.jpg)
Paso # 5 Tabulación de data
Tabulación cruzada – Provee categorización de los encuestados tratando dos o más variables simultáneamente. Es la principal forma de análisis de data en la mayoría de los proyectos de investigación de mercados.
Ejemplo1 2
![Page 17: UNIVERSIDAD INTERAMERICANA DEPARTAMENTO DE MATEMÁTICAS Y CIENCIAS APLICADAS RECINTO DE SAN GERMÁN](https://reader035.vdocuments.net/reader035/viewer/2022062422/56812ba3550346895d8fd2bf/html5/thumbnails/17.jpg)
Capítulo 16
Análisis de Datos
![Page 18: UNIVERSIDAD INTERAMERICANA DEPARTAMENTO DE MATEMÁTICAS Y CIENCIAS APLICADAS RECINTO DE SAN GERMÁN](https://reader035.vdocuments.net/reader035/viewer/2022062422/56812ba3550346895d8fd2bf/html5/thumbnails/18.jpg)
Objetivos
• Entender la media, mediana y moda como medidas de tendencia central.
• Entender el rango y la desviación estándar de una distribución de frecuencia como medidas de dispersión.
• Entender como graficar medidas de tendencia central.
• Entender la diferencia entre muestra independiente y muestra relacionada.
• Explicar la prueba de hipótesis y los tipos de errores.
![Page 19: UNIVERSIDAD INTERAMERICANA DEPARTAMENTO DE MATEMÁTICAS Y CIENCIAS APLICADAS RECINTO DE SAN GERMÁN](https://reader035.vdocuments.net/reader035/viewer/2022062422/56812ba3550346895d8fd2bf/html5/thumbnails/19.jpg)
El análisis y el mercado
• En el mercado a menudo se realizan encuestas de todo tipo y con diferentes propósitos.
• Los dueños de negocios y compañías o hasta incluso los gerentes se presentan con problemas en los cuales no tienen una respuesta clara que formular.
• El rol del estadístico en fundamental para el negocio y resuelve o previene situaciones.
![Page 20: UNIVERSIDAD INTERAMERICANA DEPARTAMENTO DE MATEMÁTICAS Y CIENCIAS APLICADAS RECINTO DE SAN GERMÁN](https://reader035.vdocuments.net/reader035/viewer/2022062422/56812ba3550346895d8fd2bf/html5/thumbnails/20.jpg)
El análisis y el mercado
• A continuación explicaremos varios términos importantes en el análisis de datos y su aplicación al mercado.
![Page 21: UNIVERSIDAD INTERAMERICANA DEPARTAMENTO DE MATEMÁTICAS Y CIENCIAS APLICADAS RECINTO DE SAN GERMÁN](https://reader035.vdocuments.net/reader035/viewer/2022062422/56812ba3550346895d8fd2bf/html5/thumbnails/21.jpg)
Datos utilizados
• Restaurante Deli Depot– emparedados de cortes fríos y calientes, sopas,
yogurt, galletas, café, refrescos y más.– Localizado en una zona donde hay otros
restaurantes de comida rápida.• Encuesta mediante entrevista con 17
preguntas.
![Page 22: UNIVERSIDAD INTERAMERICANA DEPARTAMENTO DE MATEMÁTICAS Y CIENCIAS APLICADAS RECINTO DE SAN GERMÁN](https://reader035.vdocuments.net/reader035/viewer/2022062422/56812ba3550346895d8fd2bf/html5/thumbnails/22.jpg)
Datos utilizados
• Los variables se clasificaron en tres categorias:– Performance Perceptions Variables (X1-X6)– Classification Variables (X7-X10)– Selection Factor Ranking (X12-X17)
Cuestionario
![Page 23: UNIVERSIDAD INTERAMERICANA DEPARTAMENTO DE MATEMÁTICAS Y CIENCIAS APLICADAS RECINTO DE SAN GERMÁN](https://reader035.vdocuments.net/reader035/viewer/2022062422/56812ba3550346895d8fd2bf/html5/thumbnails/23.jpg)
Gráficas-Ejemplos
![Page 24: UNIVERSIDAD INTERAMERICANA DEPARTAMENTO DE MATEMÁTICAS Y CIENCIAS APLICADAS RECINTO DE SAN GERMÁN](https://reader035.vdocuments.net/reader035/viewer/2022062422/56812ba3550346895d8fd2bf/html5/thumbnails/24.jpg)
Gráficas-Ejemplos
![Page 25: UNIVERSIDAD INTERAMERICANA DEPARTAMENTO DE MATEMÁTICAS Y CIENCIAS APLICADAS RECINTO DE SAN GERMÁN](https://reader035.vdocuments.net/reader035/viewer/2022062422/56812ba3550346895d8fd2bf/html5/thumbnails/25.jpg)
Gráficas-Ejemplos
![Page 26: UNIVERSIDAD INTERAMERICANA DEPARTAMENTO DE MATEMÁTICAS Y CIENCIAS APLICADAS RECINTO DE SAN GERMÁN](https://reader035.vdocuments.net/reader035/viewer/2022062422/56812ba3550346895d8fd2bf/html5/thumbnails/26.jpg)
Gráficas-Ejemplos
![Page 27: UNIVERSIDAD INTERAMERICANA DEPARTAMENTO DE MATEMÁTICAS Y CIENCIAS APLICADAS RECINTO DE SAN GERMÁN](https://reader035.vdocuments.net/reader035/viewer/2022062422/56812ba3550346895d8fd2bf/html5/thumbnails/27.jpg)
Medidas de Tendencia Central
• Las tablas de distribución de frecuencia son fáciles de leer y proveen información básica de gran importancia.
• En ocasiones cuando la cantidad de detalles es abundante y resumir los mismos es de gran utilidad para los investigadores.
• En estas situaciones la estadística descriptiva es de gran utilidad.
![Page 28: UNIVERSIDAD INTERAMERICANA DEPARTAMENTO DE MATEMÁTICAS Y CIENCIAS APLICADAS RECINTO DE SAN GERMÁN](https://reader035.vdocuments.net/reader035/viewer/2022062422/56812ba3550346895d8fd2bf/html5/thumbnails/28.jpg)
Medidas de Tendencia Central
• Media– Es el promedio de los valores en la distribución.
• Moda– Es el valor que más aparece en la distribución.
• Mediana– Es el valor del centro de la distribución cuando se
encuentra ordenada.
Ejemplo
![Page 29: UNIVERSIDAD INTERAMERICANA DEPARTAMENTO DE MATEMÁTICAS Y CIENCIAS APLICADAS RECINTO DE SAN GERMÁN](https://reader035.vdocuments.net/reader035/viewer/2022062422/56812ba3550346895d8fd2bf/html5/thumbnails/29.jpg)
Medidas de Dispersión
• En ocasiones las medidas de tendencia central no pueden mostrarte toda la información acerca de la distribución de los encuestados.
• Por ejemplo: Con la información recopilada sobre la actitud de los consumidores hacia un nuevo producto podemos calcular la moda, mediana y media sobre la distribución de las contestaciones. Pero por otra parte te gustaría saber si los demás encuestados tienen mas o menos la misma opinión que la mayoría.
• Una manera de contestar esta pregunta es usando las medidas de dispersión.
![Page 30: UNIVERSIDAD INTERAMERICANA DEPARTAMENTO DE MATEMÁTICAS Y CIENCIAS APLICADAS RECINTO DE SAN GERMÁN](https://reader035.vdocuments.net/reader035/viewer/2022062422/56812ba3550346895d8fd2bf/html5/thumbnails/30.jpg)
Medidas de Dispersión
• Rango– Distancia entre el valor menor y valor mayor en un
conjunto de respuestas.• Desviación estándar
– La distancia promedio de los valores de distribución a la media.
• Varianza– La desviación cuadrada promedio a cerca de la media de la
distribución de valores.
Ejemplo
![Page 31: UNIVERSIDAD INTERAMERICANA DEPARTAMENTO DE MATEMÁTICAS Y CIENCIAS APLICADAS RECINTO DE SAN GERMÁN](https://reader035.vdocuments.net/reader035/viewer/2022062422/56812ba3550346895d8fd2bf/html5/thumbnails/31.jpg)
Prueba de Hipótesis
• Los investigadores pueden tener algunas suposiciones o teorías sobre la información recopilada y el presenta.
• A estas teorías le llaman hipótesis.• Ejemplo
– El número promedio de tazas de café que consumen los estudiantes durante los finales es mayor al número promedio de tazas de café que consumen en cualquier otros tiempo.
![Page 32: UNIVERSIDAD INTERAMERICANA DEPARTAMENTO DE MATEMÁTICAS Y CIENCIAS APLICADAS RECINTO DE SAN GERMÁN](https://reader035.vdocuments.net/reader035/viewer/2022062422/56812ba3550346895d8fd2bf/html5/thumbnails/32.jpg)
Muestra independiente y muestra relacionada
• Muestra independiente– Ejemplo: Los resultados de los consumidores de
café varones versus féminas.• Muestra relacionada
– Ejemplo: Los investigadores comparan el número promedio de tazas de café consumida por días y el número promedio de refrescos consumido por día en varones .
![Page 33: UNIVERSIDAD INTERAMERICANA DEPARTAMENTO DE MATEMÁTICAS Y CIENCIAS APLICADAS RECINTO DE SAN GERMÁN](https://reader035.vdocuments.net/reader035/viewer/2022062422/56812ba3550346895d8fd2bf/html5/thumbnails/33.jpg)
Desarrollando la hipótesis
Ejemplo• Las hipótesis le permiten a
los investigadores hacer comparaciones entre dos grupos de encuestados y determinar si hay una importante diferencia entre ambos.
Número promedio de tazas consumidas en finales
Féminas 6.1
Varones 4.7
![Page 34: UNIVERSIDAD INTERAMERICANA DEPARTAMENTO DE MATEMÁTICAS Y CIENCIAS APLICADAS RECINTO DE SAN GERMÁN](https://reader035.vdocuments.net/reader035/viewer/2022062422/56812ba3550346895d8fd2bf/html5/thumbnails/34.jpg)
Tipos de Hipótesis
Nula Alternativa• Establece que NO hay
diferencia entre la media de cada grupo en comparación
• Establece que SI hay diferencia entre la media de cada grupo en comparación
![Page 35: UNIVERSIDAD INTERAMERICANA DEPARTAMENTO DE MATEMÁTICAS Y CIENCIAS APLICADAS RECINTO DE SAN GERMÁN](https://reader035.vdocuments.net/reader035/viewer/2022062422/56812ba3550346895d8fd2bf/html5/thumbnails/35.jpg)
Significancia Estadística
Error tipo I Error tipo II• El error hace que se rechace
la hipótesis nula cuando está es cierta; la probabilidad de alpha.
• El error falla en rechazar la hipótesis nula cuando la hipótesis alternativa es cierta; la probabilidad de beta.
Nivel de significancia
• Usualmente los investigadores en el mercado están dispuesto aceptar un nivel de siginificancia de .10, .05, .01
![Page 36: UNIVERSIDAD INTERAMERICANA DEPARTAMENTO DE MATEMÁTICAS Y CIENCIAS APLICADAS RECINTO DE SAN GERMÁN](https://reader035.vdocuments.net/reader035/viewer/2022062422/56812ba3550346895d8fd2bf/html5/thumbnails/36.jpg)
Analizando la relación de datos entre muestras
t-test z-test• Se utiliza cuando la muestra
es menor de 30 y la desviación estándar es desconocida.
• Se utiliza cuando la muestra es mayor de 30 y la desviación estándar es desconocida.
Ejemplo
![Page 37: UNIVERSIDAD INTERAMERICANA DEPARTAMENTO DE MATEMÁTICAS Y CIENCIAS APLICADAS RECINTO DE SAN GERMÁN](https://reader035.vdocuments.net/reader035/viewer/2022062422/56812ba3550346895d8fd2bf/html5/thumbnails/37.jpg)
Bibliografía utilizada
• Hair, Bush, Ortimnau (2003) “Marketing Research within a Changing Information Environment” Second Edition HF 5415. 2. H258 2003