clase 4a significancia estadística y prueba z
DESCRIPTION
Clase 4a Significancia Estadística y Prueba Z. Hoy veremos: Que es un resultado estadísticamente significativo (probabilidad de ser cierto) Hipótesis Estadísticas y los diferentes Tipos de Error Prueba Z (prueba de hipótesis sobre diferencias de promedios entre 2 grupos). - PowerPoint PPT PresentationTRANSCRIPT
Hoy veremos:Hoy veremos: Que es un resultado estadísticamente Que es un resultado estadísticamente
significativo (probabilidad de ser cierto)significativo (probabilidad de ser cierto) Hipótesis Estadísticas y los diferentes Tipos Hipótesis Estadísticas y los diferentes Tipos
de Errorde Error Prueba Z (prueba de hipótesis sobre Prueba Z (prueba de hipótesis sobre
diferencias de promedios entre 2 grupos)diferencias de promedios entre 2 grupos)
Clase 4aClase 4aSignificancia Estadística Significancia Estadística y Prueba Zy Prueba Z
Dr. Carlos J. VilaltaDr. Carlos J. Vilalta
¿Qué es lo Estadísticamente ¿Qué es lo Estadísticamente Significativo?Significativo?
Concepto: Un resultado estadísticamente significativo Concepto: Un resultado estadísticamente significativo es aquel que tiene una baja probabilidad de ocurrir por es aquel que tiene una baja probabilidad de ocurrir por pura suerte (azar)pura suerte (azar)
¿De dónde viene? Cuando estudiamos una muestra, ¿De dónde viene? Cuando estudiamos una muestra, queremos saber si los resultados-valores que queremos saber si los resultados-valores que obtenemos son “correctos” o bien si se deben a la obtenemos son “correctos” o bien si se deben a la suerte o azarsuerte o azar
Por lo tanto… Por lo tanto… cuanto más estadísticamente cuanto más estadísticamente significativosignificativo sea un resultado, más seguridad tenemos sea un resultado, más seguridad tenemos de que ese resultado de que ese resultado no se deba al azarno se deba al azar y de que y de que sea sea correcto.correcto.
Hay Niveles de Confianza sobre Hay Niveles de Confianza sobre lo que E. S. lo que E. S.
Nivel de Nivel de confianzaconfianza
Un valor menor de p Un valor menor de p (prob. de error) (prob. de error) significa que…significa que…
¿Azar? ¿Qué ¿Azar? ¿Qué significa ese significa ese resultado?resultado?
90%90% El resultado es confiable El resultado es confiable con un 10% de error con un 10% de error
(p < .10)(p < .10)
Tiene una probabilidad de Tiene una probabilidad de deberse al azar menor al deberse al azar menor al
10%10%
95%95% El resultado es confiable El resultado es confiable con un 5% de error con un 5% de error
(p < .05)(p < .05)
Tiene una probabilidad de Tiene una probabilidad de deberse al azar menor al deberse al azar menor al
5%5%
99%99% El resultado es confiable El resultado es confiable con un 1% de errorcon un 1% de error
(p < .01)(p < .01)
Tiene una probabilidad de Tiene una probabilidad de deberse al azar menor al deberse al azar menor al
1%1%
La lógica de lo estadísticamente La lógica de lo estadísticamente significativosignificativo
Ejemplo:Ejemplo: ¿Los que estudian para un examen sacan mejores ¿Los que estudian para un examen sacan mejores
calificaciones?calificaciones? 2 grupos: Estudian (E) y No Estudian (NE)2 grupos: Estudian (E) y No Estudian (NE) Sobre los resultados, queremos un nivel de Sobre los resultados, queremos un nivel de
significancia estadística (p < .05), o bien un nivel de significancia estadística (p < .05), o bien un nivel de confianza del 95%.confianza del 95%.
Resultados posibles:Resultados posibles:1.1. Estudian y sacan mejores calificaciones (p = .33)Estudian y sacan mejores calificaciones (p = .33)2.2. Estudian y sacan las mismas calificaciones (p = .33)Estudian y sacan las mismas calificaciones (p = .33)3.3. Estudian y sacan peores calificaciones (p = .33)Estudian y sacan peores calificaciones (p = .33)
Lógica E. S. = ProbabilidadesLógica E. S. = Probabilidades
Nota probabilística: La probabilidad de que cada uno de los Nota probabilística: La probabilidad de que cada uno de los resultados anteriores suceda por puro azar es del 33% (.33)resultados anteriores suceda por puro azar es del 33% (.33)
Resultados del Análisis: Analizamos 4 casos en cada Resultados del Análisis: Analizamos 4 casos en cada grupo y observamos que los 4 miembros del grupo “E” grupo y observamos que los 4 miembros del grupo “E” efectivamente sacaron mejores calificaciones que todos efectivamente sacaron mejores calificaciones que todos los del grupo “NE”los del grupo “NE”
La probabilidad de que el resultado anterior se deba al La probabilidad de que el resultado anterior se deba al “azar” es:“azar” es:(.33) * (.33) * (.33) *(.33) = .0119 = .012 (o 12%)(.33) * (.33) * (.33) *(.33) = .0119 = .012 (o 12%)
Es decir, Es decir, p = .012p = .012
Estadísticamente significativoEstadísticamente significativo
Conclusión:Conclusión: Ya que ese valor del .012 es menor a .05 predefinido del Ya que ese valor del .012 es menor a .05 predefinido del
nivel de significancia (p < .05), entonces el resultado nivel de significancia (p < .05), entonces el resultado sí sí es estadísticamente significativoes estadísticamente significativo. .
Podemos concluir que Podemos concluir que los estudiantes que estudiaronlos estudiantes que estudiaron efectivamente efectivamente sí sacaron una mejor calificaciónsí sacaron una mejor calificación (es muy (es muy poco probable que se deba al azar) poco probable que se deba al azar)
Preguntas:Preguntas: ¿Podría concluir lo mismo con un nivel de significancia ¿Podría concluir lo mismo con un nivel de significancia
estadística (probabilidad de error) del 10%? ¿(p < .10)?estadística (probabilidad de error) del 10%? ¿(p < .10)? ¿Podría concluir lo mismo con un nivel de significancia ¿Podría concluir lo mismo con un nivel de significancia
estadística (probabilidad de error) del 1%? ¿p < .01)?estadística (probabilidad de error) del 1%? ¿p < .01)?
Como interpretar lo E. S.Como interpretar lo E. S.Cómo si verlo: Cómo si verlo: Como un nivel de confianzaComo un nivel de confianza que tenemos de que que tenemos de que
ese resultado inferido a partir de una muestra sea ese resultado inferido a partir de una muestra sea correcto. Un resultado azaroso es incorrecto.correcto. Un resultado azaroso es incorrecto.
Cómo no verlo: Cómo no verlo: Una cosa es que una relación entre variables sea Una cosa es que una relación entre variables sea
estadísticamente significativa (o altamente estadísticamente significativa (o altamente probable), y otra es la magnitud o la importancia de probable), y otra es la magnitud o la importancia de esa relación. “Estadísticamente significativo” e esa relación. “Estadísticamente significativo” e “Importancia” son aspectos independientes en el “Importancia” son aspectos independientes en el análisis.análisis.
Repaso de Pruebas de hipótesisRepaso de Pruebas de hipótesis
Hipótesis: Una relación entre 2 variablesHipótesis: Una relación entre 2 variables
Prueba de hipótesis: Prueba de hipótesis: Procedimiento estadístico para poder aceptar Procedimiento estadístico para poder aceptar
o rechazar la existencia de esa relacióno rechazar la existencia de esa relación
Historia:Historia: Fisher desarrolló este procedimiento llamado Fisher desarrolló este procedimiento llamado
“Prueba de la Hipótesis Nula” o (Ho)…“Prueba de la Hipótesis Nula” o (Ho)…
Las pruebas de hipótesisLas pruebas de hipótesis
¿Cómo lo hizo y cuál fue la lógica?¿Cómo lo hizo y cuál fue la lógica?1.1. Quería comparar las características de 2 grupos y Quería comparar las características de 2 grupos y
saber con certeza (estimando el azar) si eran saber con certeza (estimando el azar) si eran similares o diferentessimilares o diferentes
2.2. Primero definió una muestra y obtuvo un valor (la Primero definió una muestra y obtuvo un valor (la media) de la variable bajo estudio para cada uno de media) de la variable bajo estudio para cada uno de los gruposlos grupos
3.3. Definió de manera artificial lo que es la Ho.Definió de manera artificial lo que es la Ho.
Ho = Los grupos no son diferentesHo = Los grupos no son diferentesHa = Los grupos sí son diferentesHa = Los grupos sí son diferentes
Lógica de la prueba de hipótesisLógica de la prueba de hipótesis
Para poder concluir que los Para poder concluir que los grupos no grupos no son diferentesson diferentes (no rechazar Ho) se (no rechazar Ho) se requiere que las requiere que las mediasmedias de cada grupo de cada grupo sean sean muy similaresmuy similares (cercanas). (cercanas).
Y viceversa, para poder concluir que los Y viceversa, para poder concluir que los grupos sí son diferentesgrupos sí son diferentes (rechazar Ho) (rechazar Ho) se requiere que las se requiere que las mediasmedias de cada de cada grupo sean grupo sean muy diferentesmuy diferentes
Tipos de errores en las pruebas Tipos de errores en las pruebas de hipótesisde hipótesis
Realidad: Realidad:
(son iguales)(son iguales)
Ho es verdaderaHo es verdadera
Realidad: Realidad:
(son diferentes)(son diferentes)
Ha es verdaderaHa es verdadera
Decides: Decides: Rechazar Ho Rechazar Ho (decir que son (decir que son
diferentes)diferentes)
Error del Tipo I =Error del Tipo I =
Decir que son Decir que son diferentes cuando diferentes cuando
no lo sonno lo son
No hay errorNo hay error
Decides:Decides:
No rechazar Ho No rechazar Ho
(decir que son (decir que son iguales)iguales)
No hay errorNo hay error Error del Tipo II =Error del Tipo II =
Decir que son Decir que son iguales cuando no iguales cuando no
lo sonlo son
En Síntesis:En Síntesis:La relación entre prueba de hipótesis y La relación entre prueba de hipótesis y
resultados estadísticamente resultados estadísticamente significativos es que...significativos es que...
Aceptar o rechazar una hipótesis depende Aceptar o rechazar una hipótesis depende de una probabilidadde una probabilidad. Para probar una . Para probar una hipótesis siempre se define un nivel de hipótesis siempre se define un nivel de significancia estadística (.10, .05 o .01) o significancia estadística (.10, .05 o .01) o probabilidad de error.probabilidad de error.
Prueba ZPrueba ZEs una técnica para la prueba de Es una técnica para la prueba de hipótesishipótesisObjetivo: Saber si hay una diferencia Objetivo: Saber si hay una diferencia entre las medias de 2 grupos entre las medias de 2 grupos Se puede utilizar para:Se puede utilizar para: Variables Continuas: Utilizar fórmula de Variables Continuas: Utilizar fórmula de
valores absolutosvalores absolutos Variables dicotómicas (nominales con 2 Variables dicotómicas (nominales con 2
opciones): Utilizar fórmula con opciones): Utilizar fórmula con porcentajesporcentajes
Las diferencias entre las Medias de 2 Las diferencias entre las Medias de 2 Grupos pueden convertirse en valores ZGrupos pueden convertirse en valores Z
A través de la siguiente fórmula:A través de la siguiente fórmula:
Error Estándar: Medida de dispersión para un grupo de Medias de muchas muestras y que siguen un comportamiento normal teórico
Valores Z = numero de errores estándar desde la media de la muestra a la media del universo (o media real)
n
XZ
Error Estándar
Dif. de Medias
Curva normal + niveles de Curva normal + niveles de confianza + valores de Zconfianza + valores de Z
Rechazar Ho
Rechazar Ho
Aceptar Ho
Nivel de Nivel de ConfianzaConfianza
Valor Valor Crítico Crítico
(VC)(VC)
Si Z > VCSi Z > VC
90%90% +/- +/- 1.641.64 Rechazar Rechazar HoHo
95%95% +/- +/- 1.961.96 Rechazar Rechazar HoHo
99%99% +/- +/- 2.582.58 Rechazar Rechazar HoHo
Ejemplo de Prueba Z: VD continuaEjemplo de Prueba Z: VD continua
1.1. Alguien dice que la edad media de los Alguien dice que la edad media de los votantes del PT es de 29 años.votantes del PT es de 29 años.
2.2. A partir de una muestra (n = 100) A partir de una muestra (n = 100) descubrimos que el promedio de edad de descubrimos que el promedio de edad de los votantes del PT es de 32 años y la los votantes del PT es de 32 años y la Desv. Estándar es de 5 añosDesv. Estándar es de 5 años
3.3. Pregunta: ¿Es 32 años estadísticamente Pregunta: ¿Es 32 años estadísticamente diferente de 29 años? Podría ser que diferente de 29 años? Podría ser que nuestro resultado se debe al azar..nuestro resultado se debe al azar..
4.4. Formular hipótesis: Formular hipótesis: Ho: Ho: = 29 años = 29 añosHa: Ha: ≠≠ 29 años 29 años
Ejemplo de Prueba Z: VD continuaEjemplo de Prueba Z: VD continua
4. Asignamos un nivel de significancia estadística 4. Asignamos un nivel de significancia estadística del .05 (p < .05). Es decir, un nivel de confianza del .05 (p < .05). Es decir, un nivel de confianza del 95% (área bajo la curva normal de +/- 1.96). del 95% (área bajo la curva normal de +/- 1.96).
5. Sentido de la prueba:5. Sentido de la prueba:
Si Si Z < a +/- 1.96Z < a +/- 1.96, entonces , entonces aceptamos Hoaceptamos Ho; La ; La media de la población sí es de 29 añosmedia de la población sí es de 29 años
Si Si Z > a +/- 1.96Z > a +/- 1.96 (menor de –1.96, ej. –1.97), (menor de –1.96, ej. –1.97), entonces entonces aceptamos Haaceptamos Ha; La media de la ; La media de la población sí es diferente a 29 añospoblación sí es diferente a 29 años
Ejemplo de Prueba Z: VD continuaEjemplo de Prueba Z: VD continua
Prueba:Prueba: Media de nuestra muestraMedia de nuestra muestra = 32 años= 32 años Media a prueba de Ho (Media a prueba de Ho ( = 29 años = 29 años Desviación Estándar (Desviación Estándar () = 5 años) = 5 años n = 100n = 100
Es igual a:Es igual a: Z = Z = 32 – 2932 – 29 = = 33
= 6= 6 5/√100 0.55/√100 0.5 n
XZ
Ejemplo de Prueba Z: VD continuaEjemplo de Prueba Z: VD continua
Conclusión:Conclusión:
Ya que 6 > 1.96, Ya que 6 > 1.96, rechazamos Horechazamos Ho
Esto es, con base en nuestra estudio, no podemos Esto es, con base en nuestra estudio, no podemos aceptar que la edad promedio de los votantes del PT aceptar que la edad promedio de los votantes del PT sea de 29 años. sea de 29 años. Es poco probable que esta Es poco probable que esta diferencia entre 29 y 32 se deba al azardiferencia entre 29 y 32 se deba al azar..
Lo anterior lo hacemos con un nivel de confianza del Lo anterior lo hacemos con un nivel de confianza del 95%95%
Prueba Z: VD dicotómicaPrueba Z: VD dicotómica
Es una técnica para la prueba de Es una técnica para la prueba de hipótesis estadísticashipótesis estadísticas
Objetivo: Saber si hay una diferencia Objetivo: Saber si hay una diferencia entre los porcentajes (de una variable) entre los porcentajes (de una variable) de 2 grupos o muestrasde 2 grupos o muestras
Hipótesis y Fórmula Z para VD Hipótesis y Fórmula Z para VD dicotómicadicotómica
HHoo: p = : p =
HHaa: p ≠ : p ≠ Si Z > V.C.Si Z > V.C. entonces rechazar entonces rechazar Ho: Los porcentajes son diferentesHo: Los porcentajes son diferentes
Hipótesis:Hipótesis:
Fórmula:Fórmula:ZZ = =
Donde:
p = Porcentaje Muestral (1 - p) = q = Inverso = Porcentaje hipotéticon = Tamaño de la muestra
npp
pZ
/)1(*
Ejemplo prueba Z: VD DicotómicaEjemplo prueba Z: VD Dicotómica• Caso:
En un examen de admisión a la universidad pasaron el 52% (.52) de los candidatos de cierta preparatoria. De todas las preparatorias sólo pasaron el 50% (.50). El director de esa escuela ve que su 52% es mayor al 50% del resto, y hace la hipótesis de que sus alumnos son mejores que el resto.
• Preguntas:¿Es la diferencia entre 52% y 50% lo suficientemente grande como para concluir una diferencia estadísticamente significativa?
Ejemplo de Prueba Z: VD Ejemplo de Prueba Z: VD dicotómicadicotómica
Datos: p = .50 (porcentaje de la muestra) = .52 (porcentaje a prueba) n = 85 Nivel de confianza del 95%; V.C. de +/-1.96
Hipótesis
Ho: p = Ho: p = .52 = .50.52 = .50
Ha: p ≠ Ha: p ≠ .52 ≠ .50.52 ≠ .50
Si Z > +/- 1.96 entonces rechazar Ho
O… si son diferentes; si son mejores estudiantes
Ejemplo de Prueba Z: VD Ejemplo de Prueba Z: VD dicotómicadicotómica
npp
pZ
/)1(*
CálculoCálculo
Ya que - .37 se encuentra entre +/- 1.96 Ya que - .37 se encuentra entre +/- 1.96 Aceptamos Ho; son % igualesAceptamos Ho; son % iguales
Con un 95% de nivel de confianza podemos concluir que Con un 95% de nivel de confianza podemos concluir que no hay una diferencia significativano hay una diferencia significativa entre los estudiantes entre los estudiantes de esa prepa y los demás estudiantesde esa prepa y los demás estudiantes
Ni hablar… así son los posgrados y Ni hablar… así son los posgrados y sólo vamos empezando sólo vamos empezando
Que sigue:Que sigue: Vámonos al breakVámonos al break Seguimos con otra técnica para la prueba de Seguimos con otra técnica para la prueba de
hipótesis: Ji Cuadradahipótesis: Ji Cuadrada