clase 4a significancia estadística y prueba z

Hoy veremos:Hoy veremos: Que es un resultado estadísticamente Que es un resultado estadísticamente

significativo (probabilidad de ser cierto)significativo (probabilidad de ser cierto) Hipótesis Estadísticas y los diferentes Tipos Hipótesis Estadísticas y los diferentes Tipos

de Errorde Error Prueba Z (prueba de hipótesis sobre Prueba Z (prueba de hipótesis sobre

diferencias de promedios entre 2 grupos)diferencias de promedios entre 2 grupos)

Clase 4aClase 4aSignificancia Estadística Significancia Estadística y Prueba Zy Prueba Z

Dr. Carlos J. VilaltaDr. Carlos J. Vilalta

¿Qué es lo Estadísticamente ¿Qué es lo Estadísticamente Significativo?Significativo?

Concepto: Un resultado estadísticamente significativo Concepto: Un resultado estadísticamente significativo es aquel que tiene una baja probabilidad de ocurrir por es aquel que tiene una baja probabilidad de ocurrir por pura suerte (azar)pura suerte (azar)

¿De dónde viene? Cuando estudiamos una muestra, ¿De dónde viene? Cuando estudiamos una muestra, queremos saber si los resultados-valores que queremos saber si los resultados-valores que obtenemos son “correctos” o bien si se deben a la obtenemos son “correctos” o bien si se deben a la suerte o azarsuerte o azar

Por lo tanto… Por lo tanto… cuanto más estadísticamente cuanto más estadísticamente significativosignificativo sea un resultado, más seguridad tenemos sea un resultado, más seguridad tenemos de que ese resultado de que ese resultado no se deba al azarno se deba al azar y de que y de que sea sea correcto.correcto.

Hay Niveles de Confianza sobre Hay Niveles de Confianza sobre lo que E. S. lo que E. S.

Nivel de Nivel de confianzaconfianza

Un valor menor de p Un valor menor de p (prob. de error) (prob. de error) significa que…significa que…

¿Azar? ¿Qué ¿Azar? ¿Qué significa ese significa ese resultado?resultado?

90%90% El resultado es confiable El resultado es confiable con un 10% de error con un 10% de error

(p < .10)(p < .10)

Tiene una probabilidad de Tiene una probabilidad de deberse al azar menor al deberse al azar menor al

10%10%

95%95% El resultado es confiable El resultado es confiable con un 5% de error con un 5% de error

(p < .05)(p < .05)


5%5%

99%99% El resultado es confiable El resultado es confiable con un 1% de errorcon un 1% de error

(p < .01)(p < .01)


1%1%

La lógica de lo estadísticamente La lógica de lo estadísticamente significativosignificativo

Ejemplo:Ejemplo: ¿Los que estudian para un examen sacan mejores ¿Los que estudian para un examen sacan mejores

calificaciones?calificaciones? 2 grupos: Estudian (E) y No Estudian (NE)2 grupos: Estudian (E) y No Estudian (NE) Sobre los resultados, queremos un nivel de Sobre los resultados, queremos un nivel de

significancia estadística (p < .05), o bien un nivel de significancia estadística (p < .05), o bien un nivel de confianza del 95%.confianza del 95%.

Resultados posibles:Resultados posibles:1.1. Estudian y sacan mejores calificaciones (p = .33)Estudian y sacan mejores calificaciones (p = .33)2.2. Estudian y sacan las mismas calificaciones (p = .33)Estudian y sacan las mismas calificaciones (p = .33)3.3. Estudian y sacan peores calificaciones (p = .33)Estudian y sacan peores calificaciones (p = .33)

Lógica E. S. = ProbabilidadesLógica E. S. = Probabilidades

Nota probabilística: La probabilidad de que cada uno de los Nota probabilística: La probabilidad de que cada uno de los resultados anteriores suceda por puro azar es del 33% (.33)resultados anteriores suceda por puro azar es del 33% (.33)

Resultados del Análisis: Analizamos 4 casos en cada Resultados del Análisis: Analizamos 4 casos en cada grupo y observamos que los 4 miembros del grupo “E” grupo y observamos que los 4 miembros del grupo “E” efectivamente sacaron mejores calificaciones que todos efectivamente sacaron mejores calificaciones que todos los del grupo “NE”los del grupo “NE”

La probabilidad de que el resultado anterior se deba al La probabilidad de que el resultado anterior se deba al “azar” es:“azar” es:(.33) * (.33) * (.33) *(.33) = .0119 = .012 (o 12%)(.33) * (.33) * (.33) *(.33) = .0119 = .012 (o 12%)

Es decir, Es decir, p = .012p = .012

Estadísticamente significativoEstadísticamente significativo

Conclusión:Conclusión: Ya que ese valor del .012 es menor a .05 predefinido del Ya que ese valor del .012 es menor a .05 predefinido del

nivel de significancia (p < .05), entonces el resultado nivel de significancia (p < .05), entonces el resultado sí sí es estadísticamente significativoes estadísticamente significativo. .

Podemos concluir que Podemos concluir que los estudiantes que estudiaronlos estudiantes que estudiaron efectivamente efectivamente sí sacaron una mejor calificaciónsí sacaron una mejor calificación (es muy (es muy poco probable que se deba al azar) poco probable que se deba al azar)

Preguntas:Preguntas: ¿Podría concluir lo mismo con un nivel de significancia ¿Podría concluir lo mismo con un nivel de significancia

estadística (probabilidad de error) del 10%? ¿(p < .10)?estadística (probabilidad de error) del 10%? ¿(p < .10)? ¿Podría concluir lo mismo con un nivel de significancia ¿Podría concluir lo mismo con un nivel de significancia

estadística (probabilidad de error) del 1%? ¿p < .01)?estadística (probabilidad de error) del 1%? ¿p < .01)?

Como interpretar lo E. S.Como interpretar lo E. S.Cómo si verlo: Cómo si verlo: Como un nivel de confianzaComo un nivel de confianza que tenemos de que que tenemos de que

ese resultado inferido a partir de una muestra sea ese resultado inferido a partir de una muestra sea correcto. Un resultado azaroso es incorrecto.correcto. Un resultado azaroso es incorrecto.

Cómo no verlo: Cómo no verlo: Una cosa es que una relación entre variables sea Una cosa es que una relación entre variables sea

estadísticamente significativa (o altamente estadísticamente significativa (o altamente probable), y otra es la magnitud o la importancia de probable), y otra es la magnitud o la importancia de esa relación. “Estadísticamente significativo” e esa relación. “Estadísticamente significativo” e “Importancia” son aspectos independientes en el “Importancia” son aspectos independientes en el análisis.análisis.

Repaso de Pruebas de hipótesisRepaso de Pruebas de hipótesis

Hipótesis: Una relación entre 2 variablesHipótesis: Una relación entre 2 variables

Prueba de hipótesis: Prueba de hipótesis: Procedimiento estadístico para poder aceptar Procedimiento estadístico para poder aceptar

o rechazar la existencia de esa relacióno rechazar la existencia de esa relación

Historia:Historia: Fisher desarrolló este procedimiento llamado Fisher desarrolló este procedimiento llamado

“Prueba de la Hipótesis Nula” o (Ho)…“Prueba de la Hipótesis Nula” o (Ho)…

Las pruebas de hipótesisLas pruebas de hipótesis

¿Cómo lo hizo y cuál fue la lógica?¿Cómo lo hizo y cuál fue la lógica?1.1. Quería comparar las características de 2 grupos y Quería comparar las características de 2 grupos y

saber con certeza (estimando el azar) si eran saber con certeza (estimando el azar) si eran similares o diferentessimilares o diferentes

2.2. Primero definió una muestra y obtuvo un valor (la Primero definió una muestra y obtuvo un valor (la media) de la variable bajo estudio para cada uno de media) de la variable bajo estudio para cada uno de los gruposlos grupos

3.3. Definió de manera artificial lo que es la Ho.Definió de manera artificial lo que es la Ho.

Ho = Los grupos no son diferentesHo = Los grupos no son diferentesHa = Los grupos sí son diferentesHa = Los grupos sí son diferentes

Lógica de la prueba de hipótesisLógica de la prueba de hipótesis

Para poder concluir que los Para poder concluir que los grupos no grupos no son diferentesson diferentes (no rechazar Ho) se (no rechazar Ho) se requiere que las requiere que las mediasmedias de cada grupo de cada grupo sean sean muy similaresmuy similares (cercanas). (cercanas).

Y viceversa, para poder concluir que los Y viceversa, para poder concluir que los grupos sí son diferentesgrupos sí son diferentes (rechazar Ho) (rechazar Ho) se requiere que las se requiere que las mediasmedias de cada de cada grupo sean grupo sean muy diferentesmuy diferentes

Tipos de errores en las pruebas Tipos de errores en las pruebas de hipótesisde hipótesis

Realidad: Realidad:

(son iguales)(son iguales)

Ho es verdaderaHo es verdadera

Realidad: Realidad:

(son diferentes)(son diferentes)

Ha es verdaderaHa es verdadera

Decides: Decides: Rechazar Ho Rechazar Ho (decir que son (decir que son

diferentes)diferentes)

Error del Tipo I =Error del Tipo I =

Decir que son Decir que son diferentes cuando diferentes cuando

no lo sonno lo son

No hay errorNo hay error

Decides:Decides:

No rechazar Ho No rechazar Ho

(decir que son (decir que son iguales)iguales)

No hay errorNo hay error Error del Tipo II =Error del Tipo II =

Decir que son Decir que son iguales cuando no iguales cuando no

lo sonlo son

En Síntesis:En Síntesis:La relación entre prueba de hipótesis y La relación entre prueba de hipótesis y

resultados estadísticamente resultados estadísticamente significativos es que...significativos es que...

Aceptar o rechazar una hipótesis depende Aceptar o rechazar una hipótesis depende de una probabilidadde una probabilidad. Para probar una . Para probar una hipótesis siempre se define un nivel de hipótesis siempre se define un nivel de significancia estadística (.10, .05 o .01) o significancia estadística (.10, .05 o .01) o probabilidad de error.probabilidad de error.

Prueba ZPrueba ZEs una técnica para la prueba de Es una técnica para la prueba de hipótesishipótesisObjetivo: Saber si hay una diferencia Objetivo: Saber si hay una diferencia entre las medias de 2 grupos entre las medias de 2 grupos Se puede utilizar para:Se puede utilizar para: Variables Continuas: Utilizar fórmula de Variables Continuas: Utilizar fórmula de

valores absolutosvalores absolutos Variables dicotómicas (nominales con 2 Variables dicotómicas (nominales con 2

opciones): Utilizar fórmula con opciones): Utilizar fórmula con porcentajesporcentajes

Las diferencias entre las Medias de 2 Las diferencias entre las Medias de 2 Grupos pueden convertirse en valores ZGrupos pueden convertirse en valores Z

A través de la siguiente fórmula:A través de la siguiente fórmula:

Error Estándar: Medida de dispersión para un grupo de Medias de muchas muestras y que siguen un comportamiento normal teórico

Valores Z = numero de errores estándar desde la media de la muestra a la media del universo (o media real)

n

XZ

Error Estándar

Dif. de Medias

Curva normal + niveles de Curva normal + niveles de confianza + valores de Zconfianza + valores de Z

Rechazar Ho

Rechazar Ho

Aceptar Ho

Nivel de Nivel de ConfianzaConfianza

Valor Valor Crítico Crítico

(VC)(VC)

Si Z > VCSi Z > VC

90%90% +/- +/- 1.641.64 Rechazar Rechazar HoHo



Ejemplo de Prueba Z: VD continuaEjemplo de Prueba Z: VD continua

1.1. Alguien dice que la edad media de los Alguien dice que la edad media de los votantes del PT es de 29 años.votantes del PT es de 29 años.

2.2. A partir de una muestra (n = 100) A partir de una muestra (n = 100) descubrimos que el promedio de edad de descubrimos que el promedio de edad de los votantes del PT es de 32 años y la los votantes del PT es de 32 años y la Desv. Estándar es de 5 añosDesv. Estándar es de 5 años

3.3. Pregunta: ¿Es 32 años estadísticamente Pregunta: ¿Es 32 años estadísticamente diferente de 29 años? Podría ser que diferente de 29 años? Podría ser que nuestro resultado se debe al azar..nuestro resultado se debe al azar..

4.4. Formular hipótesis: Formular hipótesis: Ho: Ho: = 29 años = 29 añosHa: Ha: ≠≠ 29 años 29 años


4. Asignamos un nivel de significancia estadística 4. Asignamos un nivel de significancia estadística del .05 (p < .05). Es decir, un nivel de confianza del .05 (p < .05). Es decir, un nivel de confianza del 95% (área bajo la curva normal de +/- 1.96). del 95% (área bajo la curva normal de +/- 1.96).

5. Sentido de la prueba:5. Sentido de la prueba:

Si Si Z < a +/- 1.96Z < a +/- 1.96, entonces , entonces aceptamos Hoaceptamos Ho; La ; La media de la población sí es de 29 añosmedia de la población sí es de 29 años

Si Si Z > a +/- 1.96Z > a +/- 1.96 (menor de –1.96, ej. –1.97), (menor de –1.96, ej. –1.97), entonces entonces aceptamos Haaceptamos Ha; La media de la ; La media de la población sí es diferente a 29 añospoblación sí es diferente a 29 años


Prueba:Prueba: Media de nuestra muestraMedia de nuestra muestra = 32 años= 32 años Media a prueba de Ho (Media a prueba de Ho ( = 29 años = 29 años Desviación Estándar (Desviación Estándar () = 5 años) = 5 años n = 100n = 100

Es igual a:Es igual a: Z = Z = 32 – 2932 – 29 = = 33

= 6= 6 5/√100 0.55/√100 0.5 n

XZ


Conclusión:Conclusión:

Ya que 6 > 1.96, Ya que 6 > 1.96, rechazamos Horechazamos Ho

Esto es, con base en nuestra estudio, no podemos Esto es, con base en nuestra estudio, no podemos aceptar que la edad promedio de los votantes del PT aceptar que la edad promedio de los votantes del PT sea de 29 años. sea de 29 años. Es poco probable que esta Es poco probable que esta diferencia entre 29 y 32 se deba al azardiferencia entre 29 y 32 se deba al azar..

Lo anterior lo hacemos con un nivel de confianza del Lo anterior lo hacemos con un nivel de confianza del 95%95%

Prueba Z: VD dicotómicaPrueba Z: VD dicotómica

Es una técnica para la prueba de Es una técnica para la prueba de hipótesis estadísticashipótesis estadísticas

Objetivo: Saber si hay una diferencia Objetivo: Saber si hay una diferencia entre los porcentajes (de una variable) entre los porcentajes (de una variable) de 2 grupos o muestrasde 2 grupos o muestras

Hipótesis y Fórmula Z para VD Hipótesis y Fórmula Z para VD dicotómicadicotómica

HHoo: p = : p =

HHaa: p ≠ : p ≠ Si Z > V.C.Si Z > V.C. entonces rechazar entonces rechazar Ho: Los porcentajes son diferentesHo: Los porcentajes son diferentes

Hipótesis:Hipótesis:

Fórmula:Fórmula:ZZ = =

Donde:

p = Porcentaje Muestral (1 - p) = q = Inverso = Porcentaje hipotéticon = Tamaño de la muestra

npp

pZ

/)1(*

Ejemplo prueba Z: VD DicotómicaEjemplo prueba Z: VD Dicotómica• Caso:

En un examen de admisión a la universidad pasaron el 52% (.52) de los candidatos de cierta preparatoria. De todas las preparatorias sólo pasaron el 50% (.50). El director de esa escuela ve que su 52% es mayor al 50% del resto, y hace la hipótesis de que sus alumnos son mejores que el resto.

• Preguntas:¿Es la diferencia entre 52% y 50% lo suficientemente grande como para concluir una diferencia estadísticamente significativa?

Ejemplo de Prueba Z: VD Ejemplo de Prueba Z: VD dicotómicadicotómica

Datos: p = .50 (porcentaje de la muestra) = .52 (porcentaje a prueba) n = 85 Nivel de confianza del 95%; V.C. de +/-1.96

Hipótesis

Ho: p = Ho: p = .52 = .50.52 = .50

Ha: p ≠ Ha: p ≠ .52 ≠ .50.52 ≠ .50

Si Z > +/- 1.96 entonces rechazar Ho

O… si son diferentes; si son mejores estudiantes

Ejemplo de Prueba Z: VD Ejemplo de Prueba Z: VD dicotómicadicotómica

npp

pZ

/)1(*

CálculoCálculo

Ya que - .37 se encuentra entre +/- 1.96 Ya que - .37 se encuentra entre +/- 1.96 Aceptamos Ho; son % igualesAceptamos Ho; son % iguales

Con un 95% de nivel de confianza podemos concluir que Con un 95% de nivel de confianza podemos concluir que no hay una diferencia significativano hay una diferencia significativa entre los estudiantes entre los estudiantes de esa prepa y los demás estudiantesde esa prepa y los demás estudiantes

Ni hablar… así son los posgrados y Ni hablar… así son los posgrados y sólo vamos empezando sólo vamos empezando

Que sigue:Que sigue: Vámonos al breakVámonos al break Seguimos con otra técnica para la prueba de Seguimos con otra técnica para la prueba de

hipótesis: Ji Cuadradahipótesis: Ji Cuadrada

clase 4a significancia estadística y prueba z

Documents