semana 04-prueba chicuadrado
DESCRIPTION
CHI CUADRADOTRANSCRIPT
-
Lic. Segundo A. Garca Flores
ESTADSTICA PARA NEGOCIOS II
Mdulo: II Unidad: II Semana: 04
-
TTULO DEL TEMA
PRUEBA NO PARAMTRICAS
-
ORIENTACIONES
Lea las previamente las orientaciones
generales del curso.
Revise los temas afines a este en la
Biblioteca Virtual de la UAP
Participe de los foros
-
Chi cuadrado
Caracterstica de la chi cuadrado
Hiptesis
CONTENIDOS TEMTICOS
-
DESARROLLO DE CONTENIDOS - SUBTTULOS
DEL TEMA
-
Test de hiptesis
Paramtricos: hiptesis sobre los
parmetros que definen la poblacin
(por ej., pobl. Normales, y tests sobre
la media o la desv. tpica).
No paramtricos: no se refieren a
parmetros de la poblacin; se
aplican tpicamente cuando no
conocemos la distribucin de la
poblacin, o cuando su distribucin
es no normal.
-
7 Para realizar anlisis no paramtricos, debe partirse de las siguientes
consideraciones:
La mayora de estos anlisis no requieren de supuestos acerca de la
forma de la distribucin poblacional. Aceptan distribuciones no
normales.
Las variables no necesariamente deben estar medidas en un nivel por
intervalo o de razn, pueden analizar datos nominales u ordinales.
Si se quieren aplicar anlisis no paramtrica a datos por intervalos o
razn, stos deben ser resumidos a categoras discretas (a unas
cuantas). Las variables deben ser categoras.
CULES SON LAS SUPOSICIONES DE LA
ESTADSTICA NO PARAMTRICA?
-
81) La Chi-cuadrada o Ji-Cuadrada o X2.
2) Los coeficientes de correlacin e independencia
para tabulaciones cruzadas.
3) Los coeficientes de correlacin por rangos
ordenados de Spearman y Kendall.
4) Prueba de U de Mann Whitney
5) Pruebas W de Wilcoxon
CULES SON LOS MTODOS O PRUEBAS
ESTADSTICAS NO PARAMTRICAS MS UTILIZADAS?
Las Pruebas no paramtricas ms utilizadas son:
-
Distribucin Ji-Cuadrada o Chi-cuadrada o X2
-
10
Es una prueba til para variables categricas y
estadstica, es aplicable cuando la variable nominal est
compuesto por dos o ms categoras. Tiene dos
aplicaciones:
1. La prueba de bondad de ajuste Chi-cuadrada.
2. La prueba Chi-cuadrada de asociacin.
3. Prueba de homogeneidad
Distribucin Ji-Cuadrada o Chi-cuadrada o X2
-
11
Distribucin Ji-Cuadrada o Chi-cuadrada o X2
-
Es una prueba estadstica para evaluar hiptesis acerca de la relacin
entre dos variables categricas.
Smbolo: X2
Hiptesis a probar: Correlaciones
Variables
involucradas:
Dos variables (la prueba Chi-cuadrada no
considera relaciones causales).
Nivel de medicin de
las variables
Nominal u ordinal (o intervalos o razn reducidas
a ordinales)
Procedimiento La Chi-cuadrada se calcula por medio de una
tabla de contingencia o tabulacin cruzada, que
es una tabla de dos dimensiones y cada
dimensin contiene una variable. A su vez, cada
variable se subdivide en dos o ms categoras.
Distribucin Ji-Cuadrada o Chi-cuadrada o X2
-
13
Total de Fila x Total de ColumnaF. Esperada=
Total General
CARACTERSTICAS
1. La Distribucin X2 se lee con grados de libertad G.L = (Nde filas - 1)(N de columnas - 1).
2. No tiene valores negativos. El valor mnimo es 0.
3. Todas las curvas son asimtricas
4. Cuando aumentan los grados de libertad las curvas sonmenos elevadas y ms extendidas a la derecha.
5. Se utiliza para variables medidas en escala nominal uordinal.
6. Las frmulas son:
-
14
Ejemplo 1. Variable, categora y tabla de contingencia 2x2:
Sean las variables SEXO (Masculino y Femenino) y
CANDIDATO (A y B). La tabla de contingencia o tabulacincruzada es:
CANDIDATO
A B
Masculino
SEXO
Femenino
20 30
40 25
-
15
Ejemplo 2. Estudio de Tabla de contingencia 3x2:
Se estudia a 1040 estudiantes de los niveles de educacin
primaria y secundaria y a los cuales se aplica un instrumento
que mide el aprendizaje de la matemtica, en las dimensiones
de aprendizaje conceptual, procedimental y actitudinal.
Variables:APRENDIZAJE categoras: Conceptual, Procedimental, Actitudinal.
NIVEL DE EDUCACIN categoras: Primaria, Secundaria.
NIVEL DE EDUCACIN
Primaria Secundaria
APRENDIZAJE
Conceptual
Procedimental
Actitudinal
180 100
190 280
170 120
Tabla de contingencia
-
16
Tabla de frecuencias observadas (O):
NIVEL DE EDUCACIN TOTAL
Primaria Secundaria
APRENDIZAJE
Conceptual
Procedimental
Actitudinal
180 100 280
190 280 470
170 120 290
TOTAL 540 500 1040
La Chi-cuadrada es una comparacin entre las tablas de
frecuencias observadas y la denominada tabla de frecuencias
esperadas (la tabla que esperaramos encontrar si las variables
fueran estadsticamente independientes o no estuvieran
relacionadas).
-
17
La frecuencia esperada de cada celda, casilla o recuadro, se
calcula mediante la siguiente frmula aplicada a la tabla de
frecuencias observadas:
N = nmero total de frecuencias observadas.
E = (marginal del regln)*(marginal de columna) / N.
NIVEL DE EDUCACINMarginal
de filasPrimaria Secundaria
APRENDIZAJE
Conceptual
Procedimental
Actitudinal
(280)*(540)/1040 (280)*(500)/1040 280
(470)*(540)/1040 (470)*( 500)/1040 470
(290)*(540)/1040 (290)*(500)/1040 290
marginal de columnas540 500 1040
Tabla de frecuencias esperadas (E):
-
18
NIVEL DE EDUCACIN TOTAL
Primaria Secundaria
O E O E
APRENDIZAJE
Conceptual
Procedimental
Actitudinal
180 145,4 100 134,6 280
190 244,0 280 226,0 470
170 150,6 120 139,4 290
TOTAL 540 500 1040
Frecuencias observada y esperada en una sola tabla:
Donde:
O: frecuencia observada en cada celda
E: frecuencia esperada en cada celda
-
19
Celda O E O - E (O - E)2 (O - E)2 / E
Conceptual/Primaria 180 145,4 34,6 1197,16 8,23
Procedimental/ Primaria 190 244,4 -54,4 2959,36 12,11
Actitudinal / Primaria 170 150,6 19,4 376,36 2,50
Conceptual / Secundaria 100 134,6 -34,6 1197,16 8,69
Procedimental /Secundaria 280 226,0 54,0 2916,00 12,80
Actitudinal / Secundaria 120 139,4 -19,4 376,36 2,70
X2 = 47,33
Para saber si el valor de X2 es o no significativo, debemos
calcular los grados de libertad.
G.L. = (N de filas - 1)(N de columnas - 1).
E
EOX
2
2
-
20
Para el ejemplo: N de filas = 3 y N de columnas = 2;entonces G.L. = (3-1)*(2-1) = 2.
Luego, acudimos a la tabla de distribucin de Chi-cuadrado,
eligiendo nuestro nivel de significancia ( = 0,05 = 0,01).
Si el valor obtenido de X2 es igual o superior al valor de la
tabla, decimos que las variables estn relacionadas o noson independientes.
Aplicacin:
Para el nivel de significancia de =0,05 y g.l. = 2, el X2 de
tabla es 5,9915 (ver tabla).
X2Obtenido = 47,33
X2Crtico = 5,9915
-
21
-
22
Prueba de hiptesis:
H0: No existe relacin entre el aprendizaje y los niveles
de educacin.
H1: Existe relacin entre el aprendizaje y niveles de
educacin.
X2obtenido X2crtico entonces variables no son
independientes; es decir existe una relacin entre
Aprendizaje y los niveles educativos
X2obtenido X2crtico entonces se rechaza la
hiptesis nula (H0), y por lo tanto se acepta la hiptesis
alterna (H1).
-
23
Establezca la Ho a ser probada;
por ejemplo, Ho: 1 = 2 = 0,5
Especifique el nivel de significancia , por ejemplo:
= 0.5
Haga una tabla de frecuencias obtenidas
Deduzca las frecuencias esperadas a partir de Ho:
Calcule el grado de libertad: Producto de (categoras - 1)
Calcule el valor de X2 a partir de las frecuencias obtenidas y
frecuencias esperadas.
Mediante la tabla de X2 obtenga el valor terico.
Compara dichos valores.
Establezca la conclusin con respecto a Ho:
Retenga Ho si valor de tabla > Valor calculado.
Retenga Ho si valor de tabla < Valor calculado.
Paso N 1
Paso N 2
Paso N 3
Paso N 4
-
24
1. Un politlogo cree que, durante los ltimos aos, la composicin tnicade la ciudad donde vive ha cambiado. Las cifras ms actuales (reunidas
hace unos cuntos aos) muestran que los habitantes de dicha ciudad
presentan la siguiente composicin tnica: 53% noruegos, 32% suecos, 8%
irlandeses, 5% alemanes y 2% italianos. Para verificar esta idea, este
cientfico social obtiene una muestra aleatoria de 750 habitantes, con los
resultados que se presentan en la siguiente tabla:
Pases Noruegos Suecos Irlandeses Alemanes Italianos
frecuencia 399 193 63 82 13
a). Cul es la hiptesis nula?
b). Cul es la hiptesis alterna?
c). Cul es la conclusin?. Utilice = 0,05.
Ejercicios propuestos:
-
25
2. Una universidad est pensando en implantar uno de los tres sistemas decalificaciones siguientes: (1) todas las calificaciones son aprobados-
reprobado; (2) todas las calificaciones estn en el sistema 4.0 y (3) 90% de
las calificaciones estn en el sistema 4.0 y 10% son a probados-reprobado.
Se realiza una encuesta para determinar si existe una relacin entre el rea
de inters de cada alumno y su presencia para algn sistema de
calificacin. Se elige una muestra aleatoria de 200 estudiantes del rea
ingeniera, 200 de ciencias, y 100 de bellas artes. Se pregunta a cada
alumno cul de los tres calificaciones prefieren. Los resultados aparecen en
la siguiente tabla:
Sistema de calificacin
Aprobado-reprobado 4,0 4,0 y aprobado-reprobado
Bellas artes 26 55 19
Ciencias 24 118 58
Ingeniera 20 112 68
a). Cul es la
hiptesis nula?
b). Cul es la
hiptesis alterna?
c). Cul es la
conclusin?. Utilice
= 0,05.
-
26
3. Debido a la inflacin galopante, el gobierno est considerando laimposicin de un control de precios y salarios. Un economista del gobierno,
interesado en determinar si existe una relacin entre el empleo y la actitud
hacia este control, rene los siguientes datos. Los datos muestran, para cada
tipo de empleo, el nmero de individuos en la muestra que estn a favor o
contra de los controles.
a). Cul es la hiptesis nula?
b). Cul es la hiptesis alterna?
c). Cul es la conclusin?. Utilice = 0,05.
Actitud hacia el control de precios y salarios
A favor En contra
Obreros 90 60
Empresarios 100 150
Profesionales 110 90
-
CHI CUADRADO
Cundo usar esta distribucin?
Esta es una distribucin de muestreo asociada a la
probabilidad de la varianza (2). Por medio de ella se
determina la probabilidad de ocurrencia de un valor
especfico de varianza con v=n-1 grados de libertad en
una muestra de tamao n.
Varianza
f(x)
-
CHI CUADRADO
Frmulas
tabuladaEst
dxxfxF
exv
xf
densidadFuncin
xv
v
)()(
**
2*2
1)( 2
12
2
Forma de la curva de esta distribucin segn v
-
CHI CUADRADO
Cmo usar las tablas?
La tabla da valores de probabilidad acumulados de derecha
a izquierda. Para extraer valores de probabilidad de esta
tabla se sigue el siguiente procedimiento:
Estimar el valor de la verdadera desviacin estndar.
Determinar los grados de libertad (v) tal que v=n-1.
Calcular el valor de 2=v*(s2/2)
-
CHI CUADRADO
Cmo usar las tablas?
Localizar en tablas el valor de la probabilidad
asociada a los valores de 2 y de v. En algunos
casos, puede ser necesario interpolar para encontrar
el valor exacto buscado, de lo contrario, se escoge el
que ms se aproxime. Por ejemplo, si 2 es igual 0.48
con 4 grados de libertad, el valor de la probabilidad
mayor a el es 0.975, pues se localiza en la direccin
vertical en la parte superior, tal y como se muestra a
continuacin.
-
CHI CUADRADO
Cmo usar las tablas?
-
CHI CUADRADO
EJEMPLO
Una mquina llenadora ha ejecutado su operacin con
una varianza de 0.83 grms2. Si se toma una muestra de
15 unidades, cul es la probabilidad de tener una
varianza:
a. superior a 1.249 grms2?
b. inferior a 0.3896 grms2?
-
CHI CUADRADO
SOLUCIN
a. La probabilidad de tener una varianza superior a
1.249 grms2 es 0.1.
1.0067.2183.0
249.1*14)249.1( 222
PPP
-
CHI CUADRADOSOLUCIN
a. La probabilidad de tener una
varianza superior a 1.249 grms2
es 0.1.
En Excel se pulsa en el men:
INSERTAR, FUNCIN,
ESTADSTICAS, DISTR.CHI
P(2>1.249) se introduce el
valor de 2 que es 21.067 y el
nmero de grados de libertad
que es 14. Excel retorna el
valor de la probabilidad que es
0.099.
-
CHI CUADRADO
SOLUCIN
b. La probabilidad de tener una varianza inferior a
0.3896 grms2 es 0.05.
05.095.0157.683.0
3896.0*14)3896.0( 222
PPP
-
CHI CUADRADO
-
GRACIAS
Cortesia: DR. JORGE ACUA A.