juan ruales estadistica
DESCRIPTION
CHI CUADRADOTRANSCRIPT
UNIVERSIDAD POLITECNICA ESTATAL DEL CARCHI
FACULTAD DE COMERCIO INTERNACIONAL, INTEGRACIÓN, ADMINISTRACIÓN Y ECONOMÍA EMPRESARIAL
ESCUELA DE COMERCIO EXTERIOR Y NEGOCIACIÓN COMERCIAL INTERNACIONAL
TRABAJO DE ESTADÍSTICA
INFERENCIAL
JUAN FRANCISCO RUALES
TULCÁN - ECUADOR
2012
TEMA: CHI-CUADRADO
PROBLEMA: Desconocimiento del Chi- Cuadrado imposibilita la realización y
desarrollo de ejercicios que a futuro utilizaremos.
OBJETIVOS
General
Conocer y aplicar el CHI-CUADRADO en ejercicios planteados para
tener un mejor desarrollo como profesionales en el futuro.
Específicos:
Fundamentar el Chi-cuadrado.
Analizar la información obtenida sobre el CHI-CUADRADO.
Realizar ejercicios planteados sobre el CHI-CUADRADO para aplicarlos
en la carrera.
JUSTIFICACIÓN
El presente trabajo lo hemos realizado con la finalidad de aprender acerca del
Chi-cuadrado, su concepto y los ejercicios que se pueden desarrollar, para
conocer lo fundamental que ayudara en la carrera de comercio exterior y como
profesionales en este campo.
Además se reforzará los conocimientos y así como resolver ejercicios sobre
CHI-CUADRO aplicando la fórmula en ejercicios de nuestra carrera.
5.- MARCO TEORICO
CHI-CUADRADO
En una prueba de ajuste la hipótesis nula establece que una variable X tiene
una cierta distribución de probabilidad con unos determinados valores de los
parámetros. (Arvelo, 1998)
El tipo de distribución se determina, según los casos, en función de: La propia
definición de la variable, consideraciones teóricas al margen de esta y/o
evidencia aportada por datos anteriores al experimento actual. (Arvelo, 1998)
A menudo, la propia definición del tipo de variable lleva implícitos los valores de
sus parámetros o de parte de ellos; si esto no fuera así dichos parámetros se
estimarán a partir de la muestra de valores de la variable que utilizaremos para
realizar la prueba de ajuste. (Arvelo, 1998)
Como en casos anteriores, empezaremos definiendo las hipótesis.
Hipótesis nula: X tiene distribución de probabilidad f(x) con
parámetros y1,..., yp
Hipótesis alternativa: X tiene cualquier otra distribución de
probabilidad.
Es importante destacar que el rechazo de la hipótesis nula no implica que sean
falsos todos sus aspectos sino únicamente el conjunto de ellos; por ejemplo,
podría ocurrir que el tipo de distribución fuera correcto pero que nos
hubiésemos equivocado en los valores de los parámetros. (Arvelo, 1998)
Obviamente, necesitaremos una muestra de valores de la variable X. Si la
variable es discreta y tiene pocos valores posible estimaremos las
probabilidades de dichos valores mediante sus frecuencias muéstrales; si la
variable es continua o si es una discreta con muchos o infinitos valores
estimaremos probabilidades de grupos de valores (intervalos). (Arvelo, 1998)
Metodológicamente, la prueba se basa en la comparación entre la serie de
frecuencias absolutas observadas empíricamente para los valores de la
variable (Oi) y las correspondientes frecuencias absolutas teóricas obtenidas
en base a la función de probabilidad supuesta en la hipótesis nula (Ei). (Arvelo,
1998)
Así pues, una vez calculadas las frecuencias absolutas de cada valor o
intervalo de valores, obtendremos el número total de observaciones de la
muestra (T) sumando las frecuencias observadas (Arvelo, 1998)
Para calcular las frecuencias esperadas repartiremos este número total de
observaciones (T) en partes proporcionales a la probabilidad de cada suceso o
grupo de sucesos. (Arvelo, 1998). Para ello calcularemos dichas probabilidades
utilizando la función de probabilidad definida en la hipótesis nula f(x), de modo
que, cada valor Ei tendrá la siguiente expresión:
Por tanto, tendremos los siguientes datos para la prueba:
Valor de la variable x1 x2 x3 ... xi ... xk
Frecuencias observadas O1 O2 O3 ... Oi ... Ok
Frecuencias esperadas E1 E2 E3 ... Ei ... Ek
Si la hipótesis nula es cierta, las diferencias entre valores observados y
esperados (que siempre existirán por tratarse de una muestra aleatoria) son
atribuibles, exclusivamente, al efecto del azar. En estas condiciones, se puede
calcular un parámetro que depende de ambos, cuya distribución se ajusta a
una CHI-CUADRADO. (Arvelo, 1998)
Si, por el contrario, la hipótesis nula fuera falsa los Ei ya no serían, realmente,
los valores esperados de las frecuencias; por tanto, las diferencias entre los
valores "esperados" y los observados reflejarían no sólo el efecto del azar sino
también las diferencias entre los Ei y la auténtica serie de valores esperados
(desconocida) Como consecuencia, las diferencias de los numeradores de la
expresión anterior tienden a ser más grandes y, por estar elevadas al
cuadrado, la suma de cocientes ser positiva y mayor que lo que se esperaría
para los valores de una CHI-CUADRADO. (Arvelo, 1998)
Por tanto, el parámetro anterior será el estadístico de contraste de la prueba de
hipótesis y la región crítica se encontrar siempre en la cola derecha de la
distribución CHI-CUADRADO. Evidentemente, esta prueba será siempre de
una sola cola. (Arvelo, 1998)
Estadístico de contraste
Se acepta la hipótesis nula si , el percentil 1 – α de la distribución
CHI-CUADRADO con grados de libertad.
Cabe señalar que en las pruebas CHI-CUADRADO lo corriente es que
pretendamos comprobar que una variable tiene una cierta distribución y, por
tanto, habitualmente, nos vemos obligados a colocar nuestra propia hipótesis
en la hipótesis nula. Únicamente podremos colocar nuestra hipótesis en la
alternativa en el caso excepcional de que pretendamos demostrar que cierto
tratamiento produce una distorsión de la distribución básica de la variable en
estudio. (Arvelo, 1998)
El número de grados de libertad de la variable CHI-CUADRADO se calcula de
la siguiente forma:
A priori, tendrá tantos grados de libertad como parejas frecuencia
observada - frecuencia esperada. (Arvelo, 1998)
A esta cantidad se debe restar el número de restricciones lineales
impuestas a las frecuencias observadas, es decir, el número de
parámetros que es necesario calcular directamente a partir de los
valores observados para establecer los valores esperados. Este número
es, como mínimo, uno ya que siempre tendremos que calcular el número
total de observaciones de la muestra. (Arvelo, 1998)
Una condición básica para que podamos llevar a cabo una prueba CHI-
CUADRADO es que las frecuencias de las distintas clases deben ser
suficientemente altas como para garantizar que pequeñas desviaciones
aleatorias en la muestra no tengan importancia decisiva sobre el valor del
estadístico de contraste. (Arvelo, 1998). (Arvelo, 1998)
Las reglas que determinan cuando es posible o no realizar el contraste varían
mucho de unos autores a otros. En un extremo de máxima rigidez se
encuentran aquellos que opinan que no se puede realizar la prueba cuando
alguna de las frecuencias, observadas o esperadas, sea menor que 5. En el
otro extremo se encuentran quienes opinan que, para que la prueba sea viable
ninguna de las frecuencias esperadas debe ser menor que 1 y no más del 25%
pueden ser menores que 5; en lo que refiere a las frecuencias observadas no
existirían límites. La autora de este texto simpatiza más con la segunda
postura, no sólo por razones prácticas, sino porque lo razonable es que la
distribución esperada esté adecuadamente definida y, por tanto, no debe incluir
valores muy bajos; sin embargo, los valores extremos en la distribución
observada simplemente reflejan diferencias importantes entre la distribución
supuesta por la hipótesis nula y la real. (Arvelo, 1998)
Sea cual sea el criterio que elijamos, si resultara que la prueba no es viable
podríamos recurrir a englobar los valores o clases de valores con sus vecinos
más próximos y pasar así a engrosar sus frecuencias. Este procedimiento no
puede llevarse hasta el absurdo pero proporciona una salida digna a
situaciones complejas. En casos excepcionales se pueden englobar valores
que no sean vecinos porque exista algún nexo lógico de conexión entre ellos.
(Arvelo, 1998)
Cuando sea necesario agrupar valores, los grados de libertad no se deben
calcular hasta que tengamos establecidas definitivamente las parejas de
frecuencias observadas y esperadas con las que calcularemos el estadístico de
contraste. (Arvelo, 1998)
EJERCICIOS
EJERCICIO 1.-
1.- Un jugador quiere probar que es legal el dado con el que juega. Tiro el dado
120 veces y obtuvo la siguiente distribución de frecuencias de las caras
resultantes.
RESULTADO 1 2 3 4 5 6
FRECUENCIA 15 25 33 17 16 14
a) Enuncie las hipótesis de la prueba y determine las frecuencias
esperadas.
b) Describa la estadística de la prueba
c) Determine la región crítica de la prueba al nivel de significación del 5%.
d) ¿A qué conclusión llega usando el nivel de significación 0,05?
e) Determine la probabilidad P.
1.-
Ho: El dado es legal.
Ha: El dado no es legal.
2.- Es de dos colas.
3.- Nivel de confianza
4.-
gl= k-1 gl=6-1 gl=5
5.-
6.-
Ei 20 20 20 20 20 20
Oi 15 25 33 17 16 14
[∑
]
7.- Se acepta la hipótesis alternativa y se rechaza la hipótesis nula, es decir el
dado del jugador no es legal ya que se encuentra dentro de la zona de rechazo.
EJERCICIO 2.-
2.- El gerente de ventas de una compañía P&C afirma que todos sus
vendedores realizan el mismo número de visitas durante el mismo período de
tiempo. Una muestra aleatoria de 5 registros de los vendedores en una semana
dada reveló el siguiente número de visitas.
Vendedor A B C D E
Número de visitas 23 29 25 23 30
Con el nivel de significación de 0.05, ¿es razonable aceptar la afirmación del
gerente?
1) : hacen el mismo número de visitas
: hacen menor número de visitas
11,07
Zona
aceptación
2) Gráfica: unilateral y cola a la derecha
3) Nivel de significación 0.05
4) Variables cualitativas → chi cuadrado
5) gl = k-1
gl = 5-1 = 4
= 9,49
6)
7) Acepta la hipótesis nula por que realizan el mismo número de visitas
EJERCICIO 3.-
3.- El gerente de personal de la compañía de “REXA” quiere probar la
hipótesis que hay diferencias significativas de tardanzas de los diferentes días
de la semana. De los registros de asistencia obtuvo la siguiente tabla de
tardanzas de su personal para cada uno de los días de la semana:
DIAS LUNES MARTES MIERCOLES JUEVES VIERNES
TARDANZAS 58 39 75 48 80
26 26 26 26 26
23 29 25 23 30
¿Se puede aceptar la hipótesis del gerente con un nivel de significación de
0.05?
1.- HO = El número de tardanzas en el mismo cada día
2.- La prueba es unilateral de una cola
3.- Nivel de significancia del =0.05
4.-Utilizamos la prueba del CHI-CUADRADO
5.-
gl=K-1
gl= 5-1
gl=4
x2=9.488
6. - frecuencias esperadas
Xi
58
39
75
48
z. aceptación
z. rechazo
9.488
80
300
=60
60 60 60 60 60
58 39 75 48 80
X2= ∑
= 20.232
7.- Se rechaza la hipótesis nula y se acepta la hipótesis alternativa debido a
que hay tardanzas del personal en cada día de la semana ya que llegan
puntuales a la compañía REXA.
EJERCICIO 4.-
4.- De una muestra de turistas que se hospedan en el hotel “ EL PALMER” se
recogió sus opiniones acerca de los servicios del hotel, resultando los
siguientes datos:
PESIMA MALA REGULAR BUENA MUY BUENA EXCELENTE
TURISTAS 20 25 40 54 56
Pruebe con un nivel de significación del 5%, la hipótesis nula de que no hay
diferencias significativas entre las opciones de los turistas.
1.- HO = no hay diferencias significativas en las opiniones
2.- La prueba es unilateral de una cola
3.- Nivel de significancia del =0.05
4.- Utilizamos la prueba del CHI-CUADRADO
5.-
gl=K-1
gl= 5-1
gl=4
x2=9.488
6. FRECUENCIA ESPERADAS
Xi
20
25
40
54
56
195
=39
z. aceptación
z. rechazo
9.488
39 39 39 39 39
20 25 40 54 56
X2= ∑
= 27.486
7.- La hipótesis nula se rechaza porque, no hay diferencias significativas en las
opiniones de los turistas.
Ejercicio 5
En un día se observó el número de conductores que escogieron cada una de
las diez casetas de pago de peaje ubicadas a la salida al sur. Los datos se
registraron en l siguiente tabla:
Caseta # 1 2 3 4 5 6 7 8 9 10
# de
conductores 580 700 730 745 720 710 660 655 670 490
Presentan estos datos suficiente evidencia para concluir que hay casetas
preferidas?. Utilice el nivel de significancia del 5%.
Pasos:
1)
Ho: No existen las casetas preferidas
Ha: Existen casetas preferidas
2) la prueba es unilateral con una cola hacia la derecha.
3) nivel de significancia del 0.5
4) utilizar el Chi cuadrado.
5) grafica
gl= k-1
gl= 10-1=9
Tabla obtenemos 16,919
6) calculo estadístico
Ei 666 666 666 666 666 666 666 666 666 666
Oi 580 700 730 745 720 710 660 655 670 490
(9) = ∑
(9) =
+
+
+
+
+
+
+
+
+
= 82,42
7) Se rechaza la hipótesis nula y se acepta la alternativa que propone que si
existen preferencias en las casetas del cobro de peaje.
Ejercicio 6
Un ejecutivo de hipermercado “TOD” afirma que las compras se pagan 30%
con cheques, 45% con efectivo y 25% con tarjeta de crédito. En una muestra
aleatoria de 400 compradores se encontró q 110 de ellos pagaron con
cheques, 210 con efectivo y 80 con tarjetas ¿puede usted concluir con la
significación de 0,05 que la afirmación del ejecutivo es razonable?
30% cheque
45% efectivo
25% tarjeta de crédito
N= 400
110 cheques
210 efectivos
80 tarjetas
1) Ho: los pagos guardan relación
Ha: los pagos no guardan relación entre si
2) la prueba es unilateral con una cola hacia la derecha.
3) nivel de significancia del 0.05
4) utilizar el Chi cuadrado.
5) grafica
gl= k-1
gl= 3-1=2
Tabla obtenemos 5,991
6) calculo estadístico
Ei 120 180 100
Oi 110 210 80
(2) = ∑
(2) =
+
+
= 9,83
7) se rechaza la hipótesis nula y se acoge la alternativa que manifiesta que los
pagos con tarjeta, cheque o efectivo no guardan ninguna relación entre si.
EJERCICIO 7.-
Una maquina llena latas con 300 caramelos de sabores: Piña, Fresa, Limón y
Naranja en la relación: 4:3:2:1. Si en una lata de estos caramelos se encontró;
115 de piña, 95 de fresa, 70 de limón, y 20 de naranja, pruebe la hipótesis de
que la maquina está mezclando en la relación: 4;3;2;1 al nivel de significación
de 0.05.
SABORES PIÑA FRESA LIMON NARANJA TOTAL
RELACION 4 3 2 10 10 CANTIDAD 115 95 70 20 300 TOTAL 119 98 72 21 316
1) = la maquina esta mesclado en la relación 4:3:2:1
2) La prueba es unilateral de una cola
3) Nivel de significación 0.05
4) Utilizamos CHI- CUADRADO
5)
gl= (f -1) (c- 1)
gl= (2-1)(4-1)
gl=3
X= 7.815
6) = 300 X 40 =120
= 300 X 30 =90
= 300 X 20=60
= 300 X 10=30
𝐻𝑜
𝐻𝑎
7.815
115
95
70
20
∑
=
+
= 5.496
7) TOMA DE DECICIONES
Como se puede ver aceptamos la hipótesis nula y desechamos la
hipótesis alternativa y que la maquina mezcladora tiene relación entre
4:3:2:1.
EJERCICIO.- 8
Se cree que las personas que mueren por sobredosis de narcóticos son
generalmente jóvenes. Para comprobar esta hipótesis se ha obtenido la
siguiente distribución del número de muertes por sobredosis.
EDAD 15 - 19 20 - 24 25 - 29 30 - 34 35 - 39 40 O MAS
NUMERO DE
MUERTES
31 44 27 39 41 28
Con estos resultados y con un nivel de significación de 0.05. ¿Se puede
concluir, empleado, que muere un número igual de personas en cada
categoría?
120 90 60 30
1) = Muere igual el número de personas en cada categoría
2) La prueba es unilateral de una cola
3) Nivel de significación 0.05
4) Utilizamos CHI- CUADRADO
5)
gl= K -1 = 6-1= 5
= 11.070
6)
31
44
27
39
41
28
∑
=
+
= 0.46+2.31+1.83+0.46+1.03+1.4
= 7.486
𝐻𝑜
𝐻𝑎
11.070
35 35 35 35 35 35
6) TOMA DECISIONES
Se acepta la hipótesis nula y se rechaza la hipótesis alternativa y que le
número de muertos es igual al número de personas por categoría.
EJERCICIO 9.-
9. Un investigador escogió una muestra aleatoria de 192 familias con 4 hijos y
encontró la siguiente distribución de frecuencias del número de hijos varones:
Número de
varones
0 1 2 3 4
Número de
familias
18 42 64 40 28
Él quiere probar la hipótesis de que los nacimientos de varones y mujeres son
igualmente probables. Esto es, quiere probar que la distribución de estos datos
se aproxima a una distribución binomial.
Enuncie la hipótesis de la prueba y obtenga las frecuencias esperadas.
Describa la estadística de la prueba
Determine la región critica de la prueba al nivel de significación del 5%
A que conclusión llega usando el nivel de significación 0.05
Determine el nivel de significación de la prueba (calcule probabilidad:P)
1) H0: la distribución de nacimiento de varones y mujeres son igualmente
probables.
H1: la distribución de nacimientos de varones y mujeres no son
igualmente probables.
2) La prueba es unilateral y de cola derecha
3) Nivel de significación 0.05
4) Emplearemos la distribución maestral del CHI-CUADRADO
5) Gl= k-1
Gl=5-1=4
6)
Ei 38.4 38.4 38.4 38.4 38.4
Oi 18 42 64 40 28
Cálculo de las frecuencias esperadas
∑
[
]
1. Toma de decisiones
Aceptamos la Ha y rechazamos la Ho.
Esto significa que los nacimientos de varones y mujeres no son
igualmente probables.
9.48
EJERCICIO 10.-
10. Se lanzaron 200 veces 5 monedas y en cada tirada se contaron el número
de caras. Los resultados de este experimento son los siguientes:
Número de
caras
0 1 2 3 4 5
Número de
tiradas
3 15 55 60 40 27
Pruebe la hipótesis de que la distribución del número de caras se ajusta a una
distribución binominal. Use el nivel de significación del 1%
1) H0: la distribución del número de caras se ajusta a la distribución.
H1: la distribución del número de caras no se ajusta a la distribución.
2) La prueba es unilateral y de cola derecha
3) Nivel de significación 1% = 0.01
4) Emplearemos la distribución muestral del CHI-CUADRADO
5) Gl= k-1
Gl=6-1=5
6)
Ei 33.33 .3333, 33.33 33.33 33.33 33.33
Oi 3 15 55 60 40 27
15.086
1. Cálculo del Estadístico de la Prueba
∑
[
]
7.- Toma de decisiones
Aceptamos la Ha y rechazamos la Ho. La distribución del número de caras se
ajusta a una distribución binomial.
CONCLUSIONES:
Mediante el presente trabajo hemos podido conocer y aplicar sobre la
distribución de Chi-Cuadrado, además hemos aprendido sobre las
relaciones que existen entre las variables dentro de un problema.
Con el desarrollo de varios problemas con respecto al tema hemos
podido practicar y aprender las relaciones existentes: relación infinita,
positiva perfecta, negativa imperfecta, nula etc.
La aplicación de Chi cuadrado puede ser compleja en cuanto a la
determinación de las hipótesis, pero son de suma importancia para
determinar la aceptación o rechazo de ellas.
RECOMENDACIONES:
Es de vital ayuda poner en práctica los conocimientos aprendidos ya que
nos servirán dentro de nuestra carrera y el desarrollo de la problemática
que en ella se engloba.
Es necesario identificar el Chi cuadrado dentro de las variables porque
estas se aplican para el desarrollo de proyectos.
Proponer ejercicios mediante la distribución del chi cuadrado en función
a las actividades del comercio exterior y así lograr una mayor
comprensión.
CRONOGRAMA
Tiempo Actividades
JULIO
SEMANA 2 3 4 5 6 7 8 9 10 11 12 13
Clase: Chi cuadrado
X
Desarrollo del formato de
presentación del trabajo
X
Resolución de ejercicios
X
X
Evaluación de prueba de hipótesis, t-student y chi-
cuadrado
X
Entrega de trabajo de Chi-Cuadrado
X
BIBLIOGRAFÍA
Aldape, A., & Toral, C. (2005). Matemáticas 2. México: PROGRESO
S.A.
Altamirano, E. (2007).
Anderson, D. R. (2005). Estadística para Administración y
Economía. México: Cengage Learning.
Diaz, R. G. (2008). Unidades fundamentales .
Enríquez, H. (2002). Fundamentos de Electricidad. México: LIMUSA
S.A.
Física, E. d. (1997). Brian Mckittrick. Madrid: Reverté S.A.
García, M. A. (2000). Estadística Avanzada con el Paquete Systat.
Murcia: I.S.B.N.
J.R, W. D. (20007). Ciencias e Ingenieria de las Materias .
ANEXOS:
1) Un camión lleva al país de destino 200 productos perecibles como:
manzanas, Limón y Naranja y mangos en la relación: 4:3:2:1. Si en el
camión en se encontró; 115 de piña, 95 de fresa, 70 de limón, y 20 de
naranja, pruebe la hipótesis que el camión tiene relación: 4;3;2;1 al nivel
de significación de 0.05.
PRODUCTOS PERECIBLES
MANZANAS LIMON NARANJA MANGOS TOTAL
RELACION 4 3 2 10 10 CANTIDAD 115 95 70 20 300 TOTAL 119 98 72 21 316
1) = el camión tiene relación: 4;3;2;1
2) La prueba es unilateral de una cola
3) Nivel de significación 0.05
4) Utilizamos CHI- CUADRADO
5)
gl= (f -1) (c- 1)
gl= (2-1)(4-1)
gl=3
X= 7.815
6) = 300 X 40 =120
= 300 X 30 =90
= 300 X 20=60
= 300 X 10=30
𝐻𝑜
𝐻𝑎
7.815
115
95
70
20
∑
=
+
= 5.496
7) TOMA DE DECICIONES
Como se puede ver aceptamos la hipótesis nula y desechamos la
hipótesis alternativa y el camión tiene relación: 4;3;2;1
2) En un día se observó el número de conductores que pasan por el
puente de rumichaca . Los datos se registraron en l siguiente tabla:
1 2 3 4 5 6 7 8 9 10
# de conductores
580 700 730 745 720 710 660 655 670 490
Presentan estos datos suficiente evidencia para concluir que hay casetas
preferidas?. Utilice el nivel de significancia del 5%.
Pasos:
1)
Ho: No existen las casetas preferidas
Ha: Existen casetas preferidas
2) la prueba es unilateral con una cola hacia la derecha.
120 90 60 30
3) nivel de significancia del 0.5
4) utilizar el Chi cuadrado.
5) grafica
gl= k-1
gl= 10-1=9
Tabla obtenemos 16,919
6) calculo estadístico
Ei 666 666 666 666 666 666 666 666 666 666
Oi 580 700 730 745 720 710 660 655 670 490
(9) = ∑
(9) =
+
+
+
+
+
+
+
+
+
= 82,42
7) Se rechaza la hipótesis nula y se acepta la alternativa que propone que si
existen preferencias en las casetas del cobro de peaje para conductores que
pasan en el puente de rumichaca pasando mercadería
3) En un estudio realizado en el departamento comercio exterior se aplicó:
Una encuesta a los exportadores cuanto exportan en toneladas, obteniendo
los resultados que presenta la siguiente tabla
Al nivel de significación Q=0.05, determinar que las variables perjuicio étnico
hacia el negro y lugar de residencia son independientes
1. Ho: el departamento de comercio exterior y los exportadores
H1: existe dependencia entre las variables.
2. La prueba es unilateral y la cola derecha
3. Asumimos el nivel de significación de Q= 0.05
4. Utilizaremos la distribución muestral de chi-cuadrado porque las dos
variables son cualitativas.
5. Esquema de la prueba
Gl =(C-1) (F-1) 1.1.3.4
Gl =(3-1) (2-1) = 2 11.3.4
Gl= 2
Q= 0.05
X2 = (2) = 5.991
C= # de columnas
F= # de filas
6. Calculo del estadístico de la prueba x= 3.54
5.991
Formula
∑ (
)
2
X2= 3.54
Exportación en toneladas
Exportación 1 mes 2 meses 3 meses total
Alto 32 225 50 307
Bajo 28 290 79 397
Total 60 515 129 704
Ya conocemos las frecuencias observadas para determinar las frecuencias
esperadas emplearemos la misma tabla, manteniendo invariables de
frecuencias marginales de dos variables
Exportación en toneladas
exportacion 1 mes 2 meses 3 meses total
Alto E11 E12 E13 307
Bajo E21 E22 E23 397
Total 60 515 129 704
Cuando las variables X y Y son independientes, las frecuencias de cada celda
son igual al productos de las frecuencias marginales correspondientes dividido
por el tamaño de la muestra.
26.16
32
224.58
225
33.84
28
290.42
290
72.75
79
56.25
50
Las frecuencias esperadas y las asociadas determinan las frecuencias
observadas anteriormente
4) En la exportación de naranjas, la empresa exportadora envía
mensualmente lotes de 50 cajas al exterior, cada caja tiene un peso
aproximado de 20 kilos. Las cajas son previamente almacenadas. Para
el control de calidad se
examinan al azar, si en alguna caja encuentran por lo menos una
naranja malograda, esta es calificada mala. Para que pase el control
mediante la inspección de la muestra no debe haber caja malograda, si
solo exi s te una ca ja es ta se rá camb i ada , s i hay má s de 1
en las 5 inspeccionadas, inspeccionaran las cincuenta cajas. Según las
estadísticas pasadas de un total de 40 envíos, registro lo siguiente: Se
puede afirmar que la variable número de cajas en mal estado en la
muestra de 5 sigue una distribución Binomial?.
manzanas Rojas verdes ambos
Grandes 3 5 5 13 Medianas 5 4 8 17 pequeñas 7 9 6 22 total 15 18 19 52
1)
H0: La variable número de cajas sigue una distribución Binomial.
Ha: No siguen una Binomial.
2) La prueba es unilateral y de una cola derecha
3) Nivel de significación 0.10
4) Utilización del chi cuadrado
5) Esquema de la prueba
Gl = (c-1) (f-1)
= (3-1) (3-1)
= 4
α = 0.10
En la tabla de CHI CUADRADA obtenemos
X2 (4) = 7.779
6) Calculo del estadístico de la prueba
∑
Calculo de las pruebas esperadas.
manzanas Rojas verdes ambos
Grandes 3.75 4.5 4.75
13
3
5
5 Medianas 4.90 5.88 6.21
17 5 4
8
pequeñas 6.35 7.62 8.04
22 7 9 6
total 15
18
19
52
= 0.15+ 0.06+ 0.01+ 0.002+0.60+0.52+ 0.07+ 0.25+ 0.52
=2.182
7)
ZA ZR
2.182 7.779
ZA= aceptamos la hipótesis nula porque La variable número de cajas
sigue una distribución Binomial.
5) En Tulcán se realiza un estudio si es factible la creación de una Bodega
, para la cual se aplicó una encuesta a las personas que se dedican al
comercio exterior, obteniéndose los resultados que se presentan a
continuación:
Actividad de Comercio Exterior
Factibilidad Importadores Exportadores Agentes de
Aduana
Total
Si 18 20 38 76
No 12 8 14 34
Total 30 28 52 110
Al nivel de significación α= 0.05, determinar que las variables factibilidad de
creación de Zona Franca y actividad de comercio exterior son independientes.
a)
Ho= factibilidad de creación de Zona Franca y la actividad de comercio exterior
son independientes;
H1=existe dependencia entre las dos variables.
b) La prueba es unilateral y de cola derecha.
c) Asumimos el nivel de significación de α= 0.05
d) Utilizaremos la distribución muestral de Chi-cuadrado porque las dos
variables son cualitativas
e)
gl= (C-1)(F-1)
gl= (3-1)(2-1) = 2
α= 0.05
x2(2)=5.991
f)
Actividad de Comercio Exterior
Factibilidad Importadores Exportadores Agentes de Aduana
Total
Si E11 E12 E13 76
No E21 E22 E23 34
Total 30 28 52 110
Ei 20,73 19,35 35,93
Oi 18 20 38 9,27 8,65 16,07 12 8 14
∑
g) Vemos que el valor se encuentra en la zona de aceptación por lo tanto
aceptamos la Ho.
6) Los estudiantes de comercio exterior quiere determinar si la creación de
una empresa de contenedores para el Transporte de exportaciones e
importaciones entre Ecuador y Perú.
EMPRESA DE ALQUILER DE CONTENEDORES
Grado de
perjuicio
Transportistas Empresas de
transporte
Exportadores Importadores TOTAL
Están de
acuerdo 392 222 331 123 1068
No Están
de acuerdo
122 324 122 323 891
TOTAL 514 546 453 446 1959
El nivel de significancia es de α=0.05 determinar las variables de la
aceptabilidad de la creación de la empresa.
1). la aceptabilidad de la creación de la empresas.
Existe aceptabilidad.
2). La prueba es unilateral y la cola es derecha.
3) Asumimos el nivel de significancia de α=0.05
4) Utilizaremos la distribución maestral de Ji-Cuadrado porque las dos variables
son cualitativas.
5) Esquema de la prueba
6) Calculo del estadístico de la prueb
∑
EMPRESA DE DE ALQUILER DE CONTENEDORES
Grado de
perjuicio
Transportistas Empresas
de transporte
Exportadores Importadores TOTAL
Están de
acuerdo 392
222
331 123 1068
No Están de acuerdo
122 324 122 323 891
TOTAL 514 546 453 446 1959
∑
297,66
280.22
246.96
206,03
243,14
233,77 248,33 202,85
6,62 7,815