evaluacion final 2014 i
TRANSCRIPT
Universidad Central de Venezuela Departamento de Ciencias BásicasFacultad de Medicina Cátedra de EstadísticaEscuela de Nutrición y Dietética Asignatura: Estadística Aplicada
Profesora: Zuleima Rodríguez Acevedo
ACTIVIDAD FINAL
EXPLICACIÓN DE LA ACTIVIDAD: De una investigación hipotética planteada, se dan los resultados del análisis estadístico y se pide responder RAZONADAMENTE a una serie de preguntas relacionadas con la investigación (más abajo).
Estudios realizados con anterioridad ponen de manifiesto que incrementos en el contenido de alquitrán y nicotina de los cigarrillos vienen acompañados por incrementos en el monóxido de carbono emitido al fumarel punto de partida son los datos que a continuación se presentan y se plantea el siguiente objetivo:
OBJETIVO: Hacer el estudio descriptivo de los datos y encontrar un modelo que permita estimar la cantidad de MONOXIDO de CARBONO, a partir de las variables Alquitrán, Nicotina y Peso del cigarrillo.
Hacer un estudio descriptivo de las variables que intervienen en el estudio. Este documento tendrá 3 partes:
PARTE 1: Genere un breve informe estadístico descriptivo, a partir de la salida de ordenador que se adjunta (tómese el espacio que necesite pero sea breve), en el que señale:
1) el tamaño muestral, El tamaño de la muestral es el número de sujetos que componen la muestra
extraída de una población, necesarios para que los datos obtenidos sean
representativos de la población. En nuestro caso, el tamaño muestral es de 25
cigarrillos, compuesto por 16 cigarrillos de tabaco rubio y 9 cigarrillos de tabaco
negro.
2) cuál es la variable con mayor variabilidad,
Las medidas de dispersión, también llamadas medidas de variabilidad, muestran
la variabilidad de una distribución, indicando por medio de un número, si las
diferentes puntuaciones de una variable están muy alejadas de la media. Cuanto
mayor sea ese valor, mayor será la variabilidad, cuanto menor sea, más
homogénea será a la media. Las medidas de dispersión utilizadas en ésta muestra
son la Desviación Típica y la Varianza. La variable con mayor variabilidad es el
alquitrán debido a que presenta una Desviación Típica de 5,87634 y una
Varianza de 34,531, ambas mayores con respecto a las demás variables.
3) cuál de las medias es más representativa de los datos El peso es la variable con la media más representativa debido a que los
valores de su Desviación Típica y Varianza son inferiores a los de las demás
medias con un valor de 0,0877215 y 0,008 respectivamente, lo que significa que
tiene una menor cantidad de valores que se hallen dispersos a la media con
respecto a las demás variables.
4) cuál de las medias es más estable.
El error típico son las variaciones a menudo inevitables. El error típico puede
definirse también como la variación producida por factores distorsionantes tanto
conocidos como desconocidos. Una media con menor error típico es una media
más estable. Por tanto nuestra media más estable es el peso, ya que posee un
error típico de 0,175443
PARTE IICompare la muestra de mayor variabilidad (la que usted seleccionó) con la muestra que usted estudió para elaborar la base de datos, explique:
P2 4 6 4 5 7 16 8 11 8 2 8 5 6 9 8 8 6 6 1 7 9 8 7 8 7 9 7 6 6 7
Media 6,97Moda 8Mediana 7Desviación típica 2,68Error típico 1,27Varianza 6,97
Fuente: Archivo "Estadística base de datos, tablas y gráficos" segundo corte.
Datos corespondientes a la Pregunta #2 de la encuesta socioeconómica, acerca del número de ambientes en la vivienda incluyendo aquellos destinados para dormir, de la muestra de 30 estudiantes pertenecientes a la Universidad Central de
Venezuela
Cuál es la variable con mayor variabilidad
Entre la variable alquitrán y la variable del número de ambientes en la vivienda la
que tiene mayor variabilidad es la de alquitrán con una Desviación Típica de
5,87634 y una Varianza de 34,531 con respecto al de la variable del número de
ambientes.
Cuál de las medias es más representativa de los datos
La media más representativa es la de número de ambiente en la vivienda
utilizado en la base de datos. Debido a que es la que tiene los valores de 2,68 de
la Desviación Típica y el 6,97 de la Varianza inferiores a los presentados por el
alquitrán.
Cuál de las medias es más estable.
La media con el menor Error Típico es el alquitrán con 1,17527, por lo tanto es
la media más estable de las dos.
PARTE III
Estudios realizados con anterioridad ponen de manifiesto que incrementos en el contenido de alquitrán y nicotina de los cigarrillos vienen acompañados por incrementos en el monóxido de carbono emitido al fumar. Se Parte de los datos que se presentan y se plantea el siguiente objetivo:
OBJETIVO: Encontrar un modelo que nos permita estimar la cantidad de MONOXIDO de CARBONO, a partir de las variables Alquitrán, Nicotina y Peso del cigarrillo..
PARTE 3.1. Comience con una inspección gráfica de las nubes de puntos . Genere un breve informe (tómese el espacio que necesite, pero sea breve) sobre la relación entre el monóxido de carbono y cada una de las variables explicativas, a partir de las correspondientes nubes de puntos que se adjuntan. A partir de la inspección visual de las nubes, cuál de las variables parece más relacionada con el monóxido y si la relación parece similar para los dos tipos de tabaco, Rubio y Negro.
A partir de las correspondientes nubes de puntos que se adjuntan, se manifiesta
una correlación dependiente entre la producción de monóxido de carbono con el
contenido de nicotina y el contenido de alquitrán evidenciado en mayor medida
con la variable del contenido de nicotina. Lo que significa que a mayor
contenido de nicotina en el cigarrillo habrá un aumento relativamente similar
del monóxido de carbono producido. Con respecto al peso, si bien existe una
relación, no se hace muy evidente.
Respecto a si existe una relación similar entre tabaco rubio y negro se puede decir
que, si bien para ambos existe la misma correlación entre el contenido de
alquitrán y el monóxido de carbono, las cantidades de dichos elementos
encontrados en los cigarros de la muestra son superiores para el tabaco negro,
o lo que es lo mismo, se encuentran notablemente en menor cantidad para el
tabaco rubio.
PARTE 3.2. Búsqueda de modelos que permitan estimar la cantidad de MONÓXIDO de CARBONO, a partir de las variables Alquitrán, Nicotina y Peso del cigarrillo.a. Realice un breve informe sobre los modelos y su representatividad, a la vista de los resultados que se adjuntan: Interprete el coeficiente de determinación R2 y el coeficiente de regresión, en cada modelo y díganos cuál le parece más adecuado y porqué
Coeficiente de determinación
El coeficiente de determinación R2 indica la existencia de una relación lineal y
Mide el porcentaje de variación en la variable explicada por una variable
dependiente, que es más fuerte cuanto más próximo es a 1, ésta relación está
determinada en porcentaje, por tanto sí R2=1 significa que explica el 100% de la
muestra. En el caso del modelo MA este coeficiente es de 0.91 y el del modelo
MN es de 0.93 en ambos casos la correlación lineal es muy alta, explicando el
91% y 93% de la muestra respectivamente. En el tercer modelo MP es 0.46 donde
la correlación lineal es moderada, ya que solo explica el 46% de la muestra.
Siendo la correlación positiva en todos los casos, entonces cuando “X” aumenta
se espera que “Y” también aumente.
El coeficiente de regresión
Con respecto al modelo MA, El valor de “b” es 0.73 que indica el incremento de
alquitrán en promedio por monóxido de carbono producido, el valor de “a” se
interpretara como el valor obtenido, entendiéndose este valor como 3.88. En el
segundo modelo MN el valor “b” indica que el aumento de la nicotina aumenta el
monóxido de carbono producido. Por último en el modelo MP podemos ver una
diferencia Como el coeficiente de correlación lineal es 0.46 no podemos deducir
que exista una relación fuerte ni débil, tendríamos que realizar contraste de
hipótesis para saberlo con claridad.
Un valor ≠0 indica que Existe regresión lineal de Y en función de x.
En relación al caso se considera más apropiado el coeficiente de determinación
dado que este nos permite conocer la intensidad de relación lineal entre dos
variables de un intervalo, a fin de predecir futuros resultados o testear una
hipótesis, haciendo más específico el estudio y mejor interpretación de los datos
al momento de analizar la investigación. A diferencia del coeficiente de regresión
que solo nos suministra la relación entre las variables.
PARTE IV
Calcule para la variable (ingreso y edad) y (ingreso familiar y número de personas que trabajan) de la muestra que usted estudió , el coeficiente de determinación y correlación
INGRESO = 157,89*EDAD - 900,96
R² = 0,0968
Explicando apenas el 9,6% de la variable no posee una correlación fuerte o
moderada, solo podría hablarse de una correlación débil entre la edad y el
ingreso.
INGRESO FAMILIAR = -256,35*NÚMERO DE PERSONAS QUE TRABAJAN +
22725
R² = 0,0002
Explicando tan solo 0,02% de la variable, estaríamos frente a una correlación
inexistente entre el ingreso familiar y el número de personas que trabajan en el
hogar.
Grafique a través de un diagrama de nubes las variables que estudió anteriormente
0 20 40 60 80 100 120Bs. F. 0
Bs. F. 10,000
Bs. F. 20,000
Bs. F. 30,000
Bs. F. 40,000
Bs. F. 50,000
Bs. F. 60,000
Bs. F. 70,000
Bs. F. 80,000
Bs. F. 90,000
f(x) = 157.889247506072 x − 900.95635976797R² = 0.0967960172359598
NUBE Y RECTA DE CORRELACIÓN ENTRE INGRESOS Y EDAD
EDAD
ING
RESO
S
PARTE V
Entrega de las encuestas en físico
Coeficiente de correlación
Recuerde:
N= tamaño de la muestra en estudio
Xi = valores de la variable independiente
Yi = valores de la variable dependiente
Fecha de entrega:
El trabajo será entregado en grupo
n∑ xy−∑ x∑ y√¿¿¿