conceptos básicos de inferencia - campus virtual · pdf fileen una muestra al general...
TRANSCRIPT
17/02/2011
1
CONCEPTOS BÁSICOS DE
INFERENCIA
Ciencia encargada de suministrar diferentes técnicas y procedimientos que permitan
recolectar, organizar, analizar e interpretar datos.
“La estadística es un método empleado en la toma de decisiones frente a la incertidumbre, partiendo de datos estadísticos y calculando
riesgos” (Yan Lun Chao)
17/02/2011
2
El estudio de la estadística se divide en dos categorías:
1. ESTADÍSTICA DESCRIPTIVA: Métodos para organizar,resumir y presentar datos de manera informativa. Su fin esúnicamente exploratorio y se limita a describir lo observado enuna población o muestra.
TEORIA DE LA PROBABILIDAD
2. ESTADÍSTICA INFERENCIAL:Proceso inductivo que permite inferir a toda la poblacióncaracterísticas observadas en una muestra.
CONCEPTO DE ESTADÍSTICA
ESTADÍSTICA DESCRIPTIVA:
Su objetivo es la exploración sin restricciones de los datos en
busca de regularidades interesantes
Las conclusiones solo se aplican a los individuos y a las
circunstancias para los cuales se obtuvieron los datos.
Las conclusiones son informales, se basan en lo que se observa en
los datos.
ESTADÍSTICA INFERENCIAL:
Su objetivo es responder a preguntas concretas que se
plantearon antes de la obtención de los datos.
Las conclusiones se aplican a un grupo mas amplio de individuos o situaciones.
Las conclusiones son formales y se hace explicito el grado de
confianza que se tienen sobre ellas.
Complementarias
CONCEPTO DE ESTADÍSTICA
17/02/2011
3
Subconjuntos representativode elementos obtenidos de lapoblación de interés.
Su razón de ser es que muchasveces resulta muy costoso o casiimpracticable observar uno auno los elementos de lapoblación.
Muestra (n)Población (N)
INFERENCIA ESTADÍSTICA
Conjunto de elementos de interésen un estudio.
1. El numero de elementos puede serfinito o infinito.
2. No debe asociarse exclusivamentecon población humana.
Característica medible sobre lapoblación.
Característica medible sobrela muestra.
Parámetro Estimador
INFERENCIA ESTADÍSTICA
( )( )
( )
2
Media
Varianza
Proporcion P
µ
σ( )
( )( )
2
Promedio
Varianza
Proporcion
X
S
p
Inferencia
Método que permite generalizar los resultados obtenidos en una muestra al general de la población, apoyándose en
leyes de la probabilidad
17/02/2011
4
Individuo:Son los objetos descritos por un conjunto dedatos. Los individuos pueden ser personas, perotambién pueden ser animales o cosas.
Variable:Es cualquier característica de interés de unindividuo. Una variable puede tomar distintosvalores para distintos individuos. (Edad,Estatura, Peso, etc.)
INDIVIDUOS Y VARIABLES
TIPOS DE VARIABLES
CUALITATIVAS o ATRIBUTOS
ORDINAL
INTERVALO
CUANTITATIVAS o NUMERICAS
ESCALAS DE MEDICIÓN
NOMINAL
TIPO
CONTINUA DISCRETA
ESCALAS DE MEDICIÓN
RAZÓN
17/02/2011
5
VARIABLES
- Si sus valores son numéricos.
- Tiene sentido hacer operacionesalgebraicas con ellos.
CUALITATIVAS
CUANTITATIVAS
- Si sus valores (modalidades) no sepueden asociar naturalmente a unnúmero.
Discretas:Si toma valores enteros.Número de hijos, Número de carros.
Continuas:Si entre dos valores, son posibles infinitosvalores intermedios.Altura, Temperatura, Duración de una batería,Peso(kg).
-No se pueden hacer operacionesalgebraicas con ellas.
ESCALA DE MEDICIÓN
CUALITATIVAS CUANTITATIVAS
1. Escala Nominal:No puede establecer un orden jerárquico entre las opciones de respuesta.
Color de Ojos (Verde, Azul, Gris, Negro, Café).
2. Escala Ordinal:Existe un ordenamiento natural de lasopciones de respuesta.
Calificación de un servicio(Excelente, Bueno, Regular, Malo).
3. Escala de Intervalo:El valor 0 es un valor arbitrario, noimplica la no presencia de unacaracterística.
Temperatura = 0ºC ¿No hay temperatura?
4. Escala de Razón:El valor 0 refleja ausencia de lacaracterística.
Altura = 0 mts
17/02/2011
6
ALGUNAS DISTRIBUCIONES
CONTINUAS ESPECIALES EN
INFERENCIA ESTADÍSTICA
Se dice que una variable aleatoria X es continua si sus valoresconsisten en uno o mas valores de la recta de los reales, es decir,cualquier numero x entre un intervalo A y B es posible.
Entonces una distribución de probabilidad o función de densidad deprobabilidad (fdp) de X es una función f(x) tal que para dos númeroscualesquiera a y b con a ≤ b:
Es decir, la probabilidad de que X tome un valor en el intervalo [a,b] esel área entre este intervalo y bajo la grafica de la función de densidad.La grafica de f(x) se llama curva de densidad.
VARIABLES ALEATORIAS Y DISTRIBUCIONES
CONTINUAS DE PROBABILIDAD
( ) ( )b
a
P a X b f x dx≤ ≤ = ∫
17/02/2011
7
Para que f(x) sea una función de densidad de probabilidad legitima,se deben satisfacer dos condiciones:
DISTRIBUCIONES CONTINUAS DE PROBABILIDAD
1. 0 ( ) 1
2. ( ) area bajo la grafica completa de f(x) 1
f x
f x dx∞
−∞
≤ ≤
= =∫
Valor Esperado:El valor esperado o promedio de una variable aleatoria continua Xcon función de densidad f(x) es:
Varianza:
La varianza de una variable aleatoria continua X con función dedensidad f(x) y valor promedio µ es:
La forma mas fácil para calcularσ2 es usar de nuevo una formula abreviada:
donde:
DISTRIBUCIONES CONTINUAS DE PROBABILIDAD
( ) * ( )X E X x f x dxµ∞
−∞
= = ∫
( ) ( ) ( )2 22 * ( )X V X E X x f x dxσ µ µ∞
−∞
= = − = − ∫
( )2 2( ) xV X E X µ= −
( )2 2 * ( )E X x f x dx∞
−∞
= ∫
17/02/2011
8
Ejercicio 1:
“Avance del tiempo” en flujo de transito es el tiempo transcurridoentre el tiempo en que un automóvil termina de pasar un punto fijo yel instante en que el siguiente automóvil comienza a pasar ese punto.Sea X = avance entre dos automóviles consecutivos elegidos al azar(seg) en una autopista durante un periodo de flujo intenso.
Suponga que la función de densidad de X es en esencia la indicadapor:
a. Determine el valor de k para el cual f(x) es una función dedensidad legitima. 3
b. Obtenga el valor medio y la desviación estándar del avance.1.5 ; 0.866
DISTRIBUCIONES CONTINUAS DE PROBABILIDAD
4 1
( ) 0 1
kx
f x xx
>= ≤
La distribución de alguna variable aleatoria continua porlo general no se deduce mediante argumentosprobabilísticos simples. En vez de eso, se debe hacer unaelección juiciosa de la función de densidad con base en elconocimiento previo y datos disponibles. Por fortuna, hayalgunas familias generales de fdp que se ajustan bien auna amplia variedad de situaciones experimentales.
Algunas de estas distribuciones de probabilidad son laUniforme, Exponencial y la Normal, pero aquí noscentraremos en la distribución Normal y lasdistribuciones que puedan generarse a partir de ellacomo son la t-Student, Chi-Cuadrado y F de Snedecor.
DISTRIBUCIONES CONTINUAS DE PROBABILIDAD
17/02/2011
9
Descubierta y publicada por primera vez en 1733 por De Moivre, a lacual llegaron de manera independiente Gauss(1809) y Laplace (1812)en relación a la distribución de los errores en observación astronómicay física respectivamente.
Es una de las distribuciones teóricas mejor estudiadas y masutilizadas en la practica por las diversas aplicaciones que se puedenmodelar a través de ella.
Se dice que una variable aleatoria X tiene una distribución Normal, sisu función de densidad es:
donde µ (media) y σ (desviación) son los parámetros de la distribución.
DISTRIBUCIÓN NORMAL
( )
∞<<∞−>
∞<<∞−=
−−
µσπσ
σµ
; 0
2
12
21
xexfx
La distribución de probabilidad Normal es una distribución continuade probabilidad y tiene las siguientes propiedades:
1. La familia completa de distribuciones normales se diferencia porsu media µ y desviación estándar σ.
2. El punto mas alto de la curva normal es la media, que también esla mediana y la moda de la distribución.
3. La media de la distribución puede ser cualquier valor numérico:negativo, cero, positivo.
4. La distribución normal es simétrica y su forma a la izquierda de lamedia es una imagen especular de la forma a la derecha de lamedia.
5. La desviación estándar (σ) determina el ancho de la curva. Avalores mayores de σ se tienen curvas mas anchas y bajas, quemuestran una mayor dispersión en los datos.
6. Las probabilidades para la variable aleatoria normal están dadaspor áreas bajo la curva. El área total bajo la curva para ladistribución de probabilidad normal es 1.
DISTRIBUCIÓN NORMAL
17/02/2011
10
La media determina el valor central de la curva. A diferentes valoresde µ se tienen curvas que se desplazan a la izquierda o a la derechasegún la media.
( ) 2)( , )( :entonces ; ~ Si σµσµ == XVXENX
Corolario:
Donde Z es una variable aleatoria Normal Estándar.
En consecuencia:
( ) ( )1 ;0 ~ :entonces ; ~ Si ==−= σµσ
µσµ NX
ZNX
( ) ( ) ?6 2 ; 5~ Si =<⇒== XPNX σµ
( ) ( )5.02
566 <=
−<−=< ZPX
PXPσ
µ
17/02/2011
11
La P(Z<0.5) se obtiene mediante su función de densidad:
El anterior valor se puede obtener por herramientas computacionales:
R: pnorm(6,5,2) = pnorm(0.5,0,1) = 0.6914
Excel: DISTR.NORM(6;5;2;1) = DISTR.NORM.ESTAND(0.5) = 0.6914
O a través del uso de tablas para la distribución Normal Estándardonde aparece tabulado la probabilidad para distintos valores de Z.
( )
( ) ∫
∫
∞−
−
∞−
−−
=<
=<
5.0
21
62
1
2
2
2
15.0
2
16
dzeZP
dxeXP
Z
x
πσ
πσσ
µ
17/02/2011
12
Una maquina despachadora de gaseosa esta ajustada para servir enpromedio 200 mililitros (ml) por vaso. Si la cantidad de gaseosa seasemeja a una distribución normal con una desviación estándar de 15 ml,¿Cuál es la probabilidad de que un vaso contenga entre 190 y 210 ml?
EJEMPLO
X=“Cantidad de gaseosa despachada (ml)”
17/02/2011
13
EJEMPLO
Distribución del llenado de las botellas :
( )15,200~ == σµNX
( )
( )( ) ( )
4908.0
2546.07454.0
0.66ZP0.66ZP
66.066.0
15
200210
15
200190200190
=−=
−<−<=<<−=
−<−<−=<<
ZP
XPXP
σµ
Probabilidad de que este entre 190 y 210:
El 49.08% de los vasos tendrán llenados entre 190 y 210 ml.
EJERCICIOS
2. Si Z es una variable aleatoria Normal Estándar, determine lassiguientes probabilidades:
a. P(z < 1.20)b. P(0 < z < 1.96)c. P(z ≤ -0.71)d. P(z ≥ 1.96)e. P(-1.57 ≤ z ≤ 0)
3. Determine el valor de Z en cada casoa. El área a la derecha de z0 es 0.1314b. El área a la izquierda de z0 es 0.67c. El área entre 0 y z0 es 0.475d. El área entre -1 y z0 es 0.2291
17/02/2011
14
EJERCICIOS4. Un remache para la industria de la construcción es fabricado para
cumplir con una resistencia al esfuerzo cortante de 2000 libras porpulgada cuadrada (psi). Tenemos la posibilidad de fabricarlos con unade dos maquinas disponibles.
Las características de producción de cada una de las maquinas sepresenta enseguida:
Maquina 1:Produce con una resistencia media de 2300 psi y una desviaciónestándar de 150 psi.
Maquina 2:Produce una resistencia media de 2100 psi y con una desviaciónestándar de 33.3 psi.
Estime el porcentaje de remaches no conformes producidos en cadacaso.Alguien esta recomendando producir los remaches con la maquina 1,pues la resistencia media es mayor que la maquina 2. ¿Usted queopina?
EJERCICIOS
5. La distribución de la resistencia que tienen los resistores eléctricosde cierto tipo es normal, 10% de los resistores tienen unaresistencia mayor a 10.256 ohms y 5% una resistencia menor a9.671 ohms. ¿Cual es la media y la desviación de la distribución deresistencias? 10;0.2
6. Una maquina expendedora de refrescos puede ajustarse para quedespache en promedio µ onzas por vaso. Si el numero de onzasnecesarias para llenar un vaso tiene una distribución normal condesviación estándar de 0.3 onzas, encuentre el valor de µ necesariopara llenar un vaso de 8 onzas, de tal forma que solo se derrame el1% del líquido.
7. La maquina descrita anteriormente tiene una desviación estándarde σ, la cual puede fijarse en ciertos niveles ajustándolacuidadosamente. ¿Cuál es el máximo valor de σ que permite que lacantidad real despachada se encuentre a 0.5 onzas de la media conuna probabilidad de por lo menos 0.95?