distribuciones de probabilidad discretas y continuas
DESCRIPTION
estadistica ITRANSCRIPT
Distribuciones de Probabilidad Discretas y Continuas
DISTRIBUCIONES DE PROBABILIDAD
Una distribución de probabilidad indica toda la gama de valores que pueden
representarse como resultado de un experimento si éste se llevase a cabo.
Es decir, describe la probabilidad de que un evento se realice en el futuro, constituye una
herramienta fundamental para la prospectiva, puesto que se puede diseñar un escenario
de acontecimientos futuros considerando las tendencias actuales de diversos fenómenos
naturales
Toda distribución de probabilidad es generada por una variable (porque puede tomar
diferentes valores) aleatoria x (porque el valor tomado es totalmente al azar).
TIPOS DE DISTRIBUCIONES
Toda distribución de probabilidad es generada por una variable aleatoria x, la que puede
ser de dos tipos:
Variable aleatoria discreta (x)
Variable aleatoria continua (x)
Variable aleatoria discreta (x)
Se le denomina variable porque puede tomar diferentes valores, aleatoria, porque el
valor tomado es totalmente al azar y discreta porque solo puede tomar valores enteros y
un número finito de ellos.
Las distribuciones discretas incluidas en el módulo de “Cálculo de probabilidades” son:
> Binomial > Hipergeométrica
> Poisson > Geométrica
> Uniforme discreta > Binomial Negativa
DISTRIBUCIÓN BINOMIAL
En estadística, la distribución binomial es una distribución de probabilidad discreta que
cuenta el número de éxitos en una secuencia de n ensayos de Bernoulli independientes
entre sí, con una probabilidad fija p de ocurrencia del éxito entre los ensayos.
Un experimento de Bernoulli se caracteriza por ser dicotómico, esto es, sólo son posibles
dos resultados. A uno de estos se denomina éxito y tiene una probabilidad de
ocurrencia p y al otro, fracaso, con una probabilidad q = 1 - p.
En la distribución binomial el anterior experimento se repite n veces, de forma
independiente, y se trata de calcular la probabilidad de un determinado número de éxitos.
Para n = 1, la binomial se convierte, de hecho, en una distribución de Bernoulli.
Ejemplo:
¿Cuál es la probabilidad de obtener 6 caras al lanzar una moneda 10 veces?
" k " es el número de aciertos. En este ejemplo " k " igual a 6 (en cada acierto
decíamos que la variable toma el valor 1: como son 6 aciertos, entonces k =
6)
" n" es el número de ensayos. En nuestro ejemplo son 10
" p " es la probabilidad de éxito, es decir, que salga "cara" al lanzar la
moneda. Por lo tanto p = 0,5
La fórmula quedaría:
Luego: P (x = 6) = 0,205
Es decir, se tiene una probabilidad del 20,5% de obtener 6 caras al lanzar 10
veces una moneda.
DISTRIBUCIÓN DE POISSON
la distribución de Poisson es una distribución de probabilidad discreta que expresa, a
partir de una frecuencia de ocurrencia media, la probabilidad de que ocurra un
determinado número de eventos durante cierto período de tiempo.
Concretamente, se especializa en la probabilidad de ocurrencia de sucesos con
probabilidades muy pequeñas, o sucesos "raros".
Propiedades
La función de masa o probabilidad de la distribución de Poisson es
Donde:
k es el número de ocurrencias del evento o fenómeno (la función nos da la
probabilidad de que el evento suceda precisamente k veces).
λ es un parámetro positivo que representa el número de veces que se espera que
ocurra el fenómeno durante un intervalo dado. Por ejemplo, si el suceso
estudiado tiene lugar en promedio 4 veces por minuto y estamos interesados en
la probabilidad de que ocurra kveces dentro de un intervalo de 10 minutos,
usaremos un modelo de distribución de Poisson con λ = 10×4 = 40.
e es la base de los logaritmos naturales (e = 2,71828...)
Tanto el valor esperado como la varianza de una variable aleatoria con distribución de
Poisson son iguales a λ.
La moda de una variable aleatoria de distribución de Poisson con un λ no entero es igual
a , el mayor de los enteros menores que λ (los símbolos representan la función
parte entera). Cuando λ es un entero positivo, las modas son λ y λ − 1.
Ejemplo:
2. En la inspección de hojalata producida por un proceso electrolítico continuo, se identifican 0.2 imperfecciones en promedio por minuto. Determine las probabilidades de identificar a) una imperfección en 3 minutos, b) al menos dos imperfecciones en 5 minutos, c) cuando más una imperfección en 15 minutos.
Solución:
a) x = variable que nos define el número de imperfecciones en la hojalata por cada 3 minutos = 0, 1, 2, 3, ., etc., etc.
= 0.2 x 3 =0.6 imperfecciones en promedio por cada 3 minutos en la hojalata
b) x = variable que nos define el número de imperfecciones en la hojalata por
cada 5 minutos = 0, 1, 2, 3, ...., etc., etc.
= 0.2 x 5 =1 imperfección en promedio por cada 5 minutos en la hojalata
=1-(0.367918+0.367918) = 0.26416
c) x = variable que nos define el número de imperfecciones en la hojalata por cada 15 minutos = 0, 1, 2, 3, ....., etc., etc.
= 0.2 x 15 = 3 imperfecciones en promedio por cada 15 minutos en la hojalata
= 0.0498026 + 0.149408 = 0.199210
DISTRIBUCIÓN UNIFORME DISCRETA
Describe el comportamiento de una variable discreta que puede tomar n valores distintos
con la misma probabilidad cada uno de ellos.
Esta distribución asigna igual probabilidad a todos los valores enteros entre el límite
inferior y el límite superior que definen el recorrido de la variable. Si la variable puede
tomar valores entre a y b, debe ocurrir que b sea mayor que a, y la variable toma los
valores enteros empezando por a, a+1, a+2, etc. hasta el valor máximo b.
Modeliza fenómenos en los que tenemos un conjunto de n sucesos posibles, cada uno
de los cuales con la misma probabilidad de ocurrir. Si aleatorizamos de forma que cada
uno de éstos sucesos se corresponda con un número natural del 1 al n obtendremos una
distribución uniforme. Tendremos un único parámetro n. Diremos , por tanto que
Puede hacerse derivar en consecuencia de un proceso experimental de selección
aleatoria, en el que la característica que consideramos en la selección sólo puede tomar
un conjunto de n valores discretos y donde cualquiera de estos valores puede obtenerse
con igual probabilidad. Por su elementaridad no es una distribución de excesivo interés
práctico.
Su función de cuantía definida para los valores de x ={ 1, 2, , n} vendrá dada por la
constante:
P(x) = l /n para x ={ 1, 2, , n}
Su función de distribución vendrá dada por
Puede comprobarse que su media será
su varianza será :
Ejemplo
Un ejemplo puede ser la variable X, puntuación en el lanzamiento de un dado regular.
Esta variable toma seis valores posibles, todos con la misma probabilidad p = 1/6. La
función de densidad de esta variable será:
f(k) = P[X = k] = 1/6 k = 1, 2, 3, 4, 5, 6
En general, si la variable X puede tomar n (k = 1, 2, ..., n) valores, todos con igual
probabilidad, su función de densidad será:
f(k) = P[X = k] = 1/n k = 1, 2, ..., n
DISTRIBUCIÓN HIPERGEOMÉTRICA
En teoría de la probabilidad la distribución hipergeométrica es una distribución discreta
relacionada con muestreos aleatorios y sin reemplazo. Supóngase que se tiene una
población de N elementos de los cuales, d pertenecen a la categoría A y N-d a la B.
La distribución hipergeométrica mide la probabilidad de obtener x ( )
elementos de la categoría A en una muestra sin reemplazo de n elementos de la
población original.
Propiedades
La función de probabilidad de una variable aleatoria con distribución hipergeométrica
puede deducirse a través de razonamientos combinatorios y es igual a
Donde
es el tamaño de población, es el tamaño de la muestra extraída, es el
número de elementos en la población original que pertenecen a la categoría deseada
y es el número de elementos en la muestra que pertenecen a dicha categoría.
La notación hace referencia al coeficiente binomial, es decir, el número de
combinaciones posibles al seleccionar elementos de un total .
El valor esperado de una variable aleatoria X que sigue la distribución
hipergeométrica es
y su varianza,
En la fórmula anterior, definiendo
y
se obtiene
la distribución hipergeométrica es aplicable a muestreos sin reemplazo y la binomial a
muestreos con reemplazo. En situaciones en las que el número esperado de repeticiones
en el muestreo es presumiblemente bajo, puede aproximarse la primera por la segunda.
Esto es así cuando N es grande y el tamaño relativo de la muestra extraída, n/N, es
pequeño.
Ejemplo
2. De un lote de 10 proyectiles, 4 se seleccionan al azar y se disparan. Si el lote
contiene 3 proyectiles defectuosos que no explotarán, ¿cuál es la probabilidad de
que, a) los 4 exploten?, b) al menos 2 no exploten?
Solución:
a) N = 10 proyectiles en total
a = 7 proyectiles que explotan
n = 4 proyectiles seleccionados
x = 0, 1, 2, 3 o 4 proyectiles que explotan = variable que nos define el número de
proyectiles que explotan entre la muestra que se dispara
b) N = 10 proyectiles en total
a = 3 proyectiles que no explotan
n = 4 proyectiles seleccionados
x = 0, 1, 2 o 3 proyectiles que no explotan
p(al menos 2 no exploten) = p( 2 o más proyectiles no exploten)
= p(x = 2 o 3; n=4)
DISTRIBUCIÓN GEOMÉTRICA
La distribución geométrica es cualquiera de las dos distribuciones de probabilidad discretas siguientes:
la distribución de probabilidad del número X del ensayo de Bernoulli necesaria
para obtener un éxito, contenido en el conjunto { 1, 2, 3,...} o
la distribución de probabilidad del número Y = X − 1 de fallos antes del primer
éxito, contenido en el conjunto { 0, 1, 2, 3,... }.
Cuál de éstas es la que uno llama "la" distribución geométrica, es una cuestión de
convención y conveniencia.
EJEMPLO
1. Sí la probabilidad de que un cierto dispositivo de medición muestre una desviación excesiva es de 0.05, ¿cuál es la probabilidad de que; a) el sexto de estos dispositivos de medición sometidos a prueba sea el primero en mostrar una desviación excesiva?, b) el séptimo de estos dispositivos de medición sometidos a prueba, sea el primero que no muestre una desviación excesiva?.
Solución:
a) x = 6 que el sexto dispositivo de medición probado sea el primero que muestre una variación excesivap = 0.05 =probabilidad de que un dispositivo de medición muestre una
variación excesivaq = 0.95 =probabilidad de que un dispositivo de medición no muestre una
variación excesiva
p(x = 6) = b) x = 5 que el quinto dispositivo de medición probado, sea el primero que
no muestre una desviación excesiva
p = 0.95 = probabilidad de que un dispositivo de medición no muestre una variación excesiva
q = 0.05 = probabilidad de que un dispositivo de medición muestre una
variación excesiva
p(x = 5) =
DISTRIBUCIÓN BINOMIAL NEGATIVA
la distribución binomial negativa es una distribución de probabilidad discreta que incluye
a la distribución de Pascal.
El número de experimentos de Bernoulli de parámetro independientes realizados hasta
la consecución del k-ésimo éxito es una variable aleatoria que tiene una distribución
binomial negativa con parámetros k y .
La distribución geométrica es el caso concreto de la binomial negativa cuando k = 1.
EJEMPLO
Los registros de una compañía constructora de pozos, indican que la probabilidad de
que uno de sus pozos nuevos, requiera de reparaciones en el término de un año es
de 0.20. a) ¿Cuál es la probabilidad de que el sexto pozo construido por esta
compañía en un año dado sea el segundo en requerir reparaciones en un año?.
b) ¿Cuál es la probabilidad de que el octavo pozo construido por esta compañía en
un año dado sea el tercero en requerir reparaciones en un año?.
Solución:
a) k = 6 pozos r = 2 pozos que requieren reparaciones en un año p = p(pozo requiera reparaciones en un año) = 0.20 q = p(pozo no requiera reparaciones en un año) = 0.80
p(Y = 6) = b) k = 8 pozos r = 3 pozos que requieren reparaciones en un año p = p(pozo requiera reparaciones en un año) = 0.20 q = p(pozo no requiera reparaciones en un año) = 0.80
p(Y = 8) =
Variable aleatoria continua (x)
Una distribución de probabilidad se llama continua si su función de distribución es continua.
Puesto que la función de distribución de una variable aleatoria X viene dada
por , la definición implica que en una distribución de probabilidad
continua X se cumple P[X = a] = 0 para todo número real a, esto es, la probabilidad de
que X tome el valor a es cero para cualquier valor de a.
Si la distribución de X es continua, se llama a X variable aleatoria continua.
En las distribuciones de probabilidad continuas, la distribución de probabilidad es la integral
de la función de densidad, por lo que tenemos entonces que:
Para una variable continua hay infinitos valores posibles de la variable y entre cada dos de
ellos se pueden definir infinitos valores más.
En estas condiciones no es posible deducir la probabilidad de un valor puntual de la variable;
como se puede hacer en el caso de variables discretas, pero es posible calcular la
probabilidad acumulada hasta un cierto valor (función de distribución de probabilidad), y se
puede analizar cómo cambia la probabilidad acumulada en cada punto (estos cambios no son
probabilidades sino otro concepto: la función de densidad.
Las distribuciones continuas incluidas en el módulo de “Generación de distribuciones” son:
Normal
Normal estandar
Logística
DISTRIBUCIÓN NORMAL
En estadística y probabilidad se llama distribución normal, distribución de
Gauss o distribución gaussiana, a una de las distribuciones de probabilidadde variable
continua que con más frecuencia aparece aproximada en fenómenos reales
La gráfica de su función de densidad tiene una forma acampanada y es simétrica
respecto de un determinado parámetro estadístico. Esta curva se conoce como campana
de Gauss y es el gráfico de una función gaussiana.
La importancia de esta distribución radica en que permite modelar numerosos fenómenos
naturales, sociales y psicológicos. Mientras que los mecanismos que subyacen a gran
parte de este tipo de fenómenos son desconocidos, por la enorme cantidad de variables
incontrolables que en ellos intervienen, el uso del modelo normal puede justificarse
asumiendo que cada observación se obtiene como la suma de unas pocas causas
independientes.
Algunos ejemplos de variables asociadas a fenómenos naturales que siguen el modelo
de la normal son:
caracteres morfológicos de individuos como la estatura;
caracteres fisiológicos como el efecto de un fármaco;
caracteres sociológicos como el consumo de cierto producto por un mismo grupo
de individuos;
caracteres psicológicos como el cociente intelectual;
nivel de ruido en telecomunicaciones;
errores cometidos al medir ciertas magnitudes
Propiedad:
No importa cuáles sean los valores de µ y σ para una distribución de probabilidad
normal, el área total bajo la curva siempre es 1, de manera que podemos pensar en
áreas bajo la curva como si fueran probabilidades. Matemáticamente es verdad que:
Aproximadamente el 68% de todos los valores de una población normalmente distribuida
se encuentra dentro de ± 1 desviación estándar de la media.
Aproximadamente el 95.5% de todos los valores de una población normalmente
distribuida se encuentra dentro de ± 2 desviaciones estándar de la media.
Aproximadamente el 99.7% de todos los valores de una población normalmente
distribuida se encuentra dentro de ± 3 desviaciones estándar de la media.
El valor de z está derivado de la fórmula:
Distribución normal que ilustra la comparación de los valores de z y las
desviaciones estándar.
EJEMPLO
La vida media de una lámpara, según el fabricante, es de 68 meses, con una desviación típica de 5. Se supone que se distribuye según una distribución normal En un lote de 10.000 lámparas. a) ¿Cuántas lámparas superarán previsiblemente los 75 meses?. b) ¿Cuántos lámparas se estropearán antes de 60 meses?
SOLUCION
a)
t = (75 -68)/5 = 1,4
P (X > 75) = (t > 1,4) = 1 - P (t ≤ 1,4) = 1 - 0,9192 = 0,0808
Luego, el 8,08% de las lámparas (808 lámparas) superarán los 75 meses
b)
t = (60 -68)/5 = -1,6
P (X ≤ 60) = (t ≤ -1,6) = P (t> 1,6) = 1 - P (t ≤ 1,6) = 0,0548
Luego, el 5,48% del lote (548 lámparas) no llegarán probablemente a durar 60 meses
NORMAL ESTANDAR
La distribución normal estándar, o tipificada o reducida, es aquella que tiene por media el
valor cero, μ = 0, y por desviación típica la unidad, σ =1.
Su función de densidad es:
Su gráfica es:
Tipificación de la variable
Para poder uti l izar la tabla tenemos que transformar la variable X que
sigue una distribución N(μ, σ) en otra variable Z que siga una
distribución N(0, 1) .
EJEMPLO
Si X es una variable aleatoria de una distribución N( µ, s ) , hallar : p(µ-3s= X=µ + 3 s ).
DISTRIBUCIÓN EXPONENCIAL
Es un caso particular de la distribución gamma cuando α = 1. Su función de densidad es:
Su parámetro es β.
La media y la varianza de la distribución exponencial son:
DISTRIBUCIÓN CHI-CUADRADO (C2)
Es otro caso particular de la distribución gamma para el caso β = 2 y α = n / 2, siendo n un
número natural.
Su función de densidad es:
El parámetro de la distribución c2 es n y su media y su varianza son, respectivamente:
Otra forma de definir la distribución c2 es la siguiente: Supongamos que tenemos n
variables aleatorias normales independientes, X1,..., Xn, con media μi y varianza (i =
1 ... n), la variable definida como
Tiene distribución c2 con n grados de libertad y se le denomina c2n.
Variables chi-cuadrado con valores de progresivamente mayores son cada vez menos
asimétricas.
DISTRIBUCIÓN T DE STUDENT
Supongamos dos variables aleatorias independientes, una normal tipificada, Z, y otra con
distribución c2 con n grados de libertad, la variable definida según la ecuación:
Tiene distribución t con n grados de libertad.
La función de densidad de la distribución t es:
El parámetro de la distribución t es n, su número de grados de libertad.
Esta distribución es simétrica respecto al eje Y y sus colas se aproximan asintóticamente
al eje X. Es similar a la distribución Z salvo que es platicúrtica y, por tanto, más aplanada.
Cuando n tiende a infinito, t tiende asintóticamente a Z y se pueden considerar
prácticamente iguales para valores de n mayores o iguales que 30.
Variables T con valores de n progresivamente mayores son cada vez menos platicúrticas.
Comparación entre la variable T y la normal tipificada.