distribuciones de probabilidad discretas y continuas

Distribuciones de Probabilidad Discretas y Continuas

DISTRIBUCIONES DE PROBABILIDAD

Una distribución de probabilidad indica toda la gama de valores que pueden

representarse como resultado de un experimento si éste se llevase a cabo.

Es decir, describe la probabilidad de que un evento se realice en el futuro, constituye una

herramienta fundamental para la prospectiva, puesto que se puede diseñar un escenario

de acontecimientos futuros considerando las tendencias actuales de diversos fenómenos

naturales

Toda distribución de probabilidad es generada por una variable (porque puede tomar

diferentes valores) aleatoria x (porque el valor tomado es totalmente al azar).

TIPOS DE DISTRIBUCIONES

Toda distribución de probabilidad es generada por una variable aleatoria x, la que puede

ser de dos tipos:

Variable aleatoria discreta (x)

Variable aleatoria continua (x)

Variable aleatoria discreta (x)

Se le denomina variable porque puede tomar diferentes valores, aleatoria, porque el

valor tomado es totalmente al azar y discreta porque solo puede tomar valores enteros y

un número finito de ellos.

Las distribuciones discretas incluidas en el módulo de “Cálculo de probabilidades” son:

> Binomial > Hipergeométrica

> Poisson > Geométrica

> Uniforme discreta > Binomial Negativa

DISTRIBUCIÓN BINOMIAL

En estadística, la distribución binomial es una distribución de probabilidad discreta que

cuenta el número de éxitos en una secuencia de n ensayos de Bernoulli independientes

entre sí, con una probabilidad fija p de ocurrencia del éxito entre los ensayos.

Un experimento de Bernoulli se caracteriza por ser dicotómico, esto es, sólo son posibles

dos resultados. A uno de estos se denomina éxito y tiene una probabilidad de

ocurrencia p y al otro, fracaso, con una probabilidad q = 1 - p.

En la distribución binomial el anterior experimento se repite n veces, de forma

independiente, y se trata de calcular la probabilidad de un determinado número de éxitos.

Para n = 1, la binomial se convierte, de hecho, en una distribución de Bernoulli.

Ejemplo:

¿Cuál es la probabilidad de obtener 6 caras al lanzar una moneda 10 veces?

" k " es el número de aciertos. En este ejemplo " k " igual a 6 (en cada acierto

decíamos que la variable toma el valor 1: como son 6 aciertos, entonces k =

6)

" n" es el número de ensayos. En nuestro ejemplo son 10

" p " es la probabilidad de éxito, es decir, que salga "cara" al lanzar la

moneda. Por lo tanto p = 0,5

La fórmula quedaría:

Luego: P (x = 6) = 0,205

Es decir, se tiene una probabilidad del 20,5% de obtener 6 caras al lanzar 10

veces una moneda.

https://es.wikipedia.org/wiki/Distribuci%C3%B3n_de_Bernoulli

https://es.wikipedia.org/wiki/Experimento_de_Bernoulli

https://es.wikipedia.org/wiki/Distribuci%C3%B3n_de_probabilidad

https://es.wikipedia.org/wiki/Estad%C3%ADstica

DISTRIBUCIÓN DE POISSON

la distribución de Poisson es una distribución de probabilidad discreta que expresa, a

partir de una frecuencia de ocurrencia media, la probabilidad de que ocurra un

determinado número de eventos durante cierto período de tiempo.

Concretamente, se especializa en la probabilidad de ocurrencia de sucesos con

probabilidades muy pequeñas, o sucesos "raros".

Propiedades

La función de masa o probabilidad de la distribución de Poisson es

Donde:

k es el número de ocurrencias del evento o fenómeno (la función nos da la

probabilidad de que el evento suceda precisamente k veces).

λ es un parámetro positivo que representa el número de veces que se espera que

ocurra el fenómeno durante un intervalo dado. Por ejemplo, si el suceso

estudiado tiene lugar en promedio 4 veces por minuto y estamos interesados en

la probabilidad de que ocurra kveces dentro de un intervalo de 10 minutos,

usaremos un modelo de distribución de Poisson con λ = 10×4 = 40.

e es la base de los logaritmos naturales (e = 2,71828...)

Tanto el valor esperado como la varianza de una variable aleatoria con distribución de

Poisson son iguales a λ.

La moda de una variable aleatoria de distribución de Poisson con un λ no entero es igual

a , el mayor de los enteros menores que λ (los símbolos representan la función

parte entera). Cuando λ es un entero positivo, las modas son λ y λ − 1.

https://es.wikipedia.org/wiki/Matem%C3%A1tica_discreta


Ejemplo:

2. En la inspección de hojalata producida por un proceso electrolítico continuo, se identifican 0.2 imperfecciones en promedio por minuto. Determine las probabilidades de identificar a) una imperfección en 3 minutos, b) al menos dos imperfecciones en 5 minutos, c) cuando más una imperfección en 15 minutos.

Solución:

a) x = variable que nos define el número de imperfecciones en la hojalata por cada 3 minutos = 0, 1, 2, 3, ., etc., etc.

= 0.2 x 3 =0.6 imperfecciones en promedio por cada 3 minutos en la hojalata

b) x = variable que nos define el número de imperfecciones en la hojalata por

cada 5 minutos = 0, 1, 2, 3, ...., etc., etc.

= 0.2 x 5 =1 imperfección en promedio por cada 5 minutos en la hojalata

=1-(0.367918+0.367918) = 0.26416

c) x = variable que nos define el número de imperfecciones en la hojalata por cada 15 minutos = 0, 1, 2, 3, ....., etc., etc.

= 0.2 x 15 = 3 imperfecciones en promedio por cada 15 minutos en la hojalata

= 0.0498026 + 0.149408 = 0.199210

DISTRIBUCIÓN UNIFORME DISCRETA

Describe el comportamiento de una variable discreta que puede tomar n valores distintos

con la misma probabilidad cada uno de ellos.

Esta distribución asigna igual probabilidad a todos los valores enteros entre el límite

inferior y el límite superior que definen el recorrido de la variable. Si la variable puede

tomar valores entre a y b, debe ocurrir que b sea mayor que a, y la variable toma los

valores enteros empezando por a, a+1, a+2, etc. hasta el valor máximo b.

Modeliza fenómenos en los que tenemos un conjunto de n sucesos posibles, cada uno

de los cuales con la misma probabilidad de ocurrir. Si aleatorizamos de forma que cada

uno de éstos sucesos se corresponda con un número natural del 1 al n obtendremos una

distribución uniforme. Tendremos un único parámetro n. Diremos , por tanto que

Puede hacerse derivar en consecuencia de un proceso experimental de selección

aleatoria, en el que la característica que consideramos en la selección sólo puede tomar

un conjunto de n valores discretos y donde cualquiera de estos valores puede obtenerse

con igual probabilidad. Por su elementaridad no es una distribución de excesivo interés

práctico.

Su función de cuantía definida para los valores de x ={ 1, 2, , n} vendrá dada por la

constante:

P(x) = l /n para x ={ 1, 2, , n}

Su función de distribución vendrá dada por

Puede comprobarse que su media será

su varianza será :

Ejemplo

Un ejemplo puede ser la variable X, puntuación en el lanzamiento de un dado regular.

Esta variable toma seis valores posibles, todos con la misma probabilidad p = 1/6. La

función de densidad de esta variable será:

f(k) = P[X = k] = 1/6 k = 1, 2, 3, 4, 5, 6

En general, si la variable X puede tomar n (k = 1, 2, ..., n) valores, todos con igual

probabilidad, su función de densidad será:

f(k) = P[X = k] = 1/n k = 1, 2, ..., n

DISTRIBUCIÓN HIPERGEOMÉTRICA

En teoría de la probabilidad la distribución hipergeométrica es una distribución discreta

relacionada con muestreos aleatorios y sin reemplazo. Supóngase que se tiene una

población de N elementos de los cuales, d pertenecen a la categoría A y N-d a la B.

La distribución hipergeométrica mide la probabilidad de obtener x ( )

elementos de la categoría A en una muestra sin reemplazo de n elementos de la

población original.

https://es.wikipedia.org/wiki/Muestreo_en_estad%C3%ADstica


https://es.wikipedia.org/wiki/Probabilidad

Propiedades

La función de probabilidad de una variable aleatoria con distribución hipergeométrica

puede deducirse a través de razonamientos combinatorios y es igual a

Donde

es el tamaño de población, es el tamaño de la muestra extraída, es el

número de elementos en la población original que pertenecen a la categoría deseada

y es el número de elementos en la muestra que pertenecen a dicha categoría.

La notación hace referencia al coeficiente binomial, es decir, el número de

combinaciones posibles al seleccionar elementos de un total .

El valor esperado de una variable aleatoria X que sigue la distribución

hipergeométrica es

y su varianza,

En la fórmula anterior, definiendo

y

se obtiene

la distribución hipergeométrica es aplicable a muestreos sin reemplazo y la binomial a

muestreos con reemplazo. En situaciones en las que el número esperado de repeticiones

en el muestreo es presumiblemente bajo, puede aproximarse la primera por la segunda.

Esto es así cuando N es grande y el tamaño relativo de la muestra extraída, n/N, es

pequeño.

Ejemplo

2. De un lote de 10 proyectiles, 4 se seleccionan al azar y se disparan. Si el lote

contiene 3 proyectiles defectuosos que no explotarán, ¿cuál es la probabilidad de

que, a) los 4 exploten?, b) al menos 2 no exploten?

Solución:

a) N = 10 proyectiles en total

a = 7 proyectiles que explotan

n = 4 proyectiles seleccionados

x = 0, 1, 2, 3 o 4 proyectiles que explotan = variable que nos define el número de

proyectiles que explotan entre la muestra que se dispara

b) N = 10 proyectiles en total

a = 3 proyectiles que no explotan

n = 4 proyectiles seleccionados

x = 0, 1, 2 o 3 proyectiles que no explotan

p(al menos 2 no exploten) = p( 2 o más proyectiles no exploten)

= p(x = 2 o 3; n=4)

DISTRIBUCIÓN GEOMÉTRICA

La distribución geométrica es cualquiera de las dos distribuciones de probabilidad discretas siguientes:

la distribución de probabilidad del número X del ensayo de Bernoulli necesaria

para obtener un éxito, contenido en el conjunto { 1, 2, 3,...} o

la distribución de probabilidad del número Y = X − 1 de fallos antes del primer

éxito, contenido en el conjunto { 0, 1, 2, 3,... }.

Cuál de éstas es la que uno llama "la" distribución geométrica, es una cuestión de

convención y conveniencia.

EJEMPLO

1. Sí la probabilidad de que un cierto dispositivo de medición muestre una desviación excesiva es de 0.05, ¿cuál es la probabilidad de que; a) el sexto de estos dispositivos de medición sometidos a prueba sea el primero en mostrar una desviación excesiva?, b) el séptimo de estos dispositivos de medición sometidos a prueba, sea el primero que no muestre una desviación excesiva?.

Solución:

a) x = 6 que el sexto dispositivo de medición probado sea el primero que muestre una variación excesivap = 0.05 =probabilidad de que un dispositivo de medición muestre una

variación excesivaq = 0.95 =probabilidad de que un dispositivo de medición no muestre una

variación excesiva

p(x = 6) = b) x = 5 que el quinto dispositivo de medición probado, sea el primero que

no muestre una desviación excesiva

p = 0.95 = probabilidad de que un dispositivo de medición no muestre una variación excesiva

q = 0.05 = probabilidad de que un dispositivo de medición muestre una

variación excesiva

p(x = 5) =

DISTRIBUCIÓN BINOMIAL NEGATIVA

la distribución binomial negativa es una distribución de probabilidad discreta que incluye

a la distribución de Pascal.

El número de experimentos de Bernoulli de parámetro independientes realizados hasta

la consecución del k-ésimo éxito es una variable aleatoria que tiene una distribución

binomial negativa con parámetros k y .

La distribución geométrica es el caso concreto de la binomial negativa cuando k = 1.

EJEMPLO

Los registros de una compañía constructora de pozos, indican que la probabilidad de

que uno de sus pozos nuevos, requiera de reparaciones en el término de un año es

de 0.20. a) ¿Cuál es la probabilidad de que el sexto pozo construido por esta

compañía en un año dado sea el segundo en requerir reparaciones en un año?.

b) ¿Cuál es la probabilidad de que el octavo pozo construido por esta compañía en

un año dado sea el tercero en requerir reparaciones en un año?.

Solución:

a) k = 6 pozos r = 2 pozos que requieren reparaciones en un año p = p(pozo requiera reparaciones en un año) = 0.20 q = p(pozo no requiera reparaciones en un año) = 0.80

p(Y = 6) = b) k = 8 pozos r = 3 pozos que requieren reparaciones en un año p = p(pozo requiera reparaciones en un año) = 0.20 q = p(pozo no requiera reparaciones en un año) = 0.80

https://es.wikipedia.org/wiki/Distribuci%C3%B3n_geom%C3%A9trica

https://es.wikipedia.org/wiki/Experimento_de_Bernoulli


p(Y = 8) =

Variable aleatoria continua (x)

Una distribución de probabilidad se llama continua si su función de distribución es continua.

Puesto que la función de distribución de una variable aleatoria X viene dada

por , la definición implica que en una distribución de probabilidad

continua X se cumple P[X = a] = 0 para todo número real a, esto es, la probabilidad de

que X tome el valor a es cero para cualquier valor de a.

Si la distribución de X es continua, se llama a X variable aleatoria continua.

En las distribuciones de probabilidad continuas, la distribución de probabilidad es la integral

de la función de densidad, por lo que tenemos entonces que:

Para una variable continua hay infinitos valores posibles de la variable y entre cada dos de

ellos se pueden definir infinitos valores más.

En estas condiciones no es posible deducir la probabilidad de un valor puntual de la variable;

como se puede hacer en el caso de variables discretas, pero es posible calcular la

probabilidad acumulada hasta un cierto valor (función de distribución de probabilidad), y se

puede analizar cómo cambia la probabilidad acumulada en cada punto (estos cambios no son

probabilidades sino otro concepto: la función de densidad.

Las distribuciones continuas incluidas en el módulo de “Generación de distribuciones” son:

Normal

Normal estandar

https://es.wikipedia.org/wiki/Funci%C3%B3n_de_densidad


Logística

DISTRIBUCIÓN NORMAL

En estadística y probabilidad se llama distribución normal, distribución de

Gauss o distribución gaussiana, a una de las distribuciones de probabilidadde variable

continua que con más frecuencia aparece aproximada en fenómenos reales

La gráfica de su función de densidad tiene una forma acampanada y es simétrica

respecto de un determinado parámetro estadístico. Esta curva se conoce como campana

de Gauss y es el gráfico de una función gaussiana.

La importancia de esta distribución radica en que permite modelar numerosos fenómenos

naturales, sociales y psicológicos. Mientras que los mecanismos que subyacen a gran

parte de este tipo de fenómenos son desconocidos, por la enorme cantidad de variables

incontrolables que en ellos intervienen, el uso del modelo normal puede justificarse

asumiendo que cada observación se obtiene como la suma de unas pocas causas

independientes.

Algunos ejemplos de variables asociadas a fenómenos naturales que siguen el modelo

de la normal son:

caracteres morfológicos de individuos como la estatura;

caracteres fisiológicos como el efecto de un fármaco;

caracteres sociológicos como el consumo de cierto producto por un mismo grupo

de individuos;

caracteres psicológicos como el cociente intelectual;

nivel de ruido en telecomunicaciones;

errores cometidos al medir ciertas magnitudes

Propiedad:

No importa cuáles sean los valores de µ y σ para una distribución de probabilidad

https://es.wikipedia.org/wiki/Modelo_matem%C3%A1tico

https://es.wikipedia.org/wiki/Funci%C3%B3n_gaussiana

https://es.wikipedia.org/wiki/Campana_de_Gauss

https://es.wikipedia.org/wiki/Campana_de_Gauss

https://es.wikipedia.org/wiki/Par%C3%A1metro_estad%C3%ADstico

https://es.wikipedia.org/wiki/Funci%C3%B3n_de_densidad

https://es.wikipedia.org/wiki/Gr%C3%A1fica

https://es.wikipedia.org/wiki/Distribuci%C3%B3n_de_probabilidad#Distribuciones_de_variable_continua

https://es.wikipedia.org/wiki/Distribuci%C3%B3n_de_probabilidad#Distribuciones_de_variable_continua


https://es.wikipedia.org/wiki/Teor%C3%ADa_de_probabilidades

https://es.wikipedia.org/wiki/Estad%C3%ADstica

normal, el área total bajo la curva siempre es 1, de manera que podemos pensar en

áreas bajo la curva como si fueran probabilidades. Matemáticamente es verdad que:

Aproximadamente el 68% de todos los valores de una población normalmente distribuida

se encuentra dentro de ± 1 desviación estándar de la media.

Aproximadamente el 95.5% de todos los valores de una población normalmente

distribuida se encuentra dentro de ± 2 desviaciones estándar de la media.

Aproximadamente el 99.7% de todos los valores de una población normalmente

distribuida se encuentra dentro de ± 3 desviaciones estándar de la media.

El valor de z está derivado de la fórmula:

Distribución normal que ilustra la comparación de los valores de z y las

desviaciones estándar.

EJEMPLO

La vida media de una lámpara, según el fabricante, es de 68 meses, con una desviación típica de 5. Se supone que se distribuye según una distribución normal En un lote de 10.000 lámparas. a) ¿Cuántas lámparas superarán previsiblemente los 75 meses?. b) ¿Cuántos lámparas se estropearán antes de 60 meses?

SOLUCION

a)

t = (75 -68)/5 = 1,4

P (X > 75) = (t > 1,4) = 1 - P (t ≤ 1,4) = 1 - 0,9192 = 0,0808

Luego, el 8,08% de las lámparas (808 lámparas) superarán los 75 meses

b)

t = (60 -68)/5 = -1,6

P (X ≤ 60) = (t ≤ -1,6) = P (t> 1,6) = 1 - P (t ≤ 1,6) = 0,0548

Luego, el 5,48% del lote (548 lámparas) no llegarán probablemente a durar 60 meses

NORMAL ESTANDAR

La distribución normal estándar, o tipificada o reducida, es aquella que tiene por media el

valor cero, μ = 0, y por desviación típica la unidad, σ =1.

Su función de densidad es:

Su gráfica es:

Tipificación de la variable

Para poder uti l izar la tabla tenemos que transformar la variable X que

sigue una distribución N(μ, σ) en otra variable Z que siga una

distribución N(0, 1) .

EJEMPLO

Si X es una variable aleatoria de una distribución N( µ, s ) , hallar : p(µ-3s= X=µ + 3 s ).

DISTRIBUCIÓN EXPONENCIAL

Es un caso particular de la distribución gamma cuando α = 1. Su función de densidad es:

Su parámetro es β.

La media y la varianza de la distribución exponencial son:

DISTRIBUCIÓN CHI-CUADRADO (C2)

Es otro caso particular de la distribución gamma para el caso β = 2 y α = n / 2, siendo n un

número natural.

Su función de densidad es:

El parámetro de la distribución c2 es n y su media y su varianza son, respectivamente:

Otra forma de definir la distribución c2 es la siguiente: Supongamos que tenemos n

variables aleatorias normales independientes, X1,..., Xn, con media μi y varianza (i =

1 ... n), la variable definida como

Tiene distribución c2 con n grados de libertad y se le denomina c2n.

Variables chi-cuadrado con valores de progresivamente mayores son cada vez menos

asimétricas.

DISTRIBUCIÓN T DE STUDENT

Supongamos dos variables aleatorias independientes, una normal tipificada, Z, y otra con

distribución c2 con n grados de libertad, la variable definida según la ecuación:

Tiene distribución t con n grados de libertad.

La función de densidad de la distribución t es:

El parámetro de la distribución t es n, su número de grados de libertad.

Esta distribución es simétrica respecto al eje Y y sus colas se aproximan asintóticamente

al eje X. Es similar a la distribución Z salvo que es platicúrtica y, por tanto, más aplanada.

Cuando n tiende a infinito, t tiende asintóticamente a Z y se pueden considerar

prácticamente iguales para valores de n mayores o iguales que 30.

Variables T con valores de n progresivamente mayores son cada vez menos platicúrticas.

Comparación entre la variable T y la normal tipificada.

distribuciones de probabilidad discretas y continuas

Documents