datos azar

14
CAPÍTULO 2 Probabilidad Condicional Recordemos que el concepto de “probabilidad” se puede considerar a lo menos de dos formas: I. Teoría de Von Mises: P( A )=Lím n→∞ ( n A n ) , esto es, tendencia del número de veces que ocurre A II. Axiomática de Kolmogorov (1933): para un espacio muestral S, con A i A j = Φ , ij 1) P( A )≥0 para todo evento A 2) P( S )=1 3) a) P ( ¿ i=1 n ) A i = i=1 n P( A i ) b) P ( ¿ i=1 ) A i = i=1 P ( A i ) En un curso de 40 estudiantes, de un total de 15 varones 10 están en el electivo de E. Musical y 5 en A. Visuales. Mientras que de las mujeres 15 de ellas están en E. Musical. Si se elige un estudiante al azar para que represente al Colegio en una muestra artística, y este resulta ser varón ¿Cuál es la probabilidad de que esté cursando A. Visuales? Preguntas típicas para cálculo de probabilidades: 1) Probabilidad de que un estudiante curse Artes Visuales. 2) Probabilidad de que un varón esté cursando A. Musicales. 3) Probabilidad de que curse A. Visuales, sabiendo previamente que es varón. El primer caso trata de una probabilidad simple: P( V )= Casos Favorables Total de CasosPosibles = 15 40 Quince estudian A . v Cuarenta en total Al segundo y tercer caso se le impone una condición, que sea un varón el que estudia un curso en particular. En esta variante interviene la relación definida como probabilidad condicional: Probabilidad de que ocurra un evento cuando se sabe que otro ya sucedió”. El tercer caso remite (condiciona) como total de casos posibles, al N° de eventos sólo de los varones.

Upload: caupolican-catrileo-cuitino

Post on 07-Jul-2016

279 views

Category:

Documents


0 download

DESCRIPTION

Probabilidad condicional

TRANSCRIPT

Page 1: Datos Azar

CAPÍTULO 2

Probabilidad CondicionalRecordemos que el concepto de “probabilidad” se puede considerar a lo menos de dos formas:

I. Teoría de Von Mises: P( A )=Lím

n→∞( nA

n ), esto es, tendencia del número de veces que ocurre A

II. Axiomática de Kolmogorov (1933): para un espacio muestral S, con Ai∩A j=Φ , i≠ j

1) P( A )≥0 para todo evento A

2) P( S )=1

3) a)P( ¿

i=1

n ) Ai=∑i=1

n

P(A i )

b)P( ¿

i=1

)A i=∑i=1

P(A i )

En un curso de 40 estudiantes, de un total de 15 varones 10 están en el electivo de E. Musical y 5 en A. Visuales. Mientras que de las mujeres 15 de ellas están en E. Musical.Si se elige un estudiante al azar para que represente al Colegio en una muestra artística, y este

resulta ser varón ¿Cuál es la probabilidad de que esté cursando A. Visuales?

Preguntas típicas para cálculo de probabilidades: 1) Probabilidad de que un estudiante curse Artes Visuales.2) Probabilidad de que un varón esté cursando A. Musicales.3) Probabilidad de que curse A. Visuales, sabiendo previamente que es varón.

El primer caso trata de una probabilidad simple:

P(V )= N ° Casos FavorablesN ° Total de Casos Posibles

=1540

← Quince estudian A .v← Cuarenta en total

Al segundo y tercer caso se le impone una condición, que sea un varón el que estudia un curso en particular. En esta variante interviene la relación definida como probabilidad condicional:

“Probabilidad de que ocurra un evento cuando se sabe que otro ya sucedió”.

El tercer caso remite (condiciona) como total de casos posibles, al N° de eventos sólo de los varones.La relación define la probabilidad de que

suceda el evento A, sabiendo que B ya ocurrió.

Análisis por tabla de contingencia:

Artes visual

es

Artes Musical

esTOTAL

N° de alumnos 5 10 15N° de Alumnas 10 15 25TOTAL 15 25 40

Page 2: Datos Azar

Siendo P( A∩B ) la probabilidad de que concurran dos eventos para el total de casos.Para el segundo caso, la probabilidad de que un varón (H) esté cursando A. Musicales (Am):

Directamente sería: P(H∩Am )=10

40= 1

4 ← Diez casos favorables

← Cuarenta estudiantes en total

Algebraicamente: P(H∩Am )=P(H )P( Am/H )⇒ P(H∩Am )=15

40⋅1015

= 14

Para el tercer caso, probabilidad de que curse A. Visuales (Av), sabiendo previamente que es varón (H).

Directamente sería: P( Av /H )= 5

15 ← cinco casos favorables

← Total de varones

Algebraicamente: P ( Av /H )=

P ( Av∩H )P (H )

⇒5

4015

40

= 515

Problema 1: en un centro vacacional se encuestó a 120 jóvenes, de los que 80 eran varones y sólo 32de ellos sabían nadar. También se supo que 10 mujeres nadan.i) Construir una tabla de contingencia.ii) Represente el problema en un diagrama de árbol.iii) Calcule la probabilidad de que al elegir al azar un encuestado, sea hombre y sepa nadar.iv) Calcule la probabilidad de elegir un encuestado que no nade sabiendo que es mujer.

En los dos últimos casos verifique el resultado con la fórmula definida para probabilidad condicional.

Page 3: Datos Azar

Problema 2: En el canasto de un recinto deportivo hay doce balones de voleibol y 8 de futbolito. Si se toman dos de ellos en forma consecutiva, sin devolver el primero, i) ¿Cuál es la probabilidad, expresada en %, de que la primera sea de voleibol y la segunda de

futbolito?ii) ¿Cuál es la probabilidad de la segunda sea de voleibol sabiendo que la primera fue de

futbolito?

Problema 3: En un supermercado se venden 600 chocolates de la marca H, 200 de la marca T y 80 de la marca J. La probabilidad de que un chocolate H esté vencido es 0,005; un 0,01 para la T y 0,03 para J.

Si un cliente elige un chocolate al azar. a) Calcular la probabilidad de que esté vencido. b) Sabiendo que el elegido está vencido, ¿cuál es la probabilidad de que sea de la marca J?

Marcas H T JP(Vencido) 0,005 0,01 0,03

Espacio muestralSe entenderá como el conjunto de resultados, o respuestas posibles, originadas por un experimento aleatorio.Ejemplo: Identificaremos con la letra “E “al experimento que consiste en lanzar tres monedas al aire, registrando todos los casos posibles:

Lanzamiento

I II III IV V VI VII VIII

Resultado ccc ccx cxc xcc cxx xcx xxc xxx

Para describir por extensión el conjunto, hay que considerar que si se tienen tres monedas y cada una de ellas tiene dos posibles resultados independientes entre ellos:

1) El total de combinaciones es 23=8

2) Entre el lanzamiento II al IV, la x se desplaza desde el tercer lugar hacia el primero.3) Entre el lanzamiento V al VII, la c se desplaza desde el primer lugar hacia el tercero.

El espacio muestral es: E ={ccc ,ccx , cxc , xcc , cxx , xcx , xxc , xxx }

Variable aleatoria (v.a): cuando a un resultado en particular del experimento se le asigna un valor numérico.Por ejemplo: v.a = número de caras en el espacio muestral:

Lanzamiento

I II III IV V VI VII VIII

Resultado ccc ccx cxc xcc cxx xcx xxc xxxv.a 3 2 2 2 1 1 1 0

Page 4: Datos Azar

Variable aleatoria discreta: aquella que sólo asocia valores “Discretos” (no continuos)En el ejemplo, la v. a. discreta sólo puede tomar los valores: 0, 1, 2, 3 (no toma valores intermedios)

Problema: en una central de telemarketing, se registran las llamadas contestadas y las llamadas perdidas en cada equipo de turno. Si el equipo lo componen 4 telefonistas, y para evaluar la efectividad del turno les controlan cuatro llamadas a cada una de ellas:

1) Obtenga el espacio muestral.2) Encuentre los valores para la v. a “llamadas perdidas”.

Función de probabilidad de una variable discreta.Una relación que asocia a cada valor de la v.a discreta su probabilidad (grado de certeza de que ocurra), se denomina “Función de Probabilidad”.

Si la variable aleatoria se identifica por X, cada valor de la variable se anotará con x i (minúscula).

Mientras que la probabilidad se expresará por f ( x )= P (X=xi ) , con i=1, 2, 3,…, n.

En el ejemplo: Total de casos posibles n=8

N° de “caras” 0 1 2 3 Variable aleatoria

frecuencia 1 3 3 1 Casos favorablesf ( x )= P (X=xi ) 1

838

38

18 Probabilidad

Toda función de probabilidad debe verificar que ∑i=1

n

P ( X=xi )=1

Problema: para la variable aleatoria “llamadas perdidas” de la Central de Telemarketing anteriormente solicitada, calcular:

1) P (X=x3)2) La probabilidad de que en todo el turno las cuatro llamadas sean perdidas.

3) ¿La probabilidad de que en todo el turno las cuatro llamadas sean contestadas: P (X=x0) ?

4) Verifique que ∑i=1

4

P ( X=x i )=1

Valor esperado, media muestral, o ESPERANZA matemática.

Page 5: Datos Azar

Una variable aleatoria discretaX con valores x1 , x2 ,. .. , x k siendo sus probabilidades P (x1) ,…,P (xk )

define a la media o esperanza de X por: μ=E [ X ]=∑

i=1

k

x iP (xi )

Mientras que la varianza de X se define por: σ 2=V ( X )=∑

i=1

k

P ( xi )( x i−E [ X ])2

o en forma equivalente por

σ 2=V ( X )=∑i=1

k

xi2 P( x i )−(E [X ] )2

Observación: para una variable continua la media o esperanza se define por: μ=E [ X ]=∫

IRxf ( x )dx

mientras que la varianza está dada por σ 2=V ( X )=∫

IRx2 f ( x )dx−(E [X ])2=∫

IRf ( x ) (x−E [ X ] )2dx

Resumen de relaciones muestrales:Muestra V. Discreta V. Continua

f. relativa: f i=

ni

n Función de probabilidad=P (x i ) Función de densidad = f ( x )

Media= ∑i=1

n

f i xiMedia (Esperanza)=

∑i=1

n

x i P( x i)Media (esperanza)=

∫−∞

xf ( x )dx

Varianza∑ f i (x i−x)2

Varianza∑i=1

n

P( x i )( xi−E [ X ] )2 Varianza∫IR (x−E [ X ] )2 f ( x )dx

Proceso de BernoulliSe trata de eventos o experimentos en que sólo existen dos resultados posibles, mutuamente excluyentes (éxito-fracaso, verdadero-falso,…), y en que las pruebas para obtener los resultados son independientes. Además la probabilidad de éxito o fracaso es constante. Entonces si p es la probabilidad de éxito, se tiene: P(E )=p mientras que la probabilidad de fracaso es: P(F )=q

Si en una variable aleatoria x i=1 cuando el resultado es éxito; y x i=0si es fracaso, entonces se obtiene q=1−p ,

Si el experimento se repite x veces, buscando lograr el primer éxito, la función de probabilidad de

Bernoulli es P(X=x )=(1−p )x p , con x=1, 2, 3,…n

Ejemplo: La probabilidad de que una muestra de agua, en una piscina de un centro vacacional, esté contaminada con un vector dañino es de 0.01. ¿Cuál es la probabilidad de que después de analizar 125 muestras recién se encuentre el vector?

Page 6: Datos Azar

Solución: X=125; p=0.01; q= (1-0.01)Se requiere calcular la probabilidad de encontrar 125 muestras negativas (no contaminadas):P(X=125)=(1−0 . 01 )125(0 .01)=0.0028, esto la probabilidad es de un 0.28%

Cálculo usando planilla ExcelPotencia de número del tipo x

y, por ejemplo 2

3=8

Media (esperanza) y Varianza muestralSiendo un experimento de Bernoulli, la media es μ= p , y la varianza σ

2= pq

Distribución BinomialDado un experimento aleatorio que cumple las condiciones de Bernoulli, de tamaño n, y la variable X definida como el número de éxitos resultantes, entonces, se dirá que X se distribuye como una Distribución Binomial.

Suele anotarse en la forma X ⃗B(n , p )siendo los parámetros n (tamaño de la muestra), p (probabilidad de éxito, q (probabilidad de fracaso).

En este caso la probabilidad de obtener k éxitos es: P(X=k )=(nk ) pkqn−k

Siendo la media μ=E(X )=np , y la varianza σ 2=∑

i=1

n

pq=npq

Ejemplo. En una industria de cojinetes de acero empaquetan cajas con 50 rodamientos de segunda selección, de las que se sabe que el 2% tiene defectos. Calcular la probabilidad de que en una caja:

1) Ningún rodamiento esté defectuoso.2) Sólo un rodamiento sea defectuoso.3) Más de dos tengan defectos.4) ¿Cuántos rodamientos defectuosos habrá en promedio por caja?

Solución: n = 50; Probabilidad de ser defectuoso p=0.02; q=0.98

a)P(X=0 )=(50

0 ) (0 .02 )0 (0. 98 )50=.. .=0 . 3641

b)P(X=0 )=(50

1 ) (0 .02 )1 (0 .98 )49=.. .=0 .3716

c) P(X>2 )=1− [P (X=0 )+P(X=1)+P(X=2)]=. . .=0 .0784 (que dos o menos estén sanos)

Page 7: Datos Azar

d) μ=E(X )=50⋅(0 .02 )=1 , un rodamiento defectuoso por caja.

Cálculo usando planilla Excel

Ejemplo 1. En un equipo de futbol el entrenador selecciona al jugador dedicado a los lanzamientos penales, entre aquellos que con siete lanzamientos tenga la mejor marca, sabiendo que los mejores aciertan en el 95% de las veces. ¿Cuál es la probabilidad de que el capitán falle alguno?Solución: probabilidad de acertar p=0,95; probabilidad de no acertar q=0,05; número de intentos n=7

Probabilidad de que acierte (con p=0,95) menos de siete lanzamientos:P(X<7 )Acertaría a lo más seis veces:

P(X=1)+P(X=2)+P(X=3 )+P (X=4 )+P (X=5 )+P(X=6)

Probabilidad de que falle (con q=0,05) un lanzamiento: 1-P(X=7 ):

1−((77 )⋅(0 ,95 )7 (0 ,05 )0 )=0 ,301

Ejemplo 2. Los estudiantes de un Colegio están distribuidos en 67% que estudia TP y el resto HC. Si se elige una muestra de 15 estudiantes al azar, calcule la probabilidad de que:

1) Exactamente 3 sean de TP2) Al menos tres sean TP3) Los 15 sean HC4) Entre 7 y 10 estudiantes sean TP

Solución: si “éxito” = estudiar en TP, p=0.67; q=0.33; n=15

1)P(X=3)=(15

3 ) (0.67 )3 (0. 33 )15−3=…=455¿0 .673⋅0 .3312

=0.000222) P(X≥3)=P(X=3)+P(X=4 )+. ..+P( X=15 ), o en forma equivalente

P(X≥3)=1−P(X≤2)⇒P (X≥3 )=1−P (X≤2 )=P(X=0 )+P (X=1 )+P (X=2 )=. ..=0 .99997

3) 15 HC implica cero TP: P(X=0 )=(15

0 ) (0 .67 )0 (0 .33 )15−0=…=0.00000006

4) P(3≤X≤7 )=P (X≤7 )−P( X≤2 )=…=0.0288

Ejemplo 3: el 1% de las válvulas de riego por goteo de una compra al por mayor son defectuosos. Si se venden en lotes de 24 unidades, calcular la probabilidad de que se tengan como máximo dos defectuosos.

Page 8: Datos Azar

Solución: probabilidad defectuoso p=0,01; probabilidad de no defectuoso q=0,99; número de intentos n=24

P(X≤2)=P (X=0 )+P(X=1)+P(X=2)=¿⋅¿ (240 )⋅p0 q24+(24

1 )⋅p1q23+(242 )⋅p2q22=¿⋅¿

=0.0221Ejercicios.

1) En una central de despacho de frutas se sabe que la probabilidad de tener una unidad defectuosa de embalajes es del 5%. a) Calcule la probabilidad de que a lo sumo dos se encuentren defectuosas.

R: 0.998b) ¿Cuál es la probabilidad de que por lo menos una se encuentre defectuosa?

R: 0.401c) Calcule la probabilidad de que entre dos y diez se encuentren defectuosas.

R: 0.0476

2) Una empresa agro-frutícola de exportación estima que el 5% de su producción de paltas no alcanza el tamaño estándar. Las paltas se embalan en cajas de 25 productos. Calcular la probabilidad de que una caja contenga:a) 2 con tamaño inferior al requerido. R: 0.135b) Menos de tres con tamaño inferior al necesario. R: 0.9637c) Entre 3 y 5 paltas que no cumplen el estándar. R: 0.03536

3) Un técnico electrónico elige al azar entre “n” chip de una caja, para una reparación urgente. La probabilidad de que el chip esté defectuoso es del 2%a) Si habían 7 chips en la caja ¿cuál es la probabilidad de que al menos tres sean

defectuosos?R: 14%

b) ¿Cuántos chips hay en la caja si la varianza es 32?

R: V (X )=32⇒n (0 . 2 ) (0 . 8 )=32⇒n=200Distribución de PoissonUna de las distribuciones importantes para variables aleatorias discreta, especialmente para procesos dicotómicos con probabilidad de éxito muy pequeña, o número de pruebas excesivamente alto. Aplicable en eventos que se refieren a intervalos de tiempo, áreas o espacios, etc., por ejemplo para número de accidentes en una ciudad en una semana, número de emergencias en centro de urgencia hospitalaria, N° de robos denunciados por mes, tiempo de espera en una fila, etc.Problema: un analista financiero estima que el 3,5 % de las PYME de la RM. Entraran en recesión el próximo año. Si se elige una muestra de 100 pequeñas empresas del área sur, estime la probabilidad de que al menos tres de ellas entrarán a suspender sus actividades.Análisis: de acuerdo al modelo Binomial sería: P(X≥3)=P(X=3)+P(X=4 )+P(X=5 )+. . .+P (X=100 )

O en forma equivalente: P(X≥3)=1−[ P(X=0 )+P (X=1 )+PX (=2) ]

Para dar respuesta a las preguntas planteadas se deben considerar algunas condiciones importantes que finalmente derivarán el desarrollo a un proceso de Poisson, pues es aconsejable el modelo de Poisson cuando: n≥30 ; p≤0,1 y np≤5

Page 9: Datos Azar

En nuestro caso p=0 ,035≤0,1 ; n=100≥30 y np=(100 )(0 .035 )=3,5≤5En consecuencia es conveniente aplicar el modelo de Poisson, cuyas relaciones son:

Distribución de Poisson como el Lím ¿ n→∞ ¿

p→0 ¿np→ λ ¿¿¿(nx ) px (1−p )n−x=e− λ λx

x!¿para x = 0, 1, 2,…

∴ P(X=x )= e− λ λx

x !

Y se tiene que E [ X )=Lím(np )=λ ] , mientras que la varianza es V (X )=Lím(np )(1−p )=λLa solución del problema sería:P(X≥3)=1−[ P(X=0 )+P (X=1 )+PX (=2) ]=1-(0.302+0.1057+0.1850)=0.679

También pudo aplicarse: P(X≥3)=P(X≤100)−P (X≤2 )=0 . 67915

Ejercicios.1) En la sección de urgencia de una clínica médica, se estima que el número de promedio de

intervenciones no realizadas es 8, antes de cumplir 100 horas continuadas de funcionamiento. Si se supone que el suceso sigue una variable aleatoria de Poisson:a) ¿Cuál es la probabilidad de que fallen por lo menos 10 intervenciones en 125 horas?

R: 0.4169b) Calcule la probabilidad de que fallen no más de dos intervenciones en 50 horas

R: 0.2381c) Calcule la probabilidad de que falle un artículo en 25 horas.

R: 0.2706

2) De acuerdo al índice Forbes, la proporción de ciudadanos en América Latina con ingresos mensuales superiores a $20 millones, es de 0.005%. Calcular la probabilidad de que entre 5.000 consultados se encuentren dos ciudadanos con ese nivel de renta. R: 0.0243

Page 10: Datos Azar

3) El número medio de automóviles que llegan a una estación de peaje con TAG es de 210 en una hora. Si la estación atiende a un máximo de 10 vehículos por minutos, calcule la probabilidad de que en un minuto dado lleguen más automóviles de los que pueden circular sin espera adicional.R: 0.0092

4) Una empresa exportadora estima que puede introducir un producto en la región sur de China, esperando una demanda del 0,4%de los habitantes. Calcularla probabilidad de que al consultar a 1.000 chinos residentes en la región, el producto haya sido comprado:a) Por tres o más personas.

R: 0.000092b) Por cinco personas o menos

R: 0.9999

Aproximación de distribución Binomial por distribución NormalCuando las variables no son discretas, o sea, pertenecen a un intervalo continuo de valores reales, se tratará de una variable continua. Asociada a este tipo de variable se tiene a la distribución más importante, en general, denominada distribución normal. El teorema central del límite establece que cuando los resultados de un experimento son debidos a un conjunto muy grande de causas independientes, siendo cada efecto individual poco relevante respecto del conjunto, en estas circunstancias los resultados siguen una distribución normal.Los parámetros de esta variable aleatoria son μ y σ

2 (media y varianza), con función de densidad

f ( x )= 1√2 πσ

e12 ( x− μ

σ )2

para todo x∈ IR, σ>0 y μ∈ IR . Donde X ⃗N (μ , σ2 )

Variable normal tipificada: X ⃗N (0 , 1) esto es, Media cero y Varianza 1. De modo que la función

se expresa por: f ( x )= 1

√2πσe

x2

2

, siendo simétrica en x=0.

Su función de distribución es Φ (x )=∫

−∞

x 1√2π

ex 2

2 dx

Ejemplo. Si X se distribuye normalmente con Media de 20 y Varianza 4, calcular: P(X<15 )

Solución: Tenemos: x=15; μ=20; σ=√4 =2 y Φ (x )=∫

−∞

15 1√2π

e152

2 dx

Resuelto con Excel

Page 11: Datos Azar

∴ P(X<15 )=. ..=0 .00621

El uso de calculadoras científicas programables, o de planillas de cálculo con funciones especiales, permite resolver directamente los problemas, sin tener que resolver las funciones matemáticas asociadas, ni usar las tablas de distribuciones estandarizadas.

Si se debe cuidar que el planteamiento para el desarrollo de la solución sea el correcto.

Observación: cuando se tiene una Distribución Binomial, con n muy grande, el cálculo es difícil de realizar. En estos casos se procede aproximando la Binomial a una Normal:X ⃗B(n , p ), considerando μ=np y σ=√npq , entendiendo que n es un valor muy grande, usualmente n≥30 y también np≥5 ∧ nq≥5

Luego si X es variable discreta con distribución binomial, la aproximación para P(X=k )será por intervalos de la forma P(k−0,5≤Y≤k+0,5) .

Ejemplo: Un examen con cuatro alternativas tiene 100 preguntas, siendo sólo una la respuesta correcta. Si un estudiante contesta al azar ¿cuál es la probabilidad de que acierte?:

a) Más de 30 preguntasb) Menos de 15

Solución: μ=np= (100)(0.25)=25; σ=√npq=√100⋅0 .25⋅0 .75 = 4.33a) P(X>30)=1- P(Y>30.5)=0.102b) P(X<15)=P(Y<14.5)=0.0076

Observación: los límites “corregidos” (±0 . 5) siempre deben quedar comprendidos en el área de cálculo

Ejercicios

1) Calcular la probabilidad de obtener 27 o más ampolletas led defectuosas en una muestra de 1000 led, sabiendo que la probabilidad de que una de ellas elegida al azar no sea defectuosa es de 098.

Page 12: Datos Azar

2) Los productores de pisco de la tercera región han detectado suelos contaminados en un área de siembras. Para el análisis se separan sitios de 100 metros cuadrados y se estima que hay una probabilidad de 0.6 de encontrar contaminantes en un sitio. Calcule la probabilidad de a) Tener algún sitio contaminado si un agricultor tiene 15 sitiosb) Si otro tiene 200 sitios, ¿cuál es la probabilidad de tener entre 100 y 150 sitios

contaminados?c) Si por cada sitio contaminado el agricultor anterior pierde US$1.000 ¿cuál es la pérdida

que calcula tener?

3) Para un examen de conducir que responden dos personas, se aplica un test de 80 preguntas de V o F. Suponiendo que la primera sabe la respuesta de 50 preguntas y contesta las restantes al azar, mientras que el segundo examinado puede contestar con seguridad 20 preguntas y el resto al azar.Calcule la probabilidad de que:a) El primer examinado conteste correctamente más de 40 preguntasb) El segundo examinado responda como mínimo50 preguntas.c) Acertara a lo menos 40 preguntas, si uno de los dos contestara al azar todas las

preguntas.