estadistica aplicada - tema 5
TRANSCRIPT
-
8/19/2019 Estadistica Aplicada - Tema 5
1/39
Distribuciones de Probabilidad
Tema V
-
8/19/2019 Estadistica Aplicada - Tema 5
2/39
-
8/19/2019 Estadistica Aplicada - Tema 5
3/39
Universidad de Oriente –Departamento de Ingeniería Civi l –Estadística Aplicada
Tema 5: Distribuciones de Probabilidad
Variables- Variables Variables Cuantitativas Cuantitativas : Son aquellas que adquirieren valores numéricos,por ejemplo:
Numero de hijos Edad Volumen deLíquido
Resistencia de unMaterial
Lasvariablescualitativas a su vez se dividen en: discretasy continuas
- Lasvariables variables cuantitativas cuantitativas discretas discretas son aquellas que presentan separacioneso interrupcionesen la escala de valores que puede tomar. Estas separacionesindican la ausencia de valoresque la variable pude tomar.- - Las variables variables cuantitativas cuantitativas continuas continuas son aquellas que pueden adquirircualquier valor dentro de un intervalo especificado de valores.
-
8/19/2019 Estadistica Aplicada - Tema 5
4/39
Universidad de Oriente –Departamento de Ingeniería Civi l –Estadística Aplicada
Tema 5: Distribuciones de Probabilidad
Variables
- Variables Cuantitativas Discretas Variables Cuantitativas Discretas
Numero de hijos Edad Volumen deLíquido
Resistencia de unMaterial
- Variables Cuantitativas Continuas Variables Cuantitativas Continuas
1,2,3,4…. 10 10,11,12… 701; 1.12; 2.345… 20; 21.33…
Otros ejemplos:Gasto familiar, consumo eléctrico,peso, producción de una cosecha, etc.
Otros ejemplos:Barcos que llegan a un puerto,alumnos en un salón, ciudades de unpaís, etc.
-
8/19/2019 Estadistica Aplicada - Tema 5
5/39
Universidad de Oriente –Departamento de Ingeniería Civi l –Estadística Aplicada
Tema 5: Distribuciones de Probabilidad
Variable Aleatoria
Una variable se dice que es aleatoria, si los posibles valores que puede
tomar son determinados por el azar. En otras palabras se sabe qué
valorespuede tomar la variable pero no se tiene certeza de su ocurrencia,
sólo se sabe que puede ocurrir con una cierta probabilidad. Por ejemplo,
se sabe por una arteria vial concurrida pueden transitar camiones de
carga pesada pero no se sabe cuantos pasaran ni en que momento loharán. Solo podemostener una idea de la probabilidad de que ocurra el
evento esperado “que pase un numero n de camionespor la vía”.
-
8/19/2019 Estadistica Aplicada - Tema 5
6/39
-
8/19/2019 Estadistica Aplicada - Tema 5
7/39
Universidad de Oriente –Departamento de Ingeniería Civi l –Estadística Aplicada
Tema 5: Distribuciones de Probabilidad
Función de Probabilidad de una Variable AleatoriaLas autoridades de la UDO – Núcleo Anzoátegui, está interesada en investigar si losestudiantes están de acuerdo con la aplicación de las medidas de régimen derepitencia en la universidad. Se hace una pregunta con una encuesta: Esta de acuerdoconla aplicacióndel régimende repitencia?
1. Si 2. No
Supongamos que la encuesta se aplica a 3 estudiantes, entonces definimos comovariable aleatoria a:
X:Número de estudiantesque están de acuerdo conel régimen
Antesde hacer la encuesta, se puedenconsiderar las posiblesrespuestas:
x = 0 Ninguno esta de acuerdo
x = 1 Solo un estudiante esta de acuerdo
x = 2 Solo dosestudiantesestán de acuerdo
x = 3 Lostresestudiantesestán de acuerdo
Lo interesante es conocer la probabilidad de que “X” como variable aleatoria puedaasumir alguno de estos4 valores
-
8/19/2019 Estadistica Aplicada - Tema 5
8/39
Las distribuciones de probabilidad se aplicaran dependiendo
de la naturaleza de la variable, si esta es discreta o continua.
Universidad de Oriente –Departamento de Ingeniería Civi l –Estadística Aplicada
Tema 5: Distribuciones de Probabilidad
Variable Discreta Distribucion Binomial
Distribucion Poisson
Variable Continua
Distribución Normal
Distribución t Student
Distribución Chi Cuadrado
-
8/19/2019 Estadistica Aplicada - Tema 5
9/39
Distribución Binomial
La distribución binomial es una distribución de probabilidadesque surge al cumplirse cuatro condiciones:
Existe una serie de N ensayos.
En cada ensayo hay sólo dos posibles resultados, éxito ofracaso.
En cada ensayo, los dos resultados posibles son mutuamente
excluyentes. Las probabilidades de ambas posibilidades han de ser
constantesen todos losexperimentos(se denotan como p y q op y 1-p).
Universidad de Oriente –Departamento de Ingeniería Civi l –Estadística Aplicada
Tema 5: Distribuciones de Probabilidad
-
8/19/2019 Estadistica Aplicada - Tema 5
10/39
Distribución Binomial
Universidad de Oriente –Departamento de Ingeniería Civi l –Estadística Aplicada
Tema 5: Distribuciones de Probabilidad
Donde:
f(X) = probabilidad de X
éxitos dados los parámetros ny p
n = tamaño de la muestra
p = probabilidad de éxito
1 – p = probabilidad de
fracaso X = numero de éxitos en la
muestra ( X = 0, 1, 2, … n)
xn x
x p p x
n
f
1
)!(!
!
xn x
n
x
n
xn x x p p
xn x
n f
1
!!
!
-
8/19/2019 Estadistica Aplicada - Tema 5
11/39
Distribución BinomialLa distribución binomial es una distribución de variable discretaque se utiliza en situaciones donde los posibles resultados del
ensayo se reducena dosopciones: éxito o fracaso. Ejemplo: Un estudiante puede aprobar o reprobar un examen.
Un producto salido de un fábrica puede ser defectuoso o nodefectuoso.
En el lanzamiento de una moneda puede salir cara o sello.
Un cazador al disparar puede acertar o fallar. Del ensayo de algún material puede resultar que cumple o no
cumple con determinada especif icación.
Universidad de Oriente –Departamento de Ingeniería Civi l –Estadística Aplicada
Tema 5: Distribuciones de Probabilidad
-
8/19/2019 Estadistica Aplicada - Tema 5
12/39
Ejemplo
En una oficina de ventas de una constructora se ha
demostrado que losdías sábadosla probabilidad de ventade un apartamento esdel 20%. Si se escogen 15 clientesalazar que entran a la oficina el día sábado, determinar laprobabilidad de:
a. Concretar 1 ventab. Concretar menosde 3 ventas
Universidad de Oriente –Departamento de Ingeniería Civi l –Estadística Aplicada
Tema 5: Distribuciones de Probabilidad
-
8/19/2019 Estadistica Aplicada - Tema 5
13/39
Distribución Binomial
Universidad de Oriente –Departamento de Ingeniería Civi l –Estadística Aplicada
Tema 5: Distribuciones de Probabilidad
Donde:
f(X) = probabilidad de Xéxitos dados los parámetros n
y p
n 15
p = 0.20
1 – p = 0.80
X = concretar una venta =1
1151
1 20.0120.0
1
15
f
)!115(!1
!15
1
15
1319.020.0120.0
!115!1
!15 11511
f
Hay un 13,19% de probabilidades de realizar una venta
-
8/19/2019 Estadistica Aplicada - Tema 5
14/39
Distribución Binomial
Universidad de Oriente –Departamento de Ingeniería Civi l –Estadística Aplicada
Tema 5: Distribuciones de Probabilidad
0352.020.0120.00
15 01500
f
0.0352+0.1319+0.2309=0.398 = 39,80% de probabilidades de realizarmenos de 3 ventas
1319.020.0120.01
15 11511
f
2309.020.0120.0215
21522
f
-
8/19/2019 Estadistica Aplicada - Tema 5
15/39
Distribución Poisson
Cuando en una distribución binomial se realiza el experimento unnúmero "n" muy elevado de vecesy la probabilidad de éxito "p" en
cada ensayo es reducida, entonces se aplica el modelo dedistribución de Poisson. Este modelo posee las siguientescaracterísticas:
La probabilidad de observar exactamente un éxito en elsegmento o tamaño de muestra n esconstante.
El evento debe considerarse un suceso raro. Los mismos ocurrendentro de un continuo (espacio o tiempo) y ocupan una parteinfinitesimal del mismo
El evento debe ser aleatorio e independiente de otroseventos
Universidad de Oriente –Departamento de Ingeniería Civi l –Estadística Aplicada
Tema 5: Distribuciones de Probabilidad
-
8/19/2019 Estadistica Aplicada - Tema 5
16/39
Distribución Poisson
Universidad de Oriente –Departamento de Ingeniería Civi l –Estadística Aplicada
Tema 5: Distribuciones de Probabilidad
! x
e f
x
x
Donde:
f(X) = probabilidad de Xéxitos
= promedio de eventosesperados
e = base logaritmo natural =2.71828
X = numero de éxitos en lamuestra ( X = 0, 1, 2, … n)
-
8/19/2019 Estadistica Aplicada - Tema 5
17/39
Universidad de Oriente –Departamento de Ingeniería Civi l –Estadística Aplicada
Tema 5: Distribuciones de Probabilidad
Distribución Poisson
La distribución de Poisson se utiliza en situaciones donde lossucesos son impredecibles o de ocurrencia aletaoria conresultado discreto.
Además es muy útil cuando la probabilidad del evento quenos interesa se distribuye dentro de una distancia, área,
volumeno tiempo definido.
-
8/19/2019 Estadistica Aplicada - Tema 5
18/39
Distribución Poisson
Algunosejemplosson:
Defectosde una tela por m2 Aviones que aterrizan en un aeropuerto por día, hora,
minuto.
Bacteriaspor cm2 de cultivo
Llamadas telefónicas a una central por hora o minuto.
Llegadasde embarcacionesa un puerto por día o mes.
Universidad de Oriente –Departamento de Ingeniería Civi l –Estadística Aplicada
Tema 5: Distribuciones de Probabilidad
-
8/19/2019 Estadistica Aplicada - Tema 5
19/39
Ejemplo
Supongamos que estamos investigando la seguridad
de una peligrosa intersección de calles. Los registrospolicíacos indican una media de 5 accidentesmensuales en esta intersección. El departamento deseguridad vial desea que calculemosla probabilidad
de que en cualquier mes ocurran exactamente 3accidentes.
Universidad de Oriente –Departamento de Ingeniería Civi l –Estadística Aplicada
Tema 5: Distribuciones de Probabilidad
-
8/19/2019 Estadistica Aplicada - Tema 5
20/39
Distribución Poisson
Universidad de Oriente –Departamento de Ingeniería Civi l –Estadística Aplicada
Tema 5: Distribuciones de Probabilidad
!3
571828.2 35
3
f
Donde:
f(X) = probabilidad de Xéxitos
= 5
e = base logaritmo natural =2.71828
X = accidente = 3
1404.03 f
Hay un 14,04% de probabilidades de que sucedan 3 accidentes
-
8/19/2019 Estadistica Aplicada - Tema 5
21/39
Distribución Normal
Una de las distribuciones teóricas mas estudiadas y más
utilizada en la práctica es la distribución normal, tambiénllamada distribución gaussiana. Este nombre lo debe a JohannCarl Friedrich Gauss(1777-1855) a quien no se le atribuye sudescubrimiento mas si la difusión y aplicación de su uso en losaños1800.
Su importancia se debe fundamentalmente a la frecuencia conla que distintas variables asociadas a fenómenos naturales ycotidianossiguen, aproximadamente, esta distribución.
Universidad de Oriente –Departamento de Ingeniería Civi l –Estadística Aplicada
Tema 5: Distribuciones de Probabilidad
-
8/19/2019 Estadistica Aplicada - Tema 5
22/39
Distribución Normal
Histograma de Frecuencias Absolutas
Universidad de Oriente –Departamento de Ingeniería Civi l –Estadística Aplicada
Tema 5: Distribuciones de Probabilidad
-
8/19/2019 Estadistica Aplicada - Tema 5
23/39
Distribución Normal
Universidad de Oriente –Departamento de Ingeniería Civi l –Estadística Aplicada
Tema 5: Distribuciones de Probabilidad
2
2
1exp
2
1
x f x
2
2exp
2
1 z f x
x
z
0 1
-
8/19/2019 Estadistica Aplicada - Tema 5
24/39
-
8/19/2019 Estadistica Aplicada - Tema 5
25/39
Distribución Normal
La distribución normal posee ciertas propiedades importantes queconviene destacar:
Tiene una única moda, que coincide con su media y su mediana.
La curva normal esasintótica al eje de abscisas. Por ello, cualquiervalor entre ∞ y -∞ es teóricamente posible. El área total bajo lacurva es, por tanto, igual a 1.
Essimétrica con respecto a su media. Según esto, para este tipo devariables existe una probabilidad de un 50% de observar un datomayor que la media, y un 50% de observar un dato menor.
Universidad de Oriente –Departamento de Ingeniería Civi l –Estadística Aplicada
Tema 5: Distribuciones de Probabilidad
-
8/19/2019 Estadistica Aplicada - Tema 5
26/39
Distribución Normal La distancia entre la línea trazada en la media y el punto de
inflexiónde la curva esigual a una desviación típica σ.
El área bajo la curva comprendido entre los valores situadosaproximadamente a dos desviaciones estándar de la media esigual a 0.95. En concreto, existe un 95% de posibilidades deobservar un valor comprendido enel intervalo (µ-1.96σ; µ+1.96σ).
La forma de la campana de Gaussdepende de losparámetrosσ yµ. La media indica la posición de la campana. Por otra parte, la
desviación estándar determina el grado de apuntamiento de lacurva. Cuanto mayor sea el valor de , más se dispersarán losdatosen torno a la media y la curva será más plana. Un valor pequeñoindica, por tanto, una gran probabilidad de obtener datos cercanosal valor medio de la distribución.
Universidad de Oriente –Departamento de Ingeniería Civi l –Estadística Aplicada
Tema 5: Distribuciones de Probabilidad
-
8/19/2019 Estadistica Aplicada - Tema 5
27/39
Distribución Normal
Generalmente no se dispone de información acerca de la distribución
teórica de la población, sino que másbienel problema se plantea a lainversa: a partir de una muestra extraída al azar se realizan una serie
de mediciones y se desea extrapolar los resultados obtenidos a la
población de origen. En un ejemplo supongamos que se dispone del
peso de n=100 individuosde esa misma población, obteniéndose una
media muestral de Kg, y una desviación estándar muestral Kg,
querríamos extraer alguna conclusión acerca del valor medio real de
ese peso en la población original.
Universidad de Oriente –Departamento de Ingeniería Civi l –Estadística Aplicada
Tema 5: Distribuciones de Probabilidad
-
8/19/2019 Estadistica Aplicada - Tema 5
28/39
Distribución Normal
La solución a este tipo de cuestionesse basa enun resultado elemental de
la teoría estadística, el llamado teorema central del límite. Dicho axioma
viene a decirnos que las medias de muestras aleatorias de cualquier
variable siguen ellasmismas una distribución normal con igual media que
la de la población y desviación estándar la de la población dividida por
√n. Puesto que losvaloresde µ y σ son desconocidos, podríamos pensar
en aproximarlos por sus análogos muestrales y construir un intervalo de
confianza donde entre un porcentaje importante de los posibles valores,
típicamente se considera el 95%.
Universidad de Oriente –Departamento de Ingeniería Civi l –Estadística Aplicada
Tema 5: Distribuciones de Probabilidad
-
8/19/2019 Estadistica Aplicada - Tema 5
29/39
Distribución Normal
Universidad de Oriente –Departamento de Ingeniería Civi l –Estadística Aplicada
Tema 5: Distribuciones de Probabilidad
nn
96.1;
96.1
n
S X
n
S X
96.1;
96.1
100
03.096.150.0;100
03.096.150.0
En un estudio de la cantidad de agua en las arcillas plásticaspresentesenel tramo vialBarcelona- Anaco en un total de 100 muestras extraídas se obtuvo un a media de0.50ml/ m3 y una desviación estándar de 0.08ml/ m3. Queremos saber la media realde la población µ .
5157.0;4843.0
Estamos seguros en un 95% que lamedia poblacional se encuentraentre 0.4843ml/ m3 y 0.5157ml/ m3
-
8/19/2019 Estadistica Aplicada - Tema 5
30/39
Ejemplo
La media de la temperatura resistida por 500 láminas de una aleación
especial de aluminio es de 70ºC y la desviación típica 3ºC. Suponiendo
que estas temperaturas se distribuyen normalmente, estimar la
probabilidad de que un conjunto de laminasextraídasal azar resistan:
a. Entre 60ºCy 75ºC
b.
Menosde 64ºC
Universidad de Oriente –Departamento de Ingeniería Civi l –Estadística Aplicada
Tema 5: Distribuciones de Probabilidad
-
8/19/2019 Estadistica Aplicada - Tema 5
31/39
Ejemplo
a. Entre 60ºCy 65ºC
Universidad de Oriente –Departamento de Ingeniería Civi l –Estadística Aplicada
Tema 5: Distribuciones de Probabilidad
33.33
706060
z
67.13
707575
z
Z=-3.33 Z=0
P(X)=0.4996
Z=1.67Z=0
P(X)=0.4525
-
8/19/2019 Estadistica Aplicada - Tema 5
32/39
Ejemplo
a. Entre 60ºCy 65ºC
Universidad de Oriente –Departamento de Ingeniería Civi l –Estadística Aplicada
Tema 5: Distribuciones de Probabilidad
P(X)=0.4996+0.4525=0.9521=95.21%
Z=-3.33 Z=0 Z=1.67
-
8/19/2019 Estadistica Aplicada - Tema 5
33/39
Ejemplo
a. Menosde 64
Universidad de Oriente –Departamento de Ingeniería Civi l –Estadística Aplicada
Tema 5: Distribuciones de Probabilidad
P(X)=0.50-0.4772=0.0228=2,28%
00.23
706464
z
Z=-2.00 Z=0
P(X)=0.4772
-
8/19/2019 Estadistica Aplicada - Tema 5
34/39
Distribución t student
En muchas ocasiones no se conoce y el número de observaciones enla muestra es menor de 30. En estos casos, se puede utilizar ladesviación estándar de la muestra S como una estimación de , perono es posible usar la distribución Z como estadístico de prueba. Elestadístico de prueba adecuado esla distribución t .
Universidad de Oriente –Departamento de Ingeniería Civi l –Estadística Aplicada
Tema 5: Distribuciones de Probabilidad
-
8/19/2019 Estadistica Aplicada - Tema 5
35/39
Distribución t student
1. Al igual que la distribución normal, esuna distribución continua.
2. La distribución t tiene una media de cero, essimétrica respecto de la mediay se extiende de - a + la varianza de t v/ v-2 para v > 2. Cuando losgrados de libertad son suficientemente grandes la varianza de la distribuciónt tiende a 1.
3. Tiene forma acampanada y simétrica
4. No hay una distribución t, sino una "familia" de distribuciones t . todascon la
misma media cero, pero con su respectiva desviación estándar diferente deacuerdo con el tamaño de la muestra n.
Universidad de Oriente –Departamento de Ingeniería Civi l –Estadística Aplicada
Tema 5: Distribuciones de Probabilidad
-
8/19/2019 Estadistica Aplicada - Tema 5
36/39
Distribución t Student
5. La distribución t es más ancha y más plana en el centro que la distribuciónnormal estándar como resultado de ello se tiene una mayor variabilidad en
las medias de muestra calculadas a partir de muestras más pequeñas. Sinembargo, a medida que aumenta el tamaño de la muestra, la distribución t seaproxima a la distribución normal estándar.
Universidad de Oriente –Departamento de Ingeniería Civi l –Estadística Aplicada
Tema 5: Distribuciones de Probabilidad
nS
X
t
t
-
8/19/2019 Estadistica Aplicada - Tema 5
37/39
Distribución t Student
¿Qué son los grados de libertad? Supongamos que estamos tratando con dosvalores de muestra, a y b, y sabemos que tienen una media de 18, es decir,
(a +b)/ 2 = 18.¿Cómo podemos encontrar los valores que a y b pueden tomar en estasituación? a y b pueden ser cualesquier valor cuya suma entre los dos sea 36.Suponga que a tiene el valor de 10. Ahora b ya no eslibre de tomar cualquiervalor, sino que debe de tomar el valor de 26.
La situación de este ejemplo se puede generalizar para cualquier (n) en dondedada la media de los valores sólo quedan (n -1) elementos que puedendefinirse libremente y uno esfunción de la media y el resto de loselementos.
v=n-1
Universidad de Oriente –Departamento de Ingeniería Civi l –Estadística Aplicada
Tema 5: Distribuciones de Probabilidad
-
8/19/2019 Estadistica Aplicada - Tema 5
38/39
-
8/19/2019 Estadistica Aplicada - Tema 5
39/39
Distribución chi cuadrado X2
Tenemosuna muestra de tamaño n en la que observamosel carácter X y nos
planteamos hasta qué punto esta muestra se puede considerar comoperteneciente a una población con una distribución teórica ya conocida.
Deseamos saber si dos caracteres X e Y de una población son dependientes
o independientes.
Se trata de determinar si varias muestras que estudian el mismo carácter A
han sido tomadas o no de la misma población, respecto de dicha
característica A.
Universidad de Oriente –Departamento de Ingeniería Civi l –Estadística Aplicada
Tema 5: Distribuciones de Probabilidad