2011.2 - apuntes de clase

82
7/24/2019 2011.2 - Apuntes de Clase http://slidepdf.com/reader/full/20112-apuntes-de-clase 1/82 Universidad T´ ecnica Federico Santa Mar´ ıa Departamento de Matem´ atica Probabilidad y Estad´ ıstica Apuntes de clases. Recopilado por:  Francisca Gonz´alez L´ opez Santiago, 6 de agosto de 2011

Upload: blackperil

Post on 21-Feb-2018

227 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 1/82

Universidad Tecnica Federico Santa Marıa

Departamento de Matematica

Probabilidad y EstadısticaApuntes de clases.

Recopilado por: Francisca Gonzalez Lopez

Santiago, 6 de agosto de 2011

Page 2: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 2/82

.

1

Page 3: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 3/82

Indice general

1. Estadıstica Descriptiva 41.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.1.1. Estadıstica Descriptiva e Inferencial . . . . . . . . . . . . . . . . . . . . . . . 41.1.2. Etapas de una Investigacion Estadıstica . . . . . . . . . . . . . . . . . . . . . 41.1.3. Conceptos Basicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

1.2. Muestreo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

1.2.1. Muestreo Aleatorio Simple . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61.2.2. Muestreo Estratificado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

1.3. Clasificacion de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81.3.1. Cualitativas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81.3.2. Cuantitativas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81.3.3. Intervalares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

1.4. Organizacion de la Informacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91.5. Medidas de tendencia central, posicion y dispersion . . . . . . . . . . . . . . . . . . 12

1.5.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121.6. Estadısitica Bivariada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

1.6.1. Variables cualitativas e intervalares . . . . . . . . . . . . . . . . . . . . . . . 161.6.2. Variables cuantitativas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

2. Probabilidades 232.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232.2. Modelo de Probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

2.2.1. Espacio Muestral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 262.2.2. Eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 262.2.3. Medida de Probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 282.2.4. Espacios Probabilısticos Finitos . . . . . . . . . . . . . . . . . . . . . . . . . 30

2.3. Probabilidad Condicionada e Independencia . . . . . . . . . . . . . . . . . . . . . . 32

2.3.1. Probabilidad Condicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 322.3.2. Probabilidad Total . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 342.3.3. Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

2.4. Variables Aleatorias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 352.4.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 352.4.2. Variables Aleatorias Discretas . . . . . . . . . . . . . . . . . . . . . . . . . . 372.4.3. Variables Aleatorias Continuas . . . . . . . . . . . . . . . . . . . . . . . . . . 382.4.4. Localizacion y dispersion de una variable aleatoria . . . . . . . . . . . . . . . 39

2

Page 4: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 4/82

2.4.5. Casos especiales de distribuciones probabilidad . . . . . . . . . . . . . . . . . 412.4.6. Funciones de Variables Aleatorias . . . . . . . . . . . . . . . . . . . . . . . . 472.4.7. Aproximacion de distribuciones . . . . . . . . . . . . . . . . . . . . . . . . . 50

2.5. Vectores Aleatorios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 512.5.1. Distribucion Conjunta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

2.5.2. Distribuciones Conjuntas Especiales . . . . . . . . . . . . . . . . . . . . . . . 532.5.3. Distribucion Marginal y Condicional . . . . . . . . . . . . . . . . . . . . . . 552.5.4. Esperanza y Varianza Condicional . . . . . . . . . . . . . . . . . . . . . . . . 57

2.6. Nociones de Convergencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

3. Inferencia Estadistica 613.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 613.2. Estimacion Puntual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63

3.2.1. Metodo de Momentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 633.2.2. Metodo de Maxima Verosimilitud . . . . . . . . . . . . . . . . . . . . . . . . 64

3.3. Insesgamiento y eficiencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

3.4. Estimacion Intervalar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 683.4.1. Intervalo de Confianza para la media . . . . . . . . . . . . . . . . . . . . . . 683.4.2. Intervalo de Confianza para una proporcion . . . . . . . . . . . . . . . . . . 693.4.3. Intervalo de Confianza para la varianza . . . . . . . . . . . . . . . . . . . . . 693.4.4. Intervalo de Confianza para la diferencia de medias . . . . . . . . . . . . . . 703.4.5. Intervalo de Confianza para la comparacion de varianzas . . . . . . . . . . . 72

3.5. Pruebas de Hipotesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 733.5.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 733.5.2. Prueba de Hipotesis para la media . . . . . . . . . . . . . . . . . . . . . . . 753.5.3. Prueba de Hipotesis para la proporcion . . . . . . . . . . . . . . . . . . . . . 763.5.4. Prueba de Hipotesis para la varianza . . . . . . . . . . . . . . . . . . . . . . 76

3.5.5. Prueba de Hipotesis para la diferencia de medias . . . . . . . . . . . . . . . . 773.5.6. Prueba de Hipotesis para la diferencia de proporciones . . . . . . . . . . . . 793.5.7. Prueba de Hipotesis para la comparacion de varianzas . . . . . . . . . . . . . 79

4. Bibliografıa 81

3

Page 5: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 5/82

Capıtulo 1

Estadıstica Descriptiva

1.1. Introduccion

Por estadıstica entendemos los metodos cientıficos por medio de los cuales podemos recolectar,

organizar, resumir, presentar y analizar los datos numericos relativos a un conjunto de individuos uobservaciones y que nos permiten extraer conclusiones validas y efectuar decisiones logicas basadasen dichos analisis. Utilizamos la estadıstica para aquellos casos en los que tenemos una gran canti-dad de observaciones y cuya aparicion se rigen solo por las leyes del azar o aleatorias.

1.1.1. Estadıstica Descriptiva e Inferencial

La estadıstica puede subdividirse en dos amplias ramas: la estadıstica inductiva o inferencial yla estadıstica deductiva o descriptiva.

Estadıstica Inductiva o Inferencial

Entendemos por estadıstica inductiva si a partir de una muestra aleatoria, suficientemente repre-sentativa del universo, podemos inferir (inducir) conclusiones estadısticamente validas para todo eluniverso. Esto obliga a plantear simultaneamente las condiciones bajo las cuales dichas conclusionesson validas.

Estadıstica Descriptiva o Deductiva

Entendemos por estadıstica descriptiva si al analizar una muestra aleatoria., solo se pueden

obtener conclusiones validas para la muestra, sin que se pueda (o se requiera) generalizar susresultados para todo el universo.

1.1.2. Etapas de una Investigacion Estadıstica

Aun cuando los tipos de problemas a los cuales puede aplicarse la estadıstica matematica sonbastante heterogeneos, en muchos casos los pasos de una investigacion estadıstica son similares.

4

Page 6: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 6/82

a) Formulacion del problema. Para investigar con exito un problema dado, primero tenemosque crear conceptos precisos, formular preguntas claras e imponer limitaciones adecuadasal problema, tomando en cuenta el tiempo y dinero disponible, y la habilidad de los in-vestigadores. Algunos conceptos tales como: artıculo defectuoso, servicio satisfactorio a laclientela, observa-ciones demograficas, grados de pureza de un mineral, tipo de trafico, etc.,

pueden variar de caso en caso, y en cada situacion especıfica, por lo que necesitamos coincidiren definiciones apropiadas para los terminos que se incluyen.

b) Diseno del experimento. Es deseable obtener un maximo de informacion empleando unmınimo de costo y tiempo. Esto implica determinar el tamano de la muestra o la cantidad ytipo de datos.

c) Experimentacion o coleccion de datos. En toda investigacion esta etapa es la que consumemas tiempo. Esta debe aplicarse con reglas estrictas y con pautas preestablecidas.

d) Tabulacion y descripcion de los resultados. Los datos experimentales se ilustran en dia-gramas, graficos, pictogramas, etc. obteniendose ademas, medidas descriptivas que representen

el proceso efectuado.

e) Inferencia estadıstica y formulacion de la respuesta. Al aplicar el metodo estadısticoseleccionado en la etapa b), podemos inferir conclusiones obtenidas de la muestra acerca dela poblacion respectiva.

1.1.3. Conceptos Basicos

Universo: Es el conjunto de todos los datos u observaciones de un suceso. El universo se des-igna usualmente con la letra U. El universo puede ser finito, infinito contable e infinito no contable(dependiendo del tipo de universo es el tipo de analisis del problema).

Poblacion: Elementos del universo que tienen una caracterıstica comun y es la que tratamosde estudiar.

Muestra Aleatoria (m.a.): Es un subconjunto de la poblacion, donde sus elementos sonescogidos al azar (no existe relacion en la eleccion de los elementos).

5

Page 7: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 7/82

1.2. Muestreo

El muestreo es la disciplina que trata con el conjunto de metodos, tecnicas y procedimientospara tomar u obtener una particular muestra a efectos de realizar inferencias inductivas a partir dela misma. Existen dos grandes categorıas de muestreo: el Muestreo Probabilıstico y el Muestreo NoProbabilıstico.

En el Muestreo No Probabilıstico, pueden existir unidades de la poblacion que no pueden serseleccionadas en ninguna de las muestras posibles, o bien, aunque exista una probabilidad de se-leccion positiva para cada una de estas unidades de la poblaci on, esta probabilidad es desconocida.La ventaja es que las observaciones para una muestra particular se obtienen mas rapidamente y amenor costo que en el Muestreo Probabilıstico. Un ejemplo de este tipo es el Muestreo por Cuotas,muy utilizado en los estudios de mercadeo y en algunas encuestas de opinion.

En el Muestreo Probabililıstico todos los elementos de la poblacion tienen una probabilidad cono-cida de ser incluidos en la muestra. Dependiendo del comportamiento de la poblacion existentes

distintos tipos como el Muestreo Aleatorio Simple, por Conglomerados, Sistematico, Multietapico,etc.

Debemos considerar que los errores “ajenos al muestreo” (errores en las operaciones de recolec-cion y procesamiento de la informacion), son mas faciles de controlar cuando se utiliza MuestreoProbabilıstico. En todo caso, solo con el Muestreo Probabilıstico es posible obtener indicadores deconfiabilidad del error inferencial de cada estimacion obtenida a traves de la muestra.

Algunos muestreos probabilısticos son:

1.2.1. Muestreo Aleatorio SimpleEs un diseno muestral bastante utilizado cuando se cuenta con una lista o directorio. Se dis-

tinguen dos casos de m.a.s.: Muestreo sin Reemplazo y Muestreo con Reemplazo. De las N unidadesde la poblacion se selecciona “al azar” (igual probabilidad para cada unidad) una unidad. Esta sesepara (sin reposicion) y de las N-1 restantes unidades de la poblacion se selecciona, tambien alazar, una segunda unidad. De las N-2 unidades restantes se vuelve a seleccionar al azar una terceraunidad y ası sucesivamente hasta completar las n unidades de la muestra.

1.2.2. Muestreo Estratificado

El Muestreo Estratificado se presenta cuando la poblacion se encuentra particionada en L gruposy en todos y cada uno de estos grupos se aplica en forma independiente un diseno muestral, nonecesariamente igual. En tal caso, los grupos de la particion se llaman estratos y la particion dedice que es una estratificaci´ on .La estratificacion puede tener su origen en los propios objetivos del estudio o en la intenci on decontar con estratos homogeneos que pueden hacer mas eficiente el diseno muestral.

6

Page 8: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 8/82

Ejemplos de estratificaciones en funcion de los objetivos del estudio son, por ejemplo, las divi-siones polıtico administrativas (los estratos pueden ser regiones, provincias, departamentos o dis-tritos, etc.) en una Encuesta Nacional, ramas de actividad economica en una Encuesta Industrial;publico y privado en una Encuesta sobre Educacion, etc.

Ejemplos de estratos creados para obtener una mayor homogeneidad en cada uno de ellos son:empresas grandes, medianas, pequenas y micro, en una Encuesta Industrial: manzanas con hogaresde ingresos mayoritariamente altos, medios y bajos, etc.

7

Page 9: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 9/82

1.3. Clasificacion de variables

Las variables pueden clasificarse de acuerdo al tipo de respuesta (escala de medicion) que tienen,dividiendose en dos grandes categorıas: cualitativas y cuantitativas.

1.3.1. CualitativasLa variables cualitativas son todas aquellas que miden atributos o cualidades. Pueden ser di-

cot´ omicas , si solo tienen dos niveles de respuesta o polit´ omicas , si tiene mas de dos niveles derespuesta. Podemos clasificarlas en dos tipos

Nominales. La variable induce en la poblacion una subdivision y los datos se pueden clasificaren clases, donde cada clase esta completamente definida y diferenciada de las demas.La recopilacion se reduce a contar el numero de individuos de la muestra que pertenecen a cada clase.

Ordinales. En este nivel la variable de clasificacion tiene un orden implıcito (admite grados de

calidad u ordenamiento) entre grupos o clases, esto significa que existe una relaci on de orden entrelas clases. No es posible cuantificar la diferencia entre los individuos pertenecientes a una mismaclase.

1.3.2. Cuantitativas

Las variables cuantitativas son todas aquellas cuyos valores representan una magnitud en laescala real. Podemos distinguir dos tipos:

Discretas. La variable toma valores en un subconjunto numerable de los numeros reales (porejemplo los naturales o enteros), esto es, es posible identificar todos los valores que toma la variable.

Continuas. La variable toma valores en un intervalo de numeros reales, esto es, entre dos valoresde la variable es posible encontrar otro posible valor.

1.3.3. Intervalares

La informacion obtenida en este caso es de tipo cuantitativo o numerico y es posible agruparlaen intervalos. En este nivel se considera no solo la informacion perteneciente al orden, sino ademas,el tamano relativo de los intervalos a que pertenece cada uno de los individuos. En este nivel esposible cuantificar la diferencia de dos individuos pertenecientes al mismo intervalo y tambien aintervalos distintos. Estas variables pueden ser consideradas tanto cuantitativas (ya que es el origende la variable) como cualitativas (de acuerdo a la etiqueta que se asigne a cada intervalo).

8

Page 10: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 10/82

1.4. Organizacion de la Informacion

Una coleccion de datos tomados de un suceso (sometido a estudio) nada nos dice si no lo orde-namos convenientemente para extraer ası la informacion que se desea. Considere una muestra conun total de n datos.

Los conceptos mas usuales se detallan a continuacion:

a.- El numero de clases o intervalosEs una subdivision del rango en varios grupos o intervalos (se designa por la letra k).

Para valores de n menores a 20, el numero de clases corresponde a k =√

n.

Para valores de n mayores a 20, el numero de clases se calcula como

k = 1 + 3.3

·log(n)

Como el numero de clases debe ser un numero entero, este se aproxima al entero superior,identificandolo con la letra k.

b.- Intervalo o ClaseUna subdivision del rango en componentes (de acuerdo a la magnitud, atributos, etc.) sellaman clases, categorıas, intervalos o celdas. Se designan por la letra C con un subındice queindica la clase a que pertenecen, por ejemplo C 1, C 2, . . . , C k.

c.- Ancho del Intervalo

El ancho de la clase es la diferencia entre el lımite superior e inferior de la clase. Se designapor la letra I . En general, el ancho de cada clase puede o no ser del mismo tamano. En elcaso de que todos sean iguales el valor de se define como:

I = R + 1

k

donde R = Dato mayor en la muestra - dato menor de la muestraEl valor de I se aproxima al entero superior (cuando los datos son enteros).

d.- Marca de la ClaseLa marca de clase es el punto medio de la clase o intervalo. Se designa por las letras M C i (el

subındice indica la clase a la que le corresponde).

e.- Frecuencia AbsolutaEl numero de datos que pertenecen a una clase se llama frecuencia absoluta de la clase. Sedesigna por la letra n con un subındice (que indica la clase a que pertenece) por ejemplo:n1, n2, . . . , nk.

Nota: La suma de todas las frecuencias absolutas debe ser igual al numero total de datos ”n ”.

9

Page 11: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 11/82

f.- Frecuencia RelativaA la proporcion de datos que pertenecen a una clase con respecto al total se llama frecuenciarelativa. Se designa por la letra f con un subındice (que indica la clase a que pertenece). Porejemplo: f 1, f 2, . . . , f k.

Notar que:

- La suma de todas las frecuencias relativas debe ser igual a 1.

- Frecuencia relativa = frecuencia absoluta/numero total de datos = ni/n

g.- Frecuencia Absoluta AcumuladaEl numero de datos que estan desde la primera clase hasta la clase i-esima, se llama frecuenciaabsoluta acumulada de la clase i-esima. Se designa por la letra N con un subındice (que indicala clase a que pertenece) por ejemplo: N 1, N 2, . . . , N k.

Nota:

N 1 = n1

N 2 = n1 + n2 = N 1 + n2

...

N i = n1 + n2 + . . . + ni = N i−1 + ni ∀ i = 1, 2, . . . , k .

y debe verificarse que N k = n (numero total de datos)

h.- Frecuencia Relativa Acumulada

El numero de datos que estan desde la primera clase hasta la clase i-esima con respecto altotal de datos, se llama frecuencia relativa acumulada de la clase i-esima. Se designa por laletra F con un subındice (que indica la clase a que pertenece) por ejemplo: F 1, F 2, . . . , F k.

Nota:

F 1 = f 1 = N 1

n

F 2 = f 1 + f 2 = F 1 + f 2 = N 2

n...

F i = f 1 + f 2 + . . . + f i = F i−1 + f i = N i

n ∀ i = 1, 2, . . . , k .

y debe verificarse que F k = 1.

Ejemplo 1.4.1 Las notas obtenidas en un certamen, en escala 1 a 7 fueron:

3, 5, 6, 3, 4, 4, 7, 2, 1, 2, 3, 3, 4, 4, 6, 2, 7, 5, 3, 4, 4, 1, 2, 2, 3, 5, 4, 6, 5, 5.

10

Page 12: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 12/82

Lo que se puede tabular como:

Clase Nota ni f i N i F iC 1 1 2 0.067 2 0.067 C 2 2 5 0.167 7 0.233 C 3 3 6 0.200 13 0.233

C 4 4 7 0.233 20 0.667 C 5 5 5 0.167 25 0.833 C 6 6 3 0.100 28 0.933 C 7 7 2 0.067 30 1

Suma 30 1

Ejercicios 1 En una empresa se considera la siguiente muestra correspondiente a la resistencia de 50 lotes de algod´ on medidas en libras necesarias hasta romper una madeja.

74 87 99 88 90 101 91 83 97 94105 110 99 94 104 97 90 88 89 90

79 105 96 93 93 90 91 102 94 106 101 96 97 103 108 90 102 91 76 109 110 94 101 97 106 86 88 97 107 107

1. Encuentre el n´ umero de clases y el rango de la muestra.

2. Determine la amplitud de la clase.

3. Construya un cuadro resumen indicando intervalos, marca de clase, frecuencias absoluta, rel-ativa, absoluta acumulada y relativa acumulada.

4. Grafique las frecuencias absolutas. Comente.

11

Page 13: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 13/82

1.5. Medidas de tendencia central, posicion y dispersion

1.5.1. Introduccion

La idea es resumir los datos en un solo valor que represente a todo un conjunto de datos. Talcantiad debe ser un numero o una clase hacia el cual tiende a concentrarse mayoritariamente el

conjunto de datos, usualmente este se ubica en las clases centrales, o sea, que es un valor posici oncentral a cuyo alrededor se distribuyen todos los datos del conjunto, de allı el nombre de medidasde tendencia central. Las mas comunes son la mediana, moda y media.

Estas y otras medidas nos sirven para resumir la informacion presentada en cuadros y poderrelacionar y comparar entre sı, de una manera sencilla, un conjunto de distribuciones de frecuencias.

Una vez determinadas las medidas de tendencia central de una distribucion, nos interesa deter-minar como se reparten (dispersan, desvıan) los datos a uno y otro lado de la medida central. Osea, es necesario cuantificar la representatividad de la medida de tendencia para poder caracterizarla distribucion. Si la dispersion es pequena indica gran uniformidad y la informacion tiende a con-

centrarse en torno a la medida central; por el contrario, una gran dispersi on indica que los datosestan alejados de ella.Las medidas de dispersion mas usuales son: desviacion media, desviacion tıpica o estandar, ran-

go, rango semi-intercuartılico, rango percentil.

Las medidas mas usuales de tendencia central, posicion y dispersion son:

a. MediaLa medida central mas representativa es la media o promedio. Como tales valores tienden asituarse en el centro del conjunto de los datos ordenados segun su magnitud, los promedios seconocen tambien como medidas de centralizaci´ on .

La media aritmetica o media de un conjunto de n numeros X 1, X 2, . . . , X n se denota por X y se define como

X = 1

n

ni=1

X i

para datos no agrupados. Si los datos estan ordenados en una tabla (datos agrupados) enlas que se conocen las respectivas marcas de clase MC i, y ellas se presentan con frecuenciasabsolutas ni, la media aritmetica es:

X = 1

n

k

i=1

ni

·MC i

12

Page 14: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 14/82

b. ModaLa moda cruda de una serie de numeros es aquel que se presenta con la mayor frecuencia, esdecir, es el valor mas comun.Una distribucion que tiene una sola moda se llama unimodal (caso mas usual). Es posibleencontrar variables bimodales, trimodales, etc.

Para datos agrupados, la moda puede obtenerse mediante el numero dado por:

Moda = lmo + ∆1

∆1 + ∆2I

donde:mo = clase modal (clase con mayor frecuencia absoluta)lmo = lımite inferior del intervalo de la clase modal∆1 = nmo - n−mo

∆2 = nmo - n+mo

nmo = es la frecuencia de la clase modaln+mo

= es la frecuencia de la clase posterior a la clase modaln−mo

= es la frecuencia de la clase anterior a la clase modalI = ancho del intervalo de la clase modal.

Notar que:La moda puede no existir y cuando existe no es necesariamente unica. Ademas, no se veafectada por valores extremos.

c. MedianaEs el valor de la variable que ocupa la posicion central , en un conjunto de datos ordenados.

Si el numero de observaciones es impar, es la observacion central de los valores, una vez queestos han sido ordenados en orden creciente o decreciente. Si el numero de las observacioneses par, se calcula como el promedio de las dos observaciones centrales.

Para datos agrupados, el numero mediana viene dada por:

M e = lM e +n2 − N −M e

nM e

I

donde:lM e

= lımite inferior del intervalo de la clase medianan = numero total de datosN M e = frecuencia absoluta acumulada hasta la clase anterior a la clase mediananM e = es la frecuencia de la clase medianaI = ancho del intervalo de la clase mediana.

Notar que:- La mediana en un conjunto de datos es unica.

13

Page 15: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 15/82

- No es sensible a la presencia de datos extremos.- En un conjunto de datos, la mitad de ellos son iguales o menores que la mediana, y la otramitad, iguales o mayores que la mediana.

d. PercentilesEl percentil q es un valor de la variable tal que el q % de los datos es menor que el y, por lo

tanto, el (1-q) % es mayor. Son una medida de posicion que no reflejan la tendencia central.

Si X (1), X (2), . . . , X (n) es una secuencia ordenada de datos, el percentil q se encuentra en laposicion

q (n + 1)

100

Para datos agrupados, nos referimos a la clase en el cual se encuentra al menos el q % de losdatos, digamos C p, por lo que

P q = l p +

n

·q/100

−N − p

n p · I

donde:l p = lımite inferior de la clase a la cual pertenece el percentil q I = ancho del intervalo C p.

e. VarianzaEs una constante que representa dispersion media de una variable aleatoria X , respecto a suvalor medio. Puede interpretarse como medida de “variabilidad” de la variable.Se define la varianza de una serie de observaciones X 1, . . . , X n como

s2n = 1

n

ni=1

(X i − X )2

o equivalentemente

s2n = 1

n

ni=1

X 2i − X 2

La varianza para datos agrupados con sus respectivas frecuencias absolutas ni, y las marcasde clase M C i, se representa por:

s2n = 1

n

k

i=1

ni(MC i−

X )2

o equivalentemente

s2n = 1

n

ki=1

niMC 2i − X 2

En ambos casos, se define la desviacion estandar como s =√

s2, tmabien una medida dedispersion de los datos respecto de la media.

14

Page 16: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 16/82

Ejemplo 1.5.1 Considere los datos de consumo de enrgıa electrica de 80 usuarios:

Consumo (Kwh) N o de usuarios 5 - 25 4

25 - 45 6 45 - 65 14

65 - 85 26 85 - 105 14

105 - 125 8 125 - 145 6 145 - 165 2

Total 80

a.- Construya un histograma de la variable consumo

b.- Determine la media y mediana de la variable consumo.

c.- Calcule el percentil 25 y 75 para la variable consumo.

d.- Calcule la varianza de la variable consumo.

e.- ¿Que porcentaje de usuarios consumen m´ as de 100 Kwh?

f.- ¿Que porcentaje de los usuarios consume entre 50 y 150 Kwh?

15

Page 17: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 17/82

1.6. Estadısitica Bivariada

Ahora, supongamos que queremos estudiar el comportamiento conjunto de dos variables X eY en una muestra de tamano n de la poblacion. Dependiendo del tipo de variables (cualitativas ocuantitativas) se realiza uno de los siguientes analisis.

1.6.1. Variables cualitativas e intervalares

Sean A1, . . . , Ar las r clases de X y B1, . . . , Bs las s clases de Y . Llamamos nij al numerode elementos de la muestra que pertenecen simultaneamente a la clase Ai y la clase B j . Ademas,definimos f ij como la frecuencia relativa del numero de elementos en Ai y en B j respecto de totalde datos, esto es,

f ij = nij

n , ∀ i = 1, . . . , r; ∀ j = 1, . . . , s

Definicion 1.6.1 Una tabla de contingencia es un cuadro de doble entrada donde se puede

resumir la informaci´ on acerca de las frecuencias, ya sean absolutas o relativas, como se muestra a continuaci´ on:

Y B1 B2 . . . Bs

X A1 n11 n12 . . . n1s n1+

A2 n21 n22 . . . n2s n2+...

... ...

... ...

...Ar nr1 nr2 . . . nrs nr+

n+1 n+2 . . . n+s n

A partir de la tabla de contingencia se desprenden las siguientes cantidades marginales:

ni+: es el numero de elementos de la muestra que pertenecen a la clase Ai, sin importar la claseB j a la que esten asociados (suma de los valores de la fila i-esima de la tabla de contingencia defrecuencias)

ni+ =s

j=1

nij, ∀ i = 1, . . . , r

n+ j: es el numero de elementos de la muestra que pertenecen a la clase B j segun Y, sin importarla clase Ai a la que esten asociados (suma de los valores de la columna j-esima de la tabla decontin-gencia de frecuencias)

n+ j =r

i=1

nij , ∀ j = 1, . . . , s

f i+: frecuencia relativa de las clases Ai sin importar las clases B j.

f i+ = ni+

n , ∀ i = 1, . . . , r

16

Page 18: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 18/82

f + j: frecuencia relativa de las clases B j sin importar las clases Ai.

f + j = n+ j

n , ∀ j = 1, . . . , s

Definicion 1.6.2 La distribuci´ on condicional consiste en estudiar el comportamiento de una

variable dado un valor fijo de la otra.

La distribucion de X condicionada a Y se define como

f i/j = f i/jf + j

= nij

n+ j

∀ i = 1, . . . , r

y se debe cumplir quer

i=1

f i/j = 1

Analogamente, la distribucion de Y condicionada a X se define como

f j/i = f j/if i+

= nij

ni+

∀ j = 1, . . . , s

y debe cumplirse ques

j=1

f j/i = 1

Ejemplo 1.6.1 Sea X la edad e Y la categorıa correspondiente al puesto de trabajo. Dada la siguiente tabla de contingencia, calcular la distribuci´ on condicional de Y , dado que X es 25-30 y 35-45.

X \Y I II III ni+

15-20 20 20 5 45 20-25 15 12 8 35 25-30 10 15 10 35 30-35 5 20 25 50 35-40 5 10 30 45

n+ j 55 77 78 210

Definicion 1.6.3 Dada una informaci´ on en una tabla de contingencia, se dice que las variables X e Y son independientes, sı y solo sı, la frecuencia relativa conjunta es igual al producto de las

frecuencias relativas marginales.

f ij = f i+ · f + j ∀i = 1, . . . , r ∀ j = 1, . . . , s

Si las variables X e Y no son independientes entre sı, se dice que existe una asociaci´ on entre ellas, de modo que el conocimiento de una de las variables presente alguna informaci´ on respecto de la otra.

17

Page 19: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 19/82

1.6.2. Variables cuantitativas

En estadıstica descriptiva se dice que dos variables cuantitativas “estan asociadas”, “son depen-dientes”, o “estan correlacionadas” si cuando se aumentan los valores de una variable, los valoresde la otra tienden a:

i) o bien a aumentar (y se dice que la asociacion dependencia es directa o que la correlacion espositiva)

ii) o bien a disminuir (y se dice que la asociacion o dependencia es inversa o que la correlaciones negativa)

Cuando no se presenta esta tendencia se dice que las variables no estan asociadas o no son depen-dientes o no estan correlacionadas.

La asociacion, correlacion o dependencia en estadıstica descriptiva, no implica relacion causa-efecto. En otras palabras, si cuando una variable aumenta la otra tiende a aumentar (o a disminuir)no es posible afirmar que esta ultima aumenta (o disminuye) PORQUE la primera variable aumenta.

Un ejemplo de esto es el realizado con la poblacion de Oldenburg entre 1930 y 1936, donde seanalizo la relacion entre la poblacion al final de cada ano y el numero de ciguenas observadas enese ano, informacion que se presenta en el siguiente grafico.

Si bien se ve que a mayor numero de ciguenas, mayor es la poblacion, no podemos concluirque el aumento en el numero de ciguenas causa un incremento en la poblacion. Probablementeesta relacion se produce por la asociacion que las variables tienen con una tercera variable, llamadavariable de confusion.

Indicadores de Asociacion: Covarianza

La covarianza entre dos variables, X e Y esta dada por:

cov(X, Y ) =n

i=1

(xi − x)(yi − y)

n

o equvalentemente

cov(X, Y ) = 1

n

ni=1

xiyi − xy

18

Page 20: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 20/82

La covarianza es una medida de asociacion lineal, pero tiene la desventaja que su interpretaciondepende de las unidades de medicion.

Si cov (X,Y)> 0, la asociacion es directa o positiva.

Si cov (X,Y)< 0, la asociacion es inversa o negativa.

Si cov (X,Y)≈ 0, no hay asociacion lineal.

Indicadores de Asociacion: Correlacion

La correlacion lineal entre dos variables se define como

corr (X, Y ) =

ni=1

(xi − x)(yi − y)

n

i=1

(xi

−x)2

n

i=1

(yi

−y)2

Si corr (X, Y ) = 1, la correlacion es la maxima correlacion positiva o directa.

Si corr (X, Y ) = −1, la correlacion es la maxima correlacion negativa o inversa.

Si corr (X, Y ) ≈ 0, no existe correlacion o dependencia.

Una formula alternativa para calcular correlacion es

corr (X, Y ) = sXY

sX sY

donde sX y sY son las desviaciones estandar de X e Y , respectivamente, y donde sXY es la covarianzaentre X e Y .

Otra formula alternativa es

corr (X, Y ) =

xiyi −

xi

yi

/n

x2i −

xi

2

/n

y2i −

yi

2

/n

Si bien no existe una regla general para decir si una correlaci on es alta media o baja, en estecurso podemos adoptar el siguiente criterio:

19

Page 21: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 21/82

Ejemplo 1.6.2 .

1. Consideremos los siguientes datos, donde X indica la temperatura media diaria en grados Farenheit e Y , el consumo diario correspondiente de gas natural en pies c´ ubicos.

X,F 50 45 40 38 32 40 55 Y,f t3 2.5 5.0 6.2 7.4 8.3 4.7 1.8

Realice un diagrama de dispersi´ on y calcule el coeficiente de correlaci´ on ρX,Y , si adem´ as cuenta con las siguientes medidas de resumen:

xi = 300;

yi = 35,9;

x2i = 13218;

y2i = 218,67;

xiyi = 1431,8

2. Considere los siguientes datos donde X , representa el n´ umero de sucursales que 10 bancos diferentes tienen en un ´ area metropolitana, e Y es la correspondiente cuota del total de dep´ ositos mantenidos por los bancos.

X 198 186 116 89 120 109 28 58 34 31Y 22.7 16.6 15.9 12.5 10.2 6.8 6.8 4.0 2.7 2.8

a) Construya un diagrama de dispersi´ on entre X e Y.

b) Calcule covarianza y correlaci´ on.

Ajuste de Curvas

En el problema de ajuste de curvas se desea, dado un par de variables ( X, Y ), encontrar una

curva que se ajuste de la mejor manera a los datos. La curva est a definida en forma parametrica, y sedeben encontrar los valores de sus parametros para hacer que alguna medida de error se minimice.El ajuste mas simple es el de una recta conocido con el nombre de regresion lineal simple.

Con este metodo se pretende ir mas alla de ver la asociacion entre dos variables. En concreto sequiere:

(i) Investigar la naturaleza de la asociacion.

(ii) Construir un modelo que describa la relacion entre ambas variables.

(iii) Predecir

Supongamos que un diagrama de dispersion de los datos de los puntos (xi, yi) indica una relacionlineal entre las variables X eY o, alternativamente, que el coeficiente de correlacion es cercano a 1o -1. Entonces el siguiente paso es encontrar la recta L que en lagunsentido ajuste los datos.

En general, el modelo de regresion lineal simple lo podemos plantear como la recta :

yi = a + bxi, i = 1, . . . , n . (1.1)

donde

20

Page 22: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 22/82

yi : es la variable respuesta o dependiente para el individuo i;

xi : es la variable explicativa o independiente para el individuo i,

a : representa el intercepto con el eje Y, y se interpreta como el valor que toma y cuando x =0.

b : representa la pendiente de la recta, y se interpreta como la cantidad que aumenta(disminuye) y cuando x aumenta(disminuye) en una unidad.

La pendiente y el intercepto pueden calcularse de la siguiente manera:

b = rsy

sx=

cov(X, Y )

s2X

y a = y − bx

Ejemplo 1.6.3 Considere los datos de los ejemplo 6.2 y 6.3, y encuentre la recta que se ajusta a los datos.

Algunas veces el diagrama de puntos no indica una relacion lineal entre las variables X e Y pero

se podra observar alguna otra curva tıpica y bien conocida Y = f (X ) que puede aproximar los datos;se le llama curva de aproximaci´ on . Algunas de esas curvas tıpicas son las siguientes analizamos larelacion entres X e Y y determinamos que esta no se ajusta auna recta podemos analizar, entreotros, los dos siguientes casos:

Ajuste Exponencial

Si entre log(y) y x observamos una relacion lineal, usaremos la curva exponencial:

yi = aebxi, i = 1, . . . , n .

Este ajuste se puede reducir a una regresion lineal de la siguiente forma

log(yi) = a + bxi, i = 1, . . . , n .

donde

a =log(a)

b =b

Ajuste Polinomial

En este caso lo que hacemos es ajustar la relacion entre x e y a traves de un polinomio de grado p:

yi = β 0 + β 1xi + β 2x2i + β 3x3

i , . . . , β px pi i = 1, . . . , n .

Al incluir potencias de X logramos mayor flexibilidad en el modelo.Si p=1, estamos en el caso de regresion lineal.Si p=2, la regresion se llama cuadratica.

21

Page 23: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 23/82

Otros Ajustes

HiperbolaSi entre 1/y y x observamos un relacion lineal usaremos la hiperbola:

y = 1

a + bx

o 1

y

= a + bx

Curva GeometricaSi entre log(y) y log(x) observamos una relacion lineal usaremos la curva potencial:

y = axb o log(y) = log(a) + b · log(x)

22

Page 24: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 24/82

Capıtulo 2

Probabilidades

2.1. Introduccion

Uno de los problemas que deberemos considerar e intentar evaluar, es el elemento de aleatoriedad

que se asocia a la ocurrencia de ciertos eventos cuando se lleva a cabo un experimento. En muchoscasos debe tenerse la capacidad de resolver un problema de probabilidad mediante el conteo delnumero de casos posibles sin realmente anotar cada uno de ellos.

Teorema 2.1.1 Si una operaci´ on puede realizarse de n1 formas, y si por cada una de estas una segunda operaci´ on puede llevarse a cabo de n2 formas, entonces las dos operaciones pueden realizarse

juntas de n1n2 formas.

Ejemplo 2.1.1 ¿Cu´ antos son los resultados posibles cuando se lanza un dado dos veces?

Teorema 2.1.2 (Principio Multiplicativo) Si una operaci´ on puede realizarse de n1 formas, y

si por cada una de estas puede efectuarse una segunda en n2 formas, y para cada una de las dos primeras se puede efectuar una tercera de n3 formas, y ası sucesivamente, entonces la secuencia de k operaciones pueden realizarse de n1n2 . . . nk formas.

Ejemplo 2.1.2 ¿Cu´ antos men´ us que consisten de sopa, postre y bebida existen si se puede selec-cionar entre 4 sopas diferentes, 5 clases de postres y 4 bebidas?

Ejemplo 2.1.3 ¿Cu´ antos n´ umeros pares de tres dıgitos pueden formarse con los dıgitos 1, 2, 5, 6 y 9?

23

Page 25: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 25/82

Con frecuencia interesa un conjunto que contiene como elementos todos los posibles ordenes oarreglos de un grupo de objetos. Por ejemplo, se puede desear conocer cu antos arreglos diferentesson posibles para sentar a 6 personas alrededor de una mesa, o bien, cuantas formas diferentesexiten de tomar 5 ramos de un total de 8.

Definicion 2.1.1 Una permutaci´ on es un arreglo de todos, o parte de, un conjunto de objetos.

Considerense las tres letras a, b y c. Las permutaciones posibles son abc, acb, bca, cab, bac ycba . Se puede ver que hay 6 distintos arreglos. Con el principio multiplicativo se pueded llegar aque la respuesta es 6 sin escribir todas las posibles combinaciones. Hay n1 = 3 posibilidades para laprimera posicion, despues n2 = 2 para la segunda y unicamente n3 = 1 posibilidades para la ultima,lo que da un total de n1n2n3 = 3 · 2 · 1 = 6 permutaciones.

En general, se pueden acomodar n objetos distintos en n · (n − 1) · (n − 2) · . . . · (3) · (2) · (1)formas. Este producto se representa por el sımbolo n!, que se lee “n factorial”. Por definicion, 1! =1 y 0! = 1.

Teorema 2.1.3 El n´ umero de permutaciones de n distintos objetos es n!

El numero de permutaciones de las cuatro letras a, b, c y d sera de 4! = 24. Considerese ahorael numero posible de ellas al tomar las cuatro letras, pero de dos a la vez. Serıan ab, ad, ac, ba, ca,bc, cb, bd, db, cd, dc . De una nueva cuenta con el Teorema 7.1, se tiene dos posiciones para llenarcon laa n1 = 4 posibilidades para la primera y, por lo tanto, n2 = 3 posibilidades para la segunda,para un total de n1n2 = 4 · 3 = 12 permutaciones. En general, n objetos distintos, si se toman r ala vez, pueden acomodarse en n · (n − 1) · (n2) · · · (n − r + 1) formas.

Teorema 2.1.4 El n´ umero de permutaciones de n objetos distintos tomando r a la vez, es:

nP r =

n!

(n − r)!

Ejemplo 2.1.4 ¿De cu´ antas maneras se puede programar 3 ayudantıas en 3 distintos horarios, si los alumnos tienen 5 m´ odulos disponibles?

Las permutaciones que se dan al acomodar objetos en un cırculo se llaman permutacionescirculares. Dos de estas no se consideran diferentes a menos que a los objetos correspondientes enlos dos arreglos les preceda o les siga un objeto diferente al avanzar en el sentido de las manecillasdel reloj. Por ejemplo, si 4 personas juegan a las cartas, no se tiene una nueva permutacion si todasse mueven una posicion en esa direccion. Al considerar a una en un lugar fijo y acomodar a las otrastre en 3! formas diferentes, se encuentra que hay 6 acomodos dsitintos para el juego de cartas.

Teorema 2.1.5 El n´ umero de permutaciones de n objetos distintos agregados en un cırculo es (n-1)!

Hasta ahora se han considerado permutaciones de objetos diferentes. Esto es, todos los objetoseran distintos o totalmente distinguibles. Si consideramos la palabra OSO, entonces las 6 permuta-ciones de las letras de esta palabra son O1SO2, O1O2S,SO1O2, O2SO1, O2O1S,SO2O1, por lo queunicamente tres son distintas. Por lo tanto, con tres letras, siendo dos iguales, se tienen 3!/2! = 3diferentes permutaciones.

24

Page 26: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 26/82

Teorema 2.1.6 El n´ umero de permutaciones diferentes de n objetos de los cuales n1 son de un tipo, n2 son de un tipo, . . ., nk de un k- esimo tipo, es:

n!

n1!n2! · · · nk!

Ejemplo 2.1.5 ¿De cu´ antas formas diferentes pueden acomodarse 3 ampolletas rojas, 4 amarillas y 2 azules en un panel con 9 espacio para 9 luces?

Con frecuencia interesa el numero de formas en que se pueden repartir n objetos en r subconjun-tos llamados celdas. La particion se logra si la interseccion de cada par posible de r subconjuntoses el conjunto vacıo y si la union de todos los subconjuntos da como resultado el conjunto original.No importa el orden de los objetos dentro de una celda.

Teorema 2.1.7 El n´ umero de formas de partir un conjunto de n objetos en r celdas con n1 ele-mentos en la primera celda, n2 elementos en la segunda, y ası sucesivamente, es:

n

n1n2 · · · nr = n!

n1!n2! · · · nr!

donde n1 + n2 + · · · + nr = n

Ejemplo 2.1.6 ¿De cu´ antas formas distintas pueden 7 cientıficos acomodarse en un laboratoriopara tres personas y dos laboratorios para dos personas?

En muchos problemas interesa el numero de formas posibles de seleccionar r objetos de untotal de n sin importar el orden. Estas selecciones se llaman combinaciones. Una combinacion esrealmente una particion en dos celdas, una de las cuales contiene los r objetos que se seleccionarony la otra, los (n

−r) objetos restantes.

Teorema 2.1.8 El n´ umero de combinacioines de n objetos distintos, tomando r a la vez es n

r

=

n!

r!(n − r)!

Ejemplo 2.1.7 Encuentre el n´ umero de comites que pueden formarse con 4 quımicos y 3 fısicos y que comprendan 2 quımicos y 1 fısico.

Ejercicios 2 .

1. A los participantes de una convenci´ on se les ofrecen 6 recorridos por dıa para visitar lugares

de interes durante los 3 dıas de duraci´ on del evento. ¿De cu´ antas formas puede una persona acomodarse para hacer alguno de ellos?

2. Si un experimento consiste en lanzar un dado y despues seleccionar aleatoriamente una letra del alfabeto, ¿cu´ ales son los posibles resultados?

3. ¿De cu´ antas formas pueden plantarse, a lo largo de la lınea divisoria de una propiedad, 3 robles, 4 pinos y 2 arces, si uno no distingue entre los ´ arboles de la misma clase?

25

Page 27: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 27/82

2.2. Modelo de Probabilidad

En el estudio de la estadıstica interesa, basicamente, la presentacion e interpretacion de resul-tados aleatorios que se dan en un estudio planeado o en una investigacion cientıfica. Por ejemplo,es posible registrar el numero de accidentes que ocurren mensualmente en una determinada inter-seccion de calles, con el proposito de justificar la instalcion de un semaforo; clasificar los artıculosque salen de una lınea de ensamble como “defectuosos” o “no defectuosos”; o bien, tener interes enconocer el volumen de gas que se libera durante una reaccion quımica cuando la concentracion deun acido varıa. De aquı que se manejen datos experimentales, que representan conteos o mediciones,o tal vez datos categoricos que puedan clasificarse de acuerdo con algun criterio.Necesitamos entonces una forma matematica para cuantificar la incertidumbre.

Utilizaremos la palabra experimento, E , para describir cualquier proceso que genere un conjun-to de datos. Un ejemplo muy simple de un experimento consiste en el lanzamiento de una monedala aire. En este caso solo existen dos resultados posibles: cara o sello. Otro experimento podrıaser el lanzamiento de un proyectil y la observacion de su velocidad en un perıodo de tiempo. Las

opiniones de los votantes respecto de un candidato a alcalde tambien pueden considerarse comoobservaciones de un experimento. Aquı interesan particularmente las observaciones que se obtienenen la repeticion de un experimento. En la mayor parte de los casos los resultados dependeran delazar y, por lo tanto, no pueden pronosticarse con certidumbre. Si un quımico realiza varias vecesun analisis bajo las mismas condiciones y obtiene diferentes mediciones, ello indica la existenciade un elemento de aleatoriedad en el procedimiento experimental. Incluso cuando una moneda selanza al azar repetidamente, no es posible garantizar que en un lanzamiento dado se obtendr a co-mo resultado una cara. No obstante, sı se conoce el conjunto completo de posibilidades para cadalanzamiento.

2.2.1. Espacio MuestralDefinicion 2.2.1 Al conjunto de todos los resultados posibles de un experimento estadıstico se le llama espacio muestral y se representa por la letra S.

A cada resultado en un espacio muestral se le llama elemento del espacio muestral o simple-mente punto muestral.

Ejemplo 2.2.1 Determine el espacio muestral del siguiente experimento: se lanza una moneda y si sale cara, se lanza un dado; si sale sello, se vuelve a lanzar.

2.2.2. EventosDefinicion 2.2.2 Un evento A, respecto a un espacio muestral S, asociado a un experimento E,es un subconjunto de resultados posibles.

Es claro que S en sı mismo es un evento y tambien lo es el conjunto vacıo. Cualquier resultadoindividual tambien puede considerarse como un evento.

26

Page 28: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 28/82

Definicion 2.2.3 El complemento de un evento A con respecto a S es el conjunto de todos los elementos de S que no est´ an en A, es decir, es el suceso que se da si A no ocurre. Denotamos el complemento de A por el sımbolo Ac, tambien escrito A.

Definicion 2.2.4 La intersecci´ on de dos eventos A y B, A∩B, es el evento que contiene a todos los elementos comunes a A y a B, es decir, es el evento que ocurre si A y B ocurren.

Definicion 2.2.5 Dos eventos A y B son mutuamente excluyentes o disjuntos si A∩B = ∅,esto es, si A y B no tienen elemento comunes.

Definicion 2.2.6 La uni´ on de los dos eventos A y B, A∪B es el evento que contiene a todos los elementos que pertenecen a A, o a B o a ambos.

Ejemplo 2.2.2 Sea el experimento

E: lanzar un dado y observar el numero que sale,

y sean los eventos:

A: sale un numero par,

B: sale un numero impar,

C: sale un numero primo.

Determinar el espacio muestral y los elementos de los siguientes conjuntos:

a) A ∪ C

b) B ∩ C

c) C c

Definicion 2.2.7 Sea A la clase de eventos (aleatorios) de S. A es un σ- ´ algebra de subconjuntos de S (no vacıo) si:

i) S ∈ Aii) A ∈ A → Ac ∈ A

iii) A1, A2, . . . ∈ A → ∞i=1 Ai ∈ A

Nota: (S,A

) se llama espacio medible.

Ejercicios 3 Demuestre las siguientes propiedades:

i) ∅ ∈ Aii) A1, A2, . . . , An ∈ A → n

i=1 Ai ∈ A,n

i=1 Ai ∈ Aiii) A1, A2, . . . ∈ A → ∞

i=1 Ai ∈ A

27

Page 29: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 29/82

2.2.3. Medida de Probabilidad

Finalmente, dado un σ- algebra A de eventos de S, para concretar nuestro modelo debemosintroducir una medida de probabilidad sobre (S,A).

Definicion 2.2.8 Una medida de probabilidad P sobre (S,

A) es una funci´ on

P : A → [0, 1]

tal que cumple con los siguientes tres axiomas de Kolmogorov:

A1 P(A) > 0 ∀ A ∈ AA2 P(S ) = 1

A3 Si A1, A2, . . . ∈ A son disjuntos dos a dos, entonces

P ∞

i=1

Ai =∞

i=1

P (Ai)

(S, A, P)se llama modelo de probabilidad .

Lema 1 Sea (S, A, P) un modelo de probabilidad. Entonces valen las siguientes propiedades:

a) P(∅) = 0

b) Si A1, . . . , An ∈ A son disjuntos dos a dos, entonces

P n

i=1

Ai =n

i=1

P (Ai)

Propiedades de P

Dado un modelo de probabilidad (S, A, P) se desprende de A1, A2 y A3 que:

P1) P(Ac) = 1 − P(A)

P2) A ⊆ B → P(A) ≤ P(B)

P3) P(A ∪ B) = P(A) + P(B) − P(A ∩ B)

P4) P(∞

i=1 Ai) ≤ ∞

i=1 P(Ai)

Ejercicios 4 .

1. Un espacio muestral S se compone de cuatro elementos, es decir, S = a1, a2, a3, a4. ¿Bajocu´ ales de las siguientes funciones S l lega a ser un espacio probabilıstico?

a)P(a1) = 1/2 P(a2) = 1/3 P(a3) = 1/4 P(a4) = 1/5

28

Page 30: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 30/82

b)P(a1) = 1/2 P(a2) = 1/4 P(a3) = 1/4 P(a4) = 1/2

c)P(a1) = 1/2 P(a2) = 1/4 P(a3) = 1/8 P(a4) = 1/8

d)P(a1) = 1/2 P(a2) = −1/4 P(a3) = 1/4 P(a4) = 0

2. Sean tres sucesos A, B y C . Encuentre expresiones para los siguientes sucesos en lenguaje de conjuntos.

a) S´ olo ocurre A.

b) Ocurren tanto B como C , pero no ası A.

c) Los tres sucesos ocurren.

d) Ninguno de los tres sucesos ocurre.

e) A lo m´ as dos de ellos ocurren.f ) Al menos dos de los sucesos ocurren.

g) Al menos uno de los sucesos ocurre.

h) Exactamente dos de ellos ocurren.

29

Page 31: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 31/82

2.2.4. Espacios Probabilısticos Finitos

Consideremos un espacio muestral S y la clase A de todos los sucesos. S se convierte en unespacio probabilıstico asignando probabilidades a los sucesos de A de tal forma que satisfaga losaxiomas de probabilidad.

Espacios finitos equiprobablesSupongamos que S es un espacio muestral finito con n elementos y supongamos que las caracterısti-cas fısicas del experimento sugieren que a varios de los resultados se les asignen probabilidaes iguales.Entonces S se convierte en un espacio probabilıstico, llamado espacio finito equiprobable , si a ca-da punto se le asigna probabilidad 1/n y si a cada suceso A que contiene r puntos, probabilidad r/n.

Por lo tanto,

P(A) = n(A)

n(S )

Teorema 2.2.1 Sea S un espacio muestral finito, y para cualquier A

∈ S sea

P(A) = n(A)

n(S )

Entonces P cumple los axiomas A1, A2 y A3.

Ejemplo 2.2.3 Supongamos que se elige aleatoriamente a un estudiante entre 80, de los cuales 30 estudian matem´ aticas, 20 quımica y 10, ambas. Hal lar la probabilidad p de uqe un estudiante est´ a estudiando matem´ aticas o quımica.

Sea S un espacio muestral finito, digamos S =

a1, a2, . . . , an

un espacio probabilıstico finito, o

modelo probabilıstico finito, se obtiene asinando a cada punto ai de S un numero real pi llamadoprobabilidad de ai, que cumple con las siguientes propiedades:

a) cada pi es no negativo, pi ≥ 0

b) n

i=1 pi = 1

Ejercicios 5 .

1. Supongamos que A y B son sucesos con

P(A) = 0,6; P(B) = 0,3 y P(A

∩B) = 0,2

Hallar la probabilidad de

a) A no ocurra.

b) B no ocurra.

c) A o B ocurran

d) Ni A ni B ocurran

30

Page 32: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 32/82

2. Un naipe ingles consta de 52 cartas agrupadas en cuatro pintas (coraz´ on, pique, trebol y diamante) y 13 “n´ umeros” (As, 2, . . ., 9, 10, J, Q K). Se elige consecutivamente al azar y sin reemplazo cinco cartas de este naipe. Calcule las probabilidades de los siguientes eventos o sucesos:

a) Las primeras tres cartas son diamantes y las dos ´ ultimas son pique.

b) Hay exactamente cuatro cartas del mismo “n´ umero”.

c) Hay tres cartas de un mismo “n´ uumero” y dos de otro.

31

Page 33: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 33/82

2.3. Probabilidad Condicionada e Independencia

2.3.1. Probabilidad Condicional

Definicion 2.3.1 Supongamos que A, B son sucesos de un espacio muestral S. La probabilidad

condicional que A ocurra dado que B ha ocurrido, P(A

|B) se define y denota como

P(A | B) = P(A ∩ B)

P(B) , P(B) > 0

y P(A | B) = 0, si P(B) = 0.

P(A | B) mide en cierto modo la probabilidad relativa de A con respecto al espacio reducido deB.

Ejemplo 2.3.1 Hallar P(B | A) si:

1. A es un subconjunto de B.

2. A y B son mutuamente excluyentes. (Asumimos que P(A) > 0)

Teorema 2.3.1 Supongamos que S es un espacio equiprobable, y que A y B son sucesos. Entonces

P(A | B) = n(A ∩ B)

n(B)

es una medida de probabilidad

Ejemplo 2.3.2 Se tiran un par de dados y se define

A: salga 2 en al menos uno de los dados

B: la suma es 6.

Encontrar P(A | B) y P(A)

Teorema 2.3.2 (Multiplicaci´ on para la probabilidad condicional)

P(A ∩ B) = P(B | A)P(A)

Corolario 1 P(A ∩ B ∩ C ) = P(C | A ∩ B) · P(B | A) · P(A)

Ejemplo 2.3.3 Un lote contiene 12 objetos de los cuales 4 son defectuosos. Se sacan tres objetos al azar del lote, uno detr´ as de otro. Hallar la probabilidad de los tres no sean defectuosos.

32

Page 34: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 34/82

Definicion 2.3.2 Los sucesos A y B son independientes si P(A∩B) = P(A)P(B), de cualquier otra forma serıan dependientes.

Esta definicion nos lleva a concluir que A y B son sucesos independientes si

P(A

|B) = P(A) y P(B

|A) = P(B)

Nota:

1.- Se dice que A1, A2, . . . , An ∈ A son dos a dos independientes ssi

P(Ai ∩ A j) = P(Ai) · P(A j) ∀ i < j

2.- Independencia dos a dos no implica independencia completa.

3.- La complementacion de uno o mas eventos no destruye la independencia.

4.- Sea C ∈ A un evento tal que P(C ) > 0. Entonces A y B son condicionalmente independientesdado C,A⊥B | C ⇔ P(A ∩ B | C ) = P(A | C ) · P(B | C )

5.- Observemos que los eventos disjuntos no son independientes a menos que uno de ellos tengaprobabilidad cero. Es decir, supongamos A ∩ B = ∅ y A y B son independientes. Entonces

P(A)P(B) = P(A ∩ B) = 0

y por lo tantoP(A) = 0 o P(B) = 0

Ejemplo 2.3.4 .

1. Demostrar que si A y B son sucesos independientes, entonces A y B son sucesos indepen-dientes.

2. Urna de Polya Una urna contiene a fichas azules y r fichas rojas. El experimento consiste en:

(i) Extraer una ficha y observar su color.

(ii) Devolver la ficha con t fichas adicionales del mismo color.

(iii) Seguir iterandoPara tres ectracciones defina:

Ai : la i-esima ficha es azul, i= 1, 2, 3.

Calcule P(A1 ∩ A2 ∩ A3)

33

Page 35: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 35/82

2.3.2. Probabilidad Total

Definicion 2.3.3 Una familia de eventos B1, . . . , Bn ∈ A se llama partici´ on de S si:

k

i=1

Ai = S y Ai ∩ A j = ∅ ∀ i = j.

Teorema 2.3.3 Supongamos que los sucesos A1, A2, . . . , Ak forman una partici´ on de S. Entonces para cualquier evento B se tiene que

P(B) =k

i=1

P(B | Ai)P(Ai)

2.3.3. Teorema de Bayes

Teorema 2.3.4 Bajo las mismas condiciones del teorema anterior se tiene que

P(Ai | B) = P(B | Ai)P(Ai)k j=1 P(A j)P(B | A j)

Ejercicios 6 .

1. Supongamos que tenemos las tres cajas siguientes:

La caja A tiene 3 fichas rojas y 5 blancas.

La caja B tiene 2 rojas y una blanca.

La caja C tiene 2 rojas y 3 blancas.

Se escoge una caja al azar, y una ficha de dicha caja. Si la ficha es roja, hallar la probabilidad de que sea de la caja A.

2. En una ciudad el 40 % de la gente se considera conservadora (C), el 35 % liberales (L), y el 25 % independientes (I). Durante las elecciones votaron el 45 % de los conservadores, el 45 % de los liberales y el 60 % de los independientes tambien. Si se elige un votante al azar, hallar la probabilidad de que el votante sea conservador, liberal e independiente. bilidad de que esta persona tenga el c´ ancer en cuesti´ on? lidad de que el proceso de llenado de las botellas haya sido a baja velocidad, si se sabe que la botella est´ a efectivamente con un volumen incorrecto?

34

Page 36: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 36/82

2.4. Variables Aleatorias

2.4.1. Introduccion

Informalmente una variable aleatoria puede definirse como una funcion numerica sobre Ω, elespacio muestral:

X : Ω → R

X es una funcion tal que asigna a cada ω ∈ Ω un numero.

Nota: Usualmente, el recorrido de X , Rec(X ), es un subconjunto de R.

Ejemplo 2.4.1 Sea Ω = CC, CS, SC, SS y sea la variable aleatoria definida por

X (ω) = n´ umero de caras, ω ∈ Ω

¿Cu´ al es el recorrido de la variable aleatoria X ?

Formalmente:

Definicion 2.4.1 Dado un modelo de probabilidad (Ω, A, P), diremos que una funci´ on

X : Ω → R

es una variable aleatoria ssi

ω ∈ Ω : X (ω) ≤ x ∈ A, ∀x ∈ R

∴ X es una variable aleatoria en (Ω, A, P) ssi ω ∈ Ω : X (ω) ≤ x es un evento (aleatorio) enA, ∀ x ∈ R

Notacion: Si el valor de la variable aleatoria se denota por una letra minuscula , la variablese denota por la letra mayuscula correspondiente. Normalmente se utilizan las ultimas letras delalfabeto.El suceso “el valor x de X pertenece al conjunto B”se denota por X ∈ B. Cuando B = x sesimplifica la notacion a X = x.

Definicion 2.4.2 Dada una variable aleatoria X definida en (Ω, A, P), la distribuci´ on de prob-

abilidad inducida por X en R se define, para un evento B ⊂ R como:

PX (B) = P(X −1(B))

donde X −1(B) =

ω ∈

Ω : X (ω)∈

B

es un evento en Ω.

Conocer la distribucion de probabilidad para un subconjunto B implica que podemos PX paracualquier B ⊂ R (medible).

En general, cada B ⊂ R medible puede generarse a partir de uniones y/o intersecciones deintervalos de la forma [an, bn]. La coleccion de estos intervalos de la forma (a, b] genera una σ-algebra en R, llamada σ-algebra de Borel y denotada por B . Los elementos de B se llamanBorelianos y son subconjuntos medibles de R.

35

Page 37: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 37/82

Proposicion 1 PX es una medida de probabilidad en (R, B) → (R, B, PX ) es una medida de probabilidad (inducida por la variable aleatoria X ).

Definicion 2.4.3 La funci´ on definida por

F X (x) = PX ((

−∞, x])

= P(X ≤ x), x ∈ R

se llama funci´ on de distribuci´ on acumulada , f.d.a, de la variable aleatoria X .

Propiedades

Sea F X (x), x ∈ R, la funcion distribucion de X ,

P1)lım

x→−∞F X (x) = 0 y lım

x→∞F X (x) = 1

(0 ≤ F X (x) ≤ 1 ∀ x)

P2) Si x1 < x2, entonces F X (x1) ≤ F X (x2)

(F X es no decreciente en R)

P3)lımx→x0

F X (x) = F X (x0) ∀ x0 ∈ R

(F X es continua por la derecha)

36

Page 38: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 38/82

2.4.2. Variables Aleatorias Discretas

F X (x), x ∈ R, es discreta ssi la variable aleatoria X es discreta, es decir, X asume valores enun subconjunto contable de R.

X (ω) ∈ x1, x2, . . . ∀ ω ∈ R

En tal caso, F X (x), x ∈ R, puede representarse como:

F X (x) =t≤x

P(X = t), x ∈ S,

dondeP(X = x), x ∈ R, se llama funcion de probabilidad.

Sigue de la definicion de P(X = x), x ∈ R, que:

i)P(X = x) ≥ 0 ∀ x ∈ R

ii) x∈R

P(X = x) = 1

iii)

PX (B) = P(X ∈ B) =x∈B

P(X = x)

Ejemplo 2.4.2

Un dado no equilibrado asigna a la cara con el n´ umero x probabilidades dadas por

p(x) = c × 0, 7x × 0, 36−x, x = 1, . . . , 6

1. Calcule el valor de c.

2. Haga una tabla con los valores de la funci´ on de distribuci´ on F.

3. Utilice la tabla para calcular la probabilidad que

(i) El n´ umero este entre 2 y 4.

(ii) El n´ umero sea mayor que 2.

Ejemplo 2.4.3 Si 50% de los autom´ oviles extranjeros que vende una agencia est´ a equipado para trabajar con diesel, encuentre una f´ ormula para la distribuci´ on de probabilidad del n´ umero de modelos diesel entre los pr´ oximos 4 autom´ oviles que venda esta agencia. Determine la f.d.a de la variable de interes.

37

Page 39: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 39/82

2.4.3. Variables Aleatorias Continuas

F X (x), x ∈ R es continua ssi existe una funcion no negativa f X (x), x ∈ R, tal que:

F X (x) =

x−∞

f X (t)dt, ∀ x ∈ R

f X (x) = dF X (x)dx

donde f X (x) se denomina funcion de densidad de la variable aleatoria X .

Note que:

i)f X (x) ≥ 0 ∀ x

ii)

−∞

f X (x) dx = 1

iii)

PX (B) = P(X ∈ B) =

B

f X (x)dx

Si B es un intervalo, por ejemplo, B = (a, b), entonces se tiene lo siguiente:

PX (B) = P(a < X < b)

= P(a < X < b)

= P(a < X ≤ b) pues P(X = b) = 0,

= F X (b)

−F X (a)

= b−∞

f X (x) dx − a−∞

f X (x) dx = B

f X (x) dx

Ejemplo 2.4.4 Suponga que el error de la temperatura de reacci´ on, en C, para un experimentocontrolado de laboratorio es una variable aleatoria continua X, que tiene funci´ on de densidad de probabilidad:

f X (x) =

x2

3 , -1 < x < 2

0, e.o.c.

a) Verifique la condici´ on (ii).

b) Encuentre P(0 < X ≤

1)

Definicion 2.4.4 La distribuci´ on acumulada F X (x) de una variable aleatoria continua X con densidad f X es:

F X (x) = P(X ≤ x) =

x−∞

f X (t) dt x ∈ R

Ejemplo 2.4.5 Para la funci´ on de densidad del ejemplo anterior, encuentre F X y utilıcela para calcular P(0 < X ≤ 1)

38

Page 40: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 40/82

2.4.4. Localizacion y dispersion de una variable aleatoria

Definicion 2.4.5 La esperanza de una variable aleatoria X se define como:

E (X ) =

i=1

xif x(xi), X discreta

∞−∞

xf X (x)dx, X continua

Notaci´ on: µX = E (X )

Propiedades

1.- La esperanza matematica es un operador lineal, esto es, si E (X ) esta bien definida, entonces

E(aX + b) = aE(X ) + b

2.- Si X e Y son variables aleatorias, entonces

E(X + Y ) = E(X ) + E(Y )

3.- Si X e Y son variables aleatorias con esperanzas bien definidas y tales que

X (ω) ≤ Y (ω) ∀ ω

entonces E(X ) ≤ E(Y )

Definicion 2.4.6 La mediana de una variable aleatoria X es alg´ un n´ umero m tal que:

P(X ≥ m) ≥ 1/2 y P(X ≤ m) = 1/2

Notas:

i) Si X tiene distribucion simetrica y E (X ) < ∞, entonces E (X ) es una mediana para X .

ii) Si X tiene distribucion asimetrica, la mediana de X puede ser una mejor medida de local-izacion.

Dos distribuciones pueden tener la misma localizacion y ser completamente diferentes, por loque hay que considerar una medida de dispersion de la variable, la mas comun, es la varianza.

Definicion 2.4.7 La varianza de una variable aleatoria X se define como

V (X ) = E [(X − E (X ))

2

]

V (X ) =

∞i=1

(xi − E (X ))2P(X = xi) ∞−∞

(x − E (X ))2f X (x)dx

Notaci´ on: σ2X = V (X )

39

Page 41: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 41/82

Propiedades

1.- V (X ) = E (X 2) − (E (X )2)

2.- V (X ) ≥ 0, V (X ) = 0 ↔ X = c

3.- V (aX + b) = a2

V (X )4.- Si X e Y son variables aleatorias, entonces

V(X + Y ) = V(X ) + V(Y ) − 2 · Cov(X, Y )

Solo en el caso en que X e Y son variables aleatorias independientes, entonces

V(X + Y ) = V(X ) + V(Y )

Ejemplo 2.4.6 Sea X la variable aleatoria que cuenta el n´ umero de caras en tres lanzamientos de una moneda honesta. Determine el recorrido, la funci´ on de distribuci´ on, valor esperado y varianza de X.

Ejemplo 2.4.7 Sea A un evento en (Ω, A, P), con P(A) = p, con 0 ≤ p ≤ 1. Usted paga $ 1 se Aocurre y $ 0 si A ocurre.Sea X la ganancia obtenida en un ensayo de este experimento. Determine esperanza y varianza de X .

40

Page 42: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 42/82

2.4.5. Casos especiales de distribuciones probabilidad

Distribucion Bernoulli

Consideremos un experimento con solo dos resultados posibles, uno que se llame exito (E) yotro, fracaso (F). Los resultados sucesivos e independientes de tal experimento se llaman pruebas

o experimentos Bernoulli.En realidad, cualquier experiemnto puede ser usado para definir un ensayo Bernoulli simplementedenotando algun evento de interes, A, como exito y su complemento, A, como fracaso.

Notacion: X ∼ Bernoulli( p) y su funcion de probabilidad esta dada por

P(X = x) = px(1 − p)1−x, x = 0, 1

donde

E (X ) = p

V (X ) = p(1 − p)

Distribucion Binomial

Un experimento que consiste de n ensayos Bernoulli independientes, cada uno con probabilidadde exito p, se llama un experimento Binomial con n ensayos y parametro p.Al decir “ensayos independientes”significa que los ensayos son eventos indeoendientes esto es, loque ocurra en un ensayo no tiene efecto en el resultado observado para cualquier otro ensayo.

Definicion 2.4.8 Sea X el n´ umero total de exitos observados en un experimento Binomial con nensayos y par´ ametro p. Entonces X se llama variable aletoria Binomial con par´ ametros n y p

y se denota X ∼ Bin(n, p)

y su funci´ on de probabilidad est´ a dada por

P(X = x) =

n

x

px(1 − p)n−x, x = 0, 1, . . . , n

Teorema 2.4.1 La esperanza y varianza de la distribuci´ on Binomial est´ an dadas por:

E (X ) = n · pV (X ) = n

· p

·(1

− p)

Ejemplo 2.4.8 Se sabe que el n´ umero de pacientes graves en una urgencia es una variable aleatoria Binomial con una media de 12 pacientes graves y una varianza de 3. Determine la probabilidad que en un dıa haya a lo menos 2 pacientes en estado grave.

41

Page 43: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 43/82

Distribucion Geometrica

Definicion 2.4.9 Si se realizan repetidos experimentos Bernoulli independientes con probabilidad de exito p, entonces la distribuci´ on de la variable aleatoria X , el n´ umero de experimentos necesarios hasta encontrar el primer exito sigue una distribuci´ on geometrica de par´ ametro p y se denota por:

X ∼ Geo( p)

con funci´ on de probabilidad dada por

P(X = x) = (1 − p)x−1 p, x = 1, 2, 3, . . .

Teorema 2.4.2 La esperanza y varianza de la distribuci´ on geometrica est an dadas por:

E (X ) = 1

p

V (X ) = 1 − p

p2

Ejemplo 2.4.9 Cacule la probabilidad de que deba lanzar un dado por lo menos 6 veces hasta obtener un 5.

Distribucion Binomial Negativa

Definicion 2.4.10 Consideremos ensayos Bernoulli independientes con probabilidad de exito p en cada ensayo. Si X es el n´ umero de ensayos necesarios para observar el r-esimo exito, entonces X se llama variable aleatoria Binomial negativa con par´ ametros r, y p su funci´ on de probabilidad est´ a dada por

P(X = x) = x − 1r − 1

pr (1 − p)x−r, x ∈ r, r + 1, . . .

y se denota por X ∼ BinNeg(r, p)

Teorema 2.4.3 La esperanza y varianza de la distribuci´ on Binomial Negativa est´ an dadas por:

E (X ) = r

p

V (X ) = r(1 − p)

p2

Ejemplo 2.4.10 Cacule la probabilidad de que deba lanzar un dado por lo menos 6 veces hasta obtener 5 tres veces.

42

Page 44: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 44/82

Distribucion Poisson

Definicion 2.4.11 Una variable aleatoria X que cuenta el n´ umero de eventos que ocurren en un perıodo de tiempo tiene distribuci´ on Poisson de par´ ametro λ > 0, y su funci´ on de probabilidad est´ a dada por

P(X = x) =

e −λλx

x! , x = 0, 1, . . .y se denota por

X ∼ Poisson(λ)

Teorema 2.4.4 La esperanza y varianza de la distribuci´ on Poisson est´ an dadas por:

E (X ) = λ

V (X ) = λ

Ejemplo 2.4.11 Se sabe que los pacientes llegan de acuerdo a una distribuci´ on Poisson con λ = 3 pacientes/minuto. Cuando llegan m´ as de 4 pacientes por minuto la secretaria se ve sobrepasada y el servivio de atenci´ on es calificado como deficiente. ¿Cu´ al es la probabilidad de que el sistema sea calificado como no deficiente?

Distribucion Uniforme

Definicion 2.4.12 Una variable aleatoria X tiene distribuci´ on uniforme si su densidad se dis-tribuye por igual entre dos valores cualquiera a y b. Su funci´ on de densidad est´ a dada por

f X (x) =

1b−a

, a < x < b,

0, e.o.c.

Notaci´ on: X ∼ U (a, b)

Teorema 2.4.5 La esperanza y varianza de la distribuci´ on Uniforme est´ an dadas por:

E (X ) = a + b

2

V (X ) = (b − a)2

12

Ejemplo 2.4.12 En los dıas del verano, X, el tiempo de retraso de un tren del Metro, se puede modelar como distribuida uniformemente entre 0 y 20 minutos.

1. Calcule la probabilidad de que el tren l legue por lo menos con 8 minutos de retraso.

2. Calcule la desviaci´ on est´ andar del tiempo de retraso del tren.

43

Page 45: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 45/82

Distribucion Exponencial

Definicion 2.4.13 Suponga que los eventos suceden aleatoriamente a lo largo del tiempo, con un tiempo esperado entre eventos β . Sea X, la variable aleatoria que cuenta el tiempo para el siguiente evento, entonces X tiene distribuci´ on exponencial y su funci´ on densidad est´ a dada por

f X (x) = 1β e

−x/β

, x > 0,0, e.o.c.

donde β > 0 y se denota por

X ∼ exp(β )

Teorema 2.4.6 La esperanza y varianza de la distribuci´ on Exponencial est´ an dadas por:

E (X ) = β

V (X ) = β 2

Ejemplo 2.4.13

En un centro rural para la atenci´ on de emergencias el tiempo entre llegadas sigue una distribuci´ on exponencial con un tiempo media de llegadas de 1.25 horas. Encuentre la probabilidad de que el tiempo entre llegadas sea mayor a 1 hora. Encuentre la probabilidad de que el tiempo entre llegadas sea mayor a 2 horas.

Distribucion Normal

Definicion 2.4.14 La variable aleatoria X tiene distribuci´ on normal con media µ y varianza σ2 si su funci´ on de densidad est´ a dada por

f X (x) = 1√

2πσ2e −

(x−µ)2

2σ2 , −∞ < x < ∞

Notaci´ on: X ∼ N(µ, σ2)

Definicion 2.4.15 Si Z es una variable aleatoria normal con media 0 y varianza 1, entonces Z se llama variable aleatoria normal est´ andar .

Cualquier variable aleatoria normal X se puede transformar en una variable aleatoria normalestandarizada Z , sustrayendo el valor esperado µ y dividiendo el resultado por σ .

Ejemplo 2.4.14 Considere la distribuci´ on normal est´ andar con media µ = 0 y desviaci´ on σ = 1.1. ¿Cu´ al es la probabilidad que z sea mayor que 2,6?

2. ¿Cu´ al es la probabilidad que z sea menor que 1,3?

3. ¿Cu´ al es la probabilidad que z este entre -1.7 y 3.1?

4. ¿Cu´ al es el valor de z que corta el 15 % menor de la distribuci´ on?

44

Page 46: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 46/82

Ejercicios 7 .

1. Clasifique las siguientes variables como discretas o continuas.

X : el n´ umero de accidentes de autom´ ovil por a˜ no en la ciudad de Santiago.

Y : el tiempo que toma jugar 18 hoyos de golf.

M : la cantidad de leche producida anualmente por una vaca en particular.

N : el n´ umero de huevos que pone mensualmente una gallina.

P : el n´ umero de permisos para la construcci´ on de edificios que otorga mensualmente una municipalidad.

Q : la cantidad de kilos de manzanas que exporta una empresa.

2. Si p(x) = c · (5 − x) para x = 0, 1, 2, 3. ¿Cu´ al es el valor de c?

3. Ciertos ıtemes son producidos por una m´ aquina, cada item es clasificado como de primera osegunda calidad; los ıtemes de segunda calidad representan al 5 % de la producci´ on total. Si se inspeccionan ıtemes hasta que se encuentra el quinto de segunda calidad,

a) Determine la variable aleatoria y su funci´ on de probabilidad.

b) ¿Cu´ al es el n´ umero esperado de ıtemes que se deben inspeccionar para detectar el quintode segunda calidad?

c) ¿Cu´ al es la probabilidad de que se tengan que inspeccionar 7 artıculos?

4. Una variable aleatoria continua X que puede tomar valores entre x=2 y x=5 tiene una funci´ on de densidad

f X (x) = 2(1 + x)27

Calcule

a) P(X < 4)

b) P(3 < X < 4)

5. Una m´ aquina que marca n´ umeros telef´ onicos al azar selecciona aleatoriamente cuatro dıgitos entre 0000 y 9999 (incluido ambos). Trate a la variable Y, el n´ umero seleccionado, comosi fuese continua (aun cuando hay solo hay 10000 posibilidades discretas) y uniformemente distribuida.

a) Encuentre P(0300 < Y < 1300)

b) P(Y > 5555)

c) Encuentre la varianza de Y

6. En una central nuclear ocurren aleatoriamente a lo largo del tiempo “eventos poco comunes”(problemas menores de operaci´ on). El tiempo medio entre dos eventos es 40 dıas.

45

Page 47: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 47/82

a) ¿Cu´ al es la probabilidad de que el tiempo para el siguiente “evento poco com´ un” se en-cuentre entre 20 y 60 dıas?

b) ¿Cu´ al es la probabilidad de que pasen m´ as de 60 dıas sin probemas?

c) Encuentre la desviaci´ on est´ andar del tiempo para el siguiente “evento poco com´ un”.

d) Un an´ alisis de los archivos de la central nuclear muestra que los “eventos poco comunes”suceden con mayor frecuencia los fines de semana, ¿que hip´ otesis subyacente a las re-spuestas de las preguntas anteriores se pone en duda?

7. Sea Z una variable aleatoria normal estandarizada. Calcule:

a) P(0 ≤ Z ≤ 1,96)

b) P(Z > 1,96)

c) P(−1,96 ≤ Z ≤ 1,96)

d) P(0 ≤ Z ≤ 1,96)

8. Los ingresos anuales de los profesores de la universidad siguen una distribuci´ on normal con media 18600 d´ olares y una desviaci´ on est´ andar de 27000 d´ olares. Encuentre la probabilidad de que un profesor seleccionado al azar tenga

a) un ingreso anual inferior a 15000 d´ olares.

b) un ingreso mayor a 21000 d´ olares.

c) un ingreso mayor a 25000 y de a lo m´ as 30000 d´ olares.

46

Page 48: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 48/82

2.4.6. Funciones de Variables Aleatorias

Definicion 2.4.16 Sea X una variable aleatoria y sea g una funci´ on con dominio en S y valores en R. El valor esperado de g(X) est´ a dado por

E(g(X )) = ∞

i=1

g(xi)P(X = xi), X discreta ∞−∞

g(x)f (x)dx, X continua

Momentos y funciones generadoras de momentos

Definicion 2.4.17 Dada una variable aleatoria X se definen:

(i)

E (X

k

) =

i=1

xki f x(xi), X discreta

∞−∞

xkf X (x)dx, X continua

como el k-esimo momento (no centrado) de X.

(ii)

E ((X − µ)k) =

∞i=1

(xi − µ)kf x(xi), X discreta ∞−∞

(x − µ)kf X (x)dx, X continua

como el k-esimo momento centrado de X.Definicion 2.4.18 La funci´ on generadora de momentos (f.g.m.) de una variable aleatoria X se define como

M X (t) =

∞i=1

e txif x(xi), ∞−∞

e txf X (x)dx,

con t ∈ R.

Ejemplo 2.4.15 Determine su funci´ on generadora de momentos para las siguientes distribuciones:

a) X ∼ Bin(n, p)

b) X ∼ N(0, 1)

Teorema 2.4.7 Sea X una variable aleatoria con funci´ on generadora de momentos M X (t). En-tonces

E (X k) = dkM X (t)

dtk

t=0

47

Page 49: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 49/82

Ejemplo 2.4.16 Utilizando las respectivas f.g.m calcule la media de X si

a) X ∼ Bin(n, p)

b) X ∼ N(0, 1)

Teorema 2.4.8 (Teorema de Unicidad)Sean X e Y dos avriables aleatorias con funciones generadoras de momentos M X (t) y M Y (t), re-spectivamente. Si M X (t) = M Y (t) para todos los valores de t, entonces X e Y tienen la misma distribuci´ on de probabilidad.

Teorema 2.4.9 Si Y = cX + d, entonces M Y (t) = e tdM X (ct)

Ejemplo 2.4.17 Sea X una variable aleatoria con distribuci´ on normal est´ andar. Determine la f.g.m. de Y = µ + σX .

Transformacion de variables

Frecuentemente, en estadıstica, se presenta la necesidad de deducir la distribucion de probabili-dad de una funcion de una o mas variables aleatorias. Por ejemplo supongamos que X es una variablealeatoria discreta con distribucion de probabilidad f (x) y supongamos ademas que Y = g(X ) de-fine una transformacion uno a uno entre los valores de X e Y . Se desea encontrar la distribucionde probabilidad de Y . Es importante resaltar el hecho que la transformacion uno a uno implicaque cada valor de x esta relacionado con un, y solo un valor de y = g(x) y que cada valor de yesta relacionado con un, y solo un valor de x = g−1(y).

Teorema 2.4.10 Sea X una variable aleatoria discreta con distribuci´ on de probabilidad f(x). Si Y = g(X) define una transformaci´ on uno a unn entre los valores de X e Y de tal forma que la

ecuaci´ on y = g(x) pueda resolverse ´ unicamente para x en terminos de y. Entonces la distribuci´ on de probabilidad de Y es

f Y (y) = f X (g−1(y))

Ejemplo 2.4.18 Sea X una variable aleatoria geometrica con distribuci´ on de probabilidad

f X (x) = 3

4

1

4

x−1

, x = 1, 2, . . .

a) Encuentre al distribuci´ on de la variable aleatoria de Y = X 2

b) Encuentre la distribuci´ on para la variable aleatoria Z = 4−

5X

Teorema 2.4.11 Suponga que X es una variable aleatoria continua con distribuci´ on de probabilidad f (x). Sea Y = g(X ), con g una funci´ on uno a uno entre los valores de X e Y . Entonces la distribuci´ on de probabilidad de Y est´ a dada por

f Y (y) = f X (g−1(y))|J |donde J = (g−1(y)) y recibe el nombre de Jacobiano de la tranformaci´ on.

48

Page 50: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 50/82

Ejemplo 2.4.19 .

a) Sea X una variable aleatoria continua con funci´ on densidad

f X (x) = x

12, 1 < x < 5

Encuentre la distribuci´ on de probabilidad de la variable aleatoria Y = 2X − 3.

b) Sea X una variable aleatoria con densidad Beta(a,b), es decir,

f X (x) = Γ(a + b)

Γ(a)Γ(b)xa−1(1 − x)b−1, 0 < x < 1.

Determinar la distribuci´ on de Y = 1 - X.

Teorema 2.4.12 Sea X una variable aleatoria continua con funci´ on densidad f X (x). Si Y = g(X )es una transfromaci´ on entre los valores de X e Y que no es uno a uno, es decir, para cada y ∈ R

existen k inversas, xi = g−1i (y), i = 1, . . . , k, entonces la distribuci´ on de probabilidad de Y es

f Y (y) =k

i=1

f X (g−1i (y))|J i|

donde

|J i| = d

dyg−1i (y) i = 1, . . . , k .

Ejemplo 2.4.20 . Sea X una variable aleatoria con densidad

f X (x) = 1

2e −|x|, −∞ < x < ∞.

Determinar la distribuci´ on de Y = |X |.

Ejercicios 8 .

1. Si X ∼ U (0, 1), encontrar al funci´ on densidad de Y = e X

2. Se dice que X tiene distribuci´ o Weibull si

f X (x) =

λαxα−1exp(−λxα), x > 0;0, e.o.c.

Se asume que α > 0 y λ > 0. Determine E (X ). ¿Cu´ al es la distribuci´ on de Y = X α?

49

Page 51: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 51/82

2.4.7. Aproximacion de distribuciones

Sea una variable aleatoria X ∼ Bin(n, p), por ejemplo, suponga que recoge la opinion de unamuestra de 1000 electores para saber su sentir en pro del fortalecimiento del gobierno de la ciudad.¿Cual es la probabilidad de encontrar 460 o menos electores a favor del fortalecimiento si suponemosque el 50 % de la poblacion esta a favor de el?

En este caso, sea X el numero de electores en pro del fortalecimiento, con X ∼ Bin(1000, 1/2),entonces para calcular la probabilidad pedida P(X ≤ 460) debemos sumar 461 terminos, lo que noparece una tarea facil.

En este tipo de situaciones, donde el numero de ensayos es demasiado grande (≥ 20), aproxi-maremos nuestra distribucion de probabilidad a otro distribucion, dependiendo del valor de p, laprobabilidad de exito.

Aproximacion Poisson a la distribucion Binomial

Se sugiere aproximar a la distribucion Poisson una distribucion binomial para valores de n “muy

grandes” y de p “muy pequena”. La regla es aproximar si p < 0,05 y n ≥ 20. Si n ≥ 100 la aproxi-macion es buena siempre y cuando np > 10.

En ambos casos λ = np y en vez de utilizar X ∼ Bin(n, p) usamos X ∼ P (np).

Ejemplo 2.4.21 Se sabe que el 5 % de los libros encuadernados en cierto taller tienen encuader-naciones defectuosas. Determine la probabilidad de que 2 de 100 libros encuadernados en ese taller,tengan encuadernaciones defectuosas, usando,

a) la f´ ormula de la distribuci´ on Binomial,

b) la aproximaci´ on de Poisson a la distribuci´ on Binomial.

Aproximacion Normal a la distribucion Binomial

Se sugiere aproximar la distribucion Normal a una distribucion binomial cuando n es “muygrande” y los valores de p son cercanos a 0.5.En tal caso, µ = np y σ2 = np(1 − p). Esta aproximacion deberıa utilizarse solo si np ≥ 5 yn(1 − p) ≥ 5.

Ejemplo 2.4.22 Se considera un sindicato laboral en el cual el 40 % miembros est´ a a favor de la huelga. Si se seleccionan 15 miembros de manera aleatoria, ¿cu´ al es la probabilidad de que 10 apoyen

un paro? Calcule dicha probabilidad utilizando las distribuciones Binomial y Normal por separadoy compare.

Ejercicios 9 El 45 % de todos los empleados del centro de capacitaci´ on gerencial tiene tıtulos uni-versitarios. ¿Cu´ al es la probabilidad de que de los 150 empleados seleccionados aleatoriamente, 72 tengan un tıtulo univeristario?

50

Page 52: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 52/82

2.5. Vectores Aleatorios

Definicion 2.5.1 X = (X 1, X 2, . . . , X n) es un vector aleatorio definido en (Ω, A, P) ssi X 1, X 2, . . . , Xson variables aleatorias definidas en el mismo modelo (Ω, A, P).

2.5.1. Distribucion ConjuntaDefinicion 2.5.2 La funci´ on definida por

F X 1,X 2,...,X n(x1, x2, . . . , xn) = P(X 1 = x1, X 2 = x2, . . . , X n = xn), x ∈ R

se llama funci´ on distribuci´ on conjunta de X 1, X 2, . . . , X n

Definicion 2.5.3 Sea X = (X 1, X 2, . . . , X n) un vector aleatorio en (Ω, A, P). Diremos que:

a) X = (X 1, X 2, . . . , X n) es discreto ssi

Rec(X)= Rec( X 1, X 2, . . . , X n)

es un subconjunto contable (finito o no) de Rn.

En tal caso, la distribuci´ on de probabilidad puede representarse mediante

P(X 1 = x1, X 2 = x2, . . . , X n = xn) = P

ni=1

X i = xi

Ası,

(i) P(X = x)

≥0

∀ x

∈R

n

(ii) P(X = xi) = 1

b) X = (X 1, X 2, . . . , X n) es continuo ssi existe una funci´ on

f X 1...X n : Rn → R

no negativa tal que

F X 1...X n(x1, . . . , xn) =

x1−∞

· · · xn−∞

f X 1...X n(t1, . . . , tn)dtn · · · dt1, ∀ x ∈ R

En tal caso

f X 1...X n(x1, . . . , xn) = ∂ n

∂x1 · · · ∂xn F X 1...X n(x1, . . . , xn)

Ejemplo 2.5.1 Sean X e Y variables aleatorias con funci´ on distribuci´ on conjunta dada por

F XY (x, y) =

(1 − e −x)(1 − e −y), x >0, y > 0;0, e.o.c.

Determine f XY .

51

Page 53: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 53/82

Definicion 2.5.4 La distribuci´ on de probabilidad de X = (X 1, X 2, . . . , X n) se define como:

PX (B) = P(X ∈ B) ∀ B ⊂ Bn

Ası, PX (B), B ⊂ Bn, es una medida de probabilidad.

⇒ (PX , Bn,Rn) es una medida de probabilidad.

Proposicion 2 ∀ B ∈ Bn

PX (B) = P(X ∈ B) =

x∈B

P(X = x), X discreta x∈B

f X (x)dx, X continua

Teorema 2.5.1 Sea X un vector aleatorio continuo n- dimensional con densidad f X (x). Sea g =(g1, g2, . . . , gn) una funci´ on. Considere el vector aleatorio Y = g(X ). Esto significa que se considera la transformaci´ on

y1 = g1(x1, . . . , xn)

y2 = g2(x1, . . . , xn)

...

yn = gn(x1, . . . , xn)

Finalamente sup´ ongase que g y g−1 son continuas y dieferenciables. Entonces la densidad de Y es

f Y (y) = |J |f X (g−1(y), g−12 (y), . . . , g−1n (y)) y ∈ Rn

Ejemplo 2.5.2 Sean X e Y dos variables aleatorias continuas con distribuci´ on de probabilidad conjunta

f (x, y) =

4xy, 0 < x < 1, 0 < y < 1;0, e.o.c.

Encuentre la densidad conjunta de W = X 2 y Z = XY .

52

Page 54: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 54/82

2.5.2. Distribuciones Conjuntas Especiales

Algunas distribuciones multivariadas conocidas se enuncian a continuacion:

Suponga que realiza N experimentos inpedendientes, en cada uno de los cuales puede obteneruno de los k resultados posibles, cada uno con probabilidad p1, p2, . . . , pk, respectivamente, y desea

contar cuantas repeticiones de cada resultado obtuvo.

Definicion 2.5.5 Las variables aleatorias X 1, X 2, . . . , X k tienen una distribuci´ on multinomial

si y s´ olo si su distribuci´ on de probabilidad conjunta est´ a dada por

P(X 1 = x1, X k = xk, . . . , X k = xk, ) =

n

n1 n2 · · · nk

px11 px2

2 . . . pxkk

donde r

j=1

n j = n y k

i=1

pi = 1

Lo que se denota como(X 1, . . . , X k) ∼ Mult(n, p1, p2, . . . , pk)

Ejemplo 2.5.3 Suponga que los errores de cierto procedimiento de medici´ on tienen distribuci´ on normal de media 0 y desviaci´ on est´ andar 2, en milımetros. Suponga que se toman 10 mediciones independientes. Calcule la probabilidad que: por lo menos 9 mediciones tengan errores menores a los 2 milımetros y que no m´ as de una medici´ on tenga error mayor a los 3 milımetros.

Considere un conjunto de N elementos, de los cuales M 1 son de la primera clases, M 2 de la

segunda clase, y ası sucesivamente, hasta M k de la k-esima clase, donde M i = N .Definicion 2.5.6 Las variables aleatorias X 1, . . . , X k tienen una distribuci´ on hipergeometrica

multivariada si y s´ olo si su distribuci´ on de probabilidad conjunta est´ a dada por

P(X 1 = x1, . . . , X k = xk) =

M 1x1

. . .M kxk

M n

donde

k

i=1

xi = n, y k

i=1

M i = N

Ejemplo 2.5.4 En un panel de presuntos jurados participan 6 hombres casados, tres hombres solteros, siete mujeres casadas y cuatro mujeres solteras. Si la selecci´ on es al azar, ¿cu´ al es la probabilidad de que el jurado consita de 4 hombres casados, un soltero, cinco mujeres casadas y dos solteras?

53

Page 55: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 55/82

Entre las distribuciones multivariadas continuas, la distribucion normal multivariada es de es-pecial importancia, ya que es una generalizacion de la distribucion normal en una variable.

Definicion 2.5.7 El vector aleatorio (X, Y ) tiene una distribuci´ on normal bivariada si y s´ olosi su funci´ on densidad conjunta est´ a dada por

f (x, y) = 1

2πσ1σ2

1 − ρ2

exp− 1

2(1 − ρ2)

x − µ1

σ1

2

+y − µ2

σ2

2 − 2ρx − µ1

σ1

y − µ2

σ2

para x ∈ R, y ∈ R, σ1, σ2 > 0, y −1 < ρ < 1.

Teorema 2.5.2 Si dos variables aleatorias tienen una distribuci´ on normal bivariada, son inpeden-dientes si y s´ olo si ρ = 0.

54

Page 56: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 56/82

2.5.3. Distribucion Marginal y Condicional

Dada la distribucion de probabilidad conjunta f (x, y) de las variables aleatorias X e Y , ladistribucion de probabilidad f (x) de X se obtiene al sumar f (x, y) sobre todos los valores de Y .De la misma forma, la distribucion de probabilidad f (y) se obtiene al sumar f (x, y) sobre todoslos valores de X . Cuando X e Y son variables aleatorias continuas, las sumas se reemplazan por

integrales.

Definicion 2.5.8 Las distribuciones marginales de X e Y est´ an dadas por

pX (x) =y

f XY (x, y) y pY (y) =x

f XY (x, y)

para el caso discreto y

f X (x) =

y

f XY (x, y)dy y f Y (y) =

x

f XY (x, y)dx

para el caso continuo.

Definicion 2.5.9 Sean X e Y dos variables aleatorias discretas o continuas. La distribuci´ on

condicional de la variable aleatoria Y, dado que X=x, est´ a dada por:

f Y |X (y) = f XY (x, y)

f X (y) , f X (x) > 0

Ejemplo 2.5.5 Suponga que la fracci´ on X de atletas hombres y la fracci´ on Y de atletas mujeres que terminan la carrera del marat´ on puede describirse por la funci´ on densidad conjunta

f XY (x, y) = 8xy, 0 ≤ x ≤ 1, 0 ≤ y ≤ x.

Encuentre f X , f Y y f Y |X y determine la probabilidad de que menos de 1/8 de las mujeres que se inscribieron para un marat´ on en particular la finalicen, si se sabe que exactamente 1/2 de los atletas hombres terminaron la carrera.

Definicion 2.5.10 Sean X e Y dos variables aleatorias, discretas o continuas, con distribuci´ on de probabilidad conjunta f XY y distribuciones marginales f X y f Y , respectivamente. Las variables aleatorias X e Y se dice que son independientes estadısticamente, ssi

f XY (x, y) = f X (x)f Y (y),

∀ x, y

∈R

55

Page 57: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 57/82

Ejercicios 10 . Sea X e Y variables aleatorias independientes con funciones densidades marginales

f X (x) = xe−x, x > 0 y f Y (y) = e−y y > 0

Sean

Z = X + Y, y W = X

X + Y

1. Determine las respectivas densidades marginales de Z y W .

2. ¿Son Z y W variables aleatorias independientes?

3. Obtenga la funci´ on generadora de momentos de Z , M Z (t).

56

Page 58: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 58/82

2.5.4. Esperanza y Varianza Condicional

Definicion 2.5.11 Dado un vector aleatorio (X,Y) la esperanza condicional de Y dado X=x se define como

E(Y |X = x) = yy P(Y = y|X = x), X discreta

∞−∞

y f Y |X (y)dy, X continua

Mas generalmente, si g : R −→ R

E(g(Y )|X = x) =

y

g(y)P(Y = y|X = x), X discreta ∞−∞

g(y)f Y |X (y)dy, X continua

Proposicion 3 Si E(

|Y

|) <

∞E[E(Y | X )] = E(Y )

Ejemplo 2.5.6 Sea Y |X = x ∼ U (0, 1 − x) y f X (x) = 2(1 − x), si 0 < x < 1. Determine E(Y ).

Propiedades:

i) E(c|X = x) = c

ii) E(Y 1 + Y 2|X = x) = E(Y 1|X = x) + E(Y 2|X = x)

iii) E(cY

|X = x) = c

·E(Y

|X = x)

iv) E(g(X, Y )|X = x) = E(g(x, Y ))

En particular,E(g1(X )g2(Y )|X = x) = g1(x)E(g2(Y )|X = x)

v) E(g(Y )|X = x) = E(g(Y )) ⇔ X es independiente de Y.

Definicion 2.5.12 La varianza condicional de Y dado X=x se define como

V(Y |X = x) = E[(Y − E(Y |X = x))2|X = x]

=

y

(y − E(Y |X = x))2P(Y = y|X = x), X discreta ∞−∞

(y − E(Y |X = x))2f Y |X (y)dy, X continua

Teorema 2.5.3 Suponga que E(Y 2) < ∞V(Y ) = E(V(Y |X )) + V(E(Y |X ))

57

Page 59: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 59/82

Ejemplo 2.5.7 Sean X e Y variables aleatorias continuas tales que X ∼ U (0, 1) e Y |X = x ∼U (x, x + 1).

Calcule:

a) E(Y

|X = x) y V(Y

|X = x).

b) E(Y ) y V(Y ).

c) La densidad condicional de X dado Y = y.

d) E(X |Y = y) y E(Y |X = x).

e) Considere las funciones de variables aleatorias h(Y ) = E(X |Y ) y k(X ) = E(Y |X ). Calcule la funci´ on de densidad de h(Y ) y la funci´ on de densidad de k(X ).

Ejercicios 11 .

Sean X e Y variables aleatorias tales que Y |X = x ∼ Bin(x, p) y X ∼ Poisson(λ). Determine la distribuci´ on de Y y calcule su esperanza.

58

Page 60: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 60/82

2.6. Nociones de Convergencia

El objetivo de esta seccion es estudiar el comportamiento de una secuencia de variables aleatorias,Z 1, Z 2, . . . , Z n, cuando n → ∞.

Definicion 2.6.1 Sea

Z n, n

≥1

una secuencia de variables aleatorias en (Ω,

A, P) y sea θ

∈R

una constante.Diremos que Z n converge en probabilidad para θ ssi

∀ ε > 0, P(|Z n − θ| ≥ ε) → 0, cuando n → ∞

Notacion: Z nP → θ

Ademas, note que Z nP → θ ⇔ (Z n − θ)

P → 0

Definicion 2.6.2 Sea Z n, n ≥ 1 una secuencia de variables aleatorias definidas en (Ω, A, P) y

sea Z otra variable aleatoria, cuya distribuci´ on no depende de n, la cual no necesita estar definida sobre el mismo espacio de probabilidad donde se encuentran definidas las Z n’s.Diremos que Z n converge en distribuci´ on para Z ssi

F Z n(z ) = P(Z n ≤ z ) → P(Z ≤ z ) = F Z (z )

cuando n → ∞, ∀ z donde F Z es continua.

Notacion: Z nD→ Z o F Z n → F Z

Las definiciones anteriores motivan el siguiente teorema:

Teorema 2.6.1 (del Lımite Central)Sean X 1, X 2, . . . , X n una secuencia de variables aleatorias independientes con media µ y varianza σ2 < ∞. Entonces,

√ n

X n − µ

σD→ N (0, 1)

donde

X n =n

i=1

X in

Aplicacion:Para n “suficientemente grande”

X n → N (µ, σ2/n)

59

Page 61: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 61/82

Ejercicios 12 . La distribuci´ on de las perdidas mensuales de una empresa en unidades monetarias (u.m.) es aproximadamente normal, con una media de µ = 3500 y una varianza de σ2 = 184900.

1. ¿Cu´ al es al probabilidad de que las perdidas mensuales sean inferiores a 2500 u.m.?

2. ¿Que valor separa el 5 % inferior de la distribuci´ on de las perdidas mensuales?

3. Describa la distribuci´ on de medias muestrales de tama˜ no 5 tomadas de esta poblaci´ on.

4. ¿Que valor separa el 5 % inferior de la distribuci´ on muestral de tama˜ no 5?

5. Dada una muestra de las perdidas de 5 meses, ¿cu´ al es la probabilidad de que las perdidas mensuales sean inferiores a 2500 u.m.?

6. ¿Cu´ al es al probabilidad de que s´ olo uno de los cinco meses se tenga una perdida menor a 2500 u.m.?

60

Page 62: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 62/82

Capıtulo 3

Inferencia Estadistica

3.1. Introduccion

La teorıa de la inferencia estadıstica consiste en aquellos metodos por los que se realizan in-

ferencias o generalizaciones acerca de una poblacion. La tendencia actual es la distincion entre elmetodo cl asico de estimacion de un parametro en la poblacion, por medio del cual las inferencias sebasan de manera estricta en informacion que se obtiene de una muestra aleatoria seleccionada de lapoblacion, y el metodo bayesiano, que utiliza el conocimiento subjetivo previo sobre la distribucionde probabilidad de los parametros desconocidos junto con la informacion que proporcionan los datosde la muestra. En este curso desarrollaremos los metodos clasicos para estimar los parametros dela poblacion desconocidos como la media, proporcion y varianza mediante el calculo de estadısticasde muestras aleatorias.

La inferencia estadıstica se puede dividir en doa areas principales: estimacion y pruebas dehipotesis. La estimacion de un parametro poblacional θ puede ser puntual, es decir, por algunmetodo deteminamos una formula en funcion de los datos para calcular el valor de este en la mues-tra, o intervalar, donde ademas de calcular el valor del parametro en la muestra establecemos ungrado de precision de nuestra estimacion. Con las pruebas de hipotesis lo que queremos es llegar ala decision correcta acerca de una hipotesis preestablecida, con alguna medicion de la precision denuestra decision.

Algunos conceptos de interes se definen a continuacion.

Definicion 3.1.1 Las variables aleatorias X 1, . . . , X n corresponden a una muestra aleatoria de tama˜ na n de una poblaci´ on con funci´ on densidad f (x) si

X 1, . . . , X n son mutuamente independientes

X 1, . . . , X n tienen funci´ on densidad marginal f (x)

las variables X 1, . . . , X n se denominan independientes e identicamente distribuidas, iid, y escribi-mos

X iiid∼ f (x), i = 1, . . . , n .

61

Page 63: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 63/82

Definicion 3.1.2 Sea Z 1, . . . , Z k un muestra aleatoria de la distribuci´ on N (0, 1). Sea Y = k

i=1 Z 2i .Entonces Y tiene distribuci´ on chi-cuadrado de Pearson con k grados de libertad y se denota por

Y =k

i=1

Z 2i ∼ χ2k

Teorema 3.1.1 La esperanza y varianza de una distribuci´ on χ2 est´ an dadas por

E(Y ) = k

V(Y ) = 2k

Definicion 3.1.3 Sea Z 0, Z 1, . . . , Z k una muestra aleatoria de la distribuci´ on N (0, 1) y sea Y =ki=1 Z 2i . Entonces

X = Z 0

Y /k

tiene distribuci´ on t-Student con n grados de libertad y se denota por

X ∼ tn

Teorema 3.1.2 Si X 1, . . . , X n es una muestra aleatoria de X ∼ N (µ, σ2) entonces:

a)

X = 1

n

ni=1

X i y

s

2

=

1

n − 1

n

i=1 (X i − X )

2

son independientes.

b)(n − 1)s2

σ2 ∼ χ2

n−1

Definicion 3.1.4 Sean X , Y dos variables aleatorias independientes que tienen distribuci´ on χ2 con n y m grados de libertad, respectivamente, es decir,

X ∼

χ2

n e Y

∼χ2

m

Entonces la variable aleatoria

Z = X/n

Y /m

se tiene distribuci´ on F con n y m grados de libertad y se denota por

Z ∼ F n,m

62

Page 64: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 64/82

3.2. Estimacion Puntual

Definicion 3.2.1 Un estimador puntual corresponde a cualquier funci´ on de la muestra

g(X 1, X 2, . . . , X n)

3.2.1. Metodo de Momentos

Definicion 3.2.2 Sea X 1, X 2, . . . , X n una muestra aleatoria de una variable X, proveniente de una poblaci´ on con funci´ on de densidad f θ, con

θ = (θ1, θ2, . . . , θk)

El estimador de momentos θ de θ corresponde a la soluci´ on del sistema de ecuaciones

E(X 1) = 1

n

n

i=1

X 1i

E(X 2) = 1

n

ni=1

X 2i

= ...

E(X k) = 1

n

ni=1

X ki

Debiendose plantear tantas ecuaciones como par´ ametros se desea estimar.

Ejercicios 13 Si X 1, X 2, . . . , X niid∼ f , encuentre los estimadores de momentos si f es

1. U (θ, 2θ)

2. N (µ, σ2)

63

Page 65: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 65/82

3.2.2. Metodo de Maxima Verosimilitud

Definicion 3.2.3 Sea X 1, . . . , X n una muestra aleatoria proveniente de una poblaci´ on con funci´ on densidad f θ. Se define la funci´ on de verosimilitud como la funci´ on densidad conjunta del vector X 1, . . . , X n y est´ a dada por

L(θ, x) =

n

i=1

f θ(xi)

Ejercicios 14 Si X 1, X 2, . . . , X niid∼ f , encuentre una expresi´ on simplificada para la funci´ on de

verosimilitud si f es

1. exp(λ)

2. Γ(α, β ), con α conocido.

3. Bin(n, p) con n conocido.

4. Poisson(λ)

Definicion 3.2.4 Un estimador m´ aximo verosımil , EMV , de θ, basado en una muestra X corresponde a θ(X )

el cual se obtiene al resolver

∂θ jlog(L(θ, x)) = 0 j = 1, . . . , k

Ejercicios 15 Si X 1, X 2, . . . , X niid

∼ f , encuentre los estimadores de m´ axima verosimilitud si f es

1. exp(λ)

2. Γ(α, β ), con α conocido.

3. Bin(n, p) con n conocido.

4. Poisson(λ)

Definicion 3.2.5 Consideremos una familia de distribuciones con par´ ametro θ ∈ Θ para una vari-able aleatoria X y con funci´ on de verosimilitud asociada L(θ, x). Se dice que la log- verosimiltud de X pertenece a una familia exponencial ssi existen funciones ω1, . . . , ωk

∈Θ y t1, . . . , tk

∈R,

tales que

log L(θ, x) = log h(x) + log c(θ) +k

j=1

ω j(θ)t j(x)

con h y c funciones positivas definidas en R

64

Page 66: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 66/82

Ejemplo 3.2.1 Sea la variable aleatoria X con funci´ on densidad

f (x) =

θ(1 − θ)x−1, x = 1, 2, . . . , θ ∈ (0,1);0, e.o.c.

Determine si f(x) pertenece a la familia exponencial.

Ejemplo 3.2.2 Sea X 1, . . . , X n una muestra aleatoria de X cuya densidad es

f (x) = 1√

2πσ2exp

− 1

2σ2(x − µ)2

con x ∈ R, θ = (µ, σ2), ∞ < µ < ∞, σ2 > 0, desconocidos. Determine si esta distribuci´ on pertenece a la familia exponencial.

65

Page 67: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 67/82

3.3. Insesgamiento y eficiencia

Definicion 3.3.1 Un estimador puntual θ de θ es insesgado si

E(

θ) = θ ∀ θ

Si θ no es insesgado , se denomina sesgo de θ a

b( θ) = E( θ) − θ

Por lo tanto, un estimador es insesgado si su distribucion tiene como valor esperado al parametroque se desea estimar.

Ejercicios 16 Si X 1, X 2, . . . , X niid∼ f , determine si los estimadores de momentos y m´ axima verosimil-

itud son insesgados para f

1. exp(λ)

2. Γ(α, β ), con α conocido.

3. Bin(n, p) con n conocido.

4. Poisson(λ)

Definicion 3.3.2 El error cuadr´ atico medio de un estimador θ de θ corresponde a

ECM( θ) = E( θ − θ)2

= V(

θ) + (b(

θ))2

Ejemplo 3.3.1 Sea X 1, . . . , X niid∼ exp(θ) y consideremos θ = 1/x. Calcule el ECM( θ).

Definicion 3.3.3 Se define la matriz de informaci´ on de Fisher como

I (θ) = E

∂θlogL(θ, x)

2

Lema 2 Sea la funci´ on f θ tal que

d

dθE

∂θlogL(θ, x)

=

∂θ

∂θlogf θ(x)

f θ(x)

dx,

entonces,

E

∂θlogL(θ, x)

2

= −E

∂ 2

∂θ2logL(θ, x)

66

Page 68: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 68/82

Teorema 3.3.1 Cramer - Rao.Sea X 1, . . . , X n una muestra con funci´ on densidad f θ que satisface la conmutatividad entre el oper-ador integral y diferencial y sea g(X ) = g(X 1, . . . , X n) un estimador donde E(g(X )) es diferenciable como funci´ on de θ. Entonces

V(g(X ))

( ddθE(g(X ))2

E ∂ ∂θ log L(θ, x)2

Observacion: La cantidad( ddθE(g(X ))2

E

∂ ∂θ

log L(θ, x)2

se llama cota de Cramer-Rao y todo estimador que alcance esta cota sera llamado eficiente.

Es claro que si g(X ) es un estimador insesgado para θ entonces se cumple que

V(g(X ))

≥ 1

E ∂ ∂θ log L(θ, x)2es decir, la cota de Cramer- Rao es igual a I (θ)−1.

Definicion 3.3.4 Un estimador g(X ) de θ se dice eficiente si

I (θ)−1

V( θ)= 1

Teorema 3.3.2 Si

θ es el EMV de θ, entonces para cualquier funci´ on g(θ), el EMV de g(θ) es g(

θ)

Ejercicios 17 .

Sea X 1, . . . , X n una muestra aleatorio con funci´ on densidad

f X (x) = x

θ2e −x/θ x > 0, θ > 0

1. Determine el estimador de momentos y el EMV de θ.

2. Determine si

θ es insesgado, calcule su varianza y comp´ arela con la cota de Cramer- Rao.

¿Es este estimador eficiente?

67

Page 69: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 69/82

3.4. Estimacion Intervalar

Ademas de las estimaciones puntuales de un parametro, hay estimaciones por intervalos queestipulan, con un cierto grado de confianza, que el parametro se encuentra entre dos valores delestadıstico estimado. Supongamos una variable aleatoria poblacional X que tiene media µ cuyovalor es desconocido. De una muestra aleatoria de tamanno n, el valor x de la media muestral X se puede usar para estimar µ al 95 % de confianza como sigue:Definido E , el margen de error y la significancia α, tal que

P(µ − E ≤ x ≤ µ + E ) = 1 − α

lo que es equivalente a la ecuacion

P(x − E ≤ µ ≤ x + E ) = 1 − α

Entonces (x − E, x + E ) se llama intervalo de confianza del 100(1 − α) % para µ.

Formalmente:

Definicion 3.4.1 Un estimador intervalar para un par´ ametro θ, dados los valores x = (x1, . . . , xn)de una variable aleatoria X, es cualquier par de funciones L(x1, . . . , xn) y U (x1, . . . , xn) que satisface L(x) ≤ U (x) para todo x. El intervalo aleatorio [L(X), U(X)] se denomina un estimador intervalar.

Definicion 3.4.2 Para un par´ ametro cualquiera θ, se define un conjunto de confianza 1 − αcomo un conjunto C(x) tal que

P(θ ∈ C (X )) = 1 − α

Definicion 3.4.3 Una variable aleatoria Q(X, θ) corresponde a un pivote si su distribuci´ on no

depende de ning´ un par´ ametro. Es decir, la distribuci´ on de Q(X, θ) es la misma, para todo θ.

Ejemplo 3.4.1 Encuentre una cantidad pivotal si X 1, . . . , X n son una muestra aleatoria N (µ, σ2)y a partir de esta construya un conjunto o intervalo de confianza para la media poblacional.

3.4.1. Intervalo de Confianza para la media

Sea X 1, . . . , X niid∼ N (µ, σ2). Un intervalo de confianza para la media poblacional µ cuando la

varianza poblacional es conocida esx ± E

donde E = z 1−α/2 · σ/√ n.

Ejemplo 3.4.2 Una aerolınea necesita estimar el n´ umero medio de pasajeros en un vuelo de re-ciente apertura. Para ello, toma una muestra de 40 dıas y encuentra una media muestral de 112.0 pasajeros y una desvaici´ on est´ andar de 25. Encuentre un intervalo de confianza al 95 % para la media poblacional.

68

Page 70: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 70/82

Sea X 1, . . . , X niid∼ N (µ, σ2). Un intervalo de confianza para la media poblacional µ cuando la

varianza poblacional es desconocida esx ± E

donde E = t(n−1,1−α/2) · s/√

n.

Ejemplo 3.4.3 En una aerolınea se resgistran los tiempos de espera promedio de atenci´ on en mes´ on de 14 dıas, obteniendo los siguientes resultados:

4.3 5.2 2.1 6.2 5.8 4.7 3.8 9.3 5.0 4.1 6.0 8.7 0.5 4.9

Encuentre un intervalo de confianza al 95 % para el tiempo de espera medio.

3.4.2. Intervalo de Confianza para una proporcion

Sea Y ∼ Bin(n, p). Por teorema del lımite central sabemos que

p ∼ (E( p), V( p))

Se puede mostrar que E( p) = p y V( p) = p(1− p)n .

Ası, el intervalo de confianza al (1 − α)100 % para una proporcion esta dado por

p ± E

donde E = z 1−α/2 ·

p(1−

p)n

.

Ejemplo 3.4.4 En un colegio de Ense˜ nanza Media hay matriculados 800 alumnos. A una muestra

seleccionada aleatoriamente de un 15 % de el los, se les pregunt´ o si utilizaban la cafeterıa del colegio.Contestaron negativamente un total de 24 alumnos.

a) Estime el porcentaje de alumnos que utilizan la cafeterıa del colegio.

b) Determine, con una confianza del 99 %, el error m´ aximo cometido con dicha estimaci´ on.

3.4.3. Intervalo de Confianza para la varianza

Sea X 1, . . . , X n una muestra aleatoria de una poblacion normal con media µ y varianza σ2. Unintervalo de confianza para la varianza poblacional σ2 esta dado por

(n − 1)s2

χ2(n−1,1−α/2)

, (n − 1)s2

χ2n−1,α/2

donde s2 = 1

n−1

ni=1(X i − X )2.

69

Page 71: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 71/82

Ejemplo 3.4.5 Un vendedor de muebles de madera para armar (desarmados) importa las piezas desde el norte de Europa para abaratar costos. En cierto modelo, el cliente debe insertar cuatropatas redondas en hoyos ya perforados. Para un ajuste adecuado, el di´ ametro de las patas debe ser ligeramente menor que un centımetro. Inevitablemente, hay cierta variaci´ on en los di´ ametros de las patas. El vendedor compra patas a un proveedor bajo la especificaci´ on de que el di´ ametro medio

debe ser de 0.995 cm y desviaci´ on est´ andar menor que 0.03 cm. Como parte del control de calidad se obtuvo una muestra aleatoria de 121 patas la cual arroj´ o una media de 0.99516 y desviaci´ on est´ andar de 0.01825. Calcule un IC al 95 % para la desviaci´ on est´ andar del lote.

En caso de contar dos muestras aleatorias, puede ser de interes comparar los siguientes paramet-ros :

3.4.4. Intervalo de Confianza para la diferencia de medias

Sean X 1, . . . , X niid∼ N (µX , σ2

X ) e Y 1, . . . , Y miid∼ N (µY , σ2

Y ), ambas muestras independientes. Unintervalo de confianza para la diferencia de media entre poblaciones esta dado por

(x − y) ± E

donde E cambiara de acuerdo a la informacion con respecto a la varianza.

Podemos identificar 3 casos:

a) σ2X y σ2

Y conocidas.

E = z 1−α/2 · σ2X

n +

σ2Y

mes decir

(µX − µY ) ∈

(x − y) ± z 1−α/2 ·

σ2X

n +

σ2Y

m

b) σ2

X y σ2Y desconocidas pero iguales (σ2

X = σ2Y = σ2).

Se utiliza el estimador de σ2 dado por

s2 p = (n − 1)s2X + (m − 1)s2Y

n + m − 2con

s2X = 1

n − 1

(X i − X )2 y s2Y =

1

m − 1

(Y i − Y )2

El margen de error esta dado por

E = t(n+m−2,1−α/2) · s p

1

n +

1

m

70

Page 72: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 72/82

Por lo tanto, el IC para la diferncia de medias cuando las varianzas son iguales pero descono-cidas esta dado por

(µX − µY ) ∈

(x − y) ± t(n+m−2,1−α/2) · s p

1

n +

1

m

c) σ2X y σ2

Y desconocidas y distintas.

Se define

E = t(ν,1−α/2) ·

s2X

n +

s2Y

m

donde

ν =

s2xn

+ s2ym

2(s2x/n)

2

n−1 + (s2y/m)2

m−1

Ası, el IC para la diferncia de medias cuando las varianzas son desconocidas y distintasesta dado por

(µX − µY ) ∈

(x − y) ± t(ν,1−α/2) ·

s2X

n +

s2Y

m

Ejemplo 3.4.6 .

a) Se realiza un estudio para comparar los contenidos de nicotina de dos marcas de cigarrillos.10 cigarrillos de la marca A dieron un contenido promedio de nicotina de 3,1ml/gr, con una desviaci´ on est´ andar de 0,5ml/gr, mientras que 8 cigarrillos de la marca B dieron un contenido

promedio de nicotina 2,7ml/gr, con una desviaci´ on est´ andar de 0,7ml/gr. Suponiendo que los datos son muestras aleatorias provenientes de dos poblaciones normales con varianzas iguales.Encuentre un IC del 95 % para la verdadera diferencia en el contenido de nicotina de las dos marcas.

b) Una compa˜ nıa tiene dos departamentos que producen identicos productos. Se sospecha que las producciones por hora son diferentes en los dos departamentos. Para averiguar esto se consid-eran muestras aleatorias de horas de producci´ on que proporcionan la siguiente informaci´ on:

Departamento 1 n1 = 64 x1 = 100 σ21 = 256

Departamento 2 n2 = 49 x2 = 90 σ2

2

= 196

Hallar un IC del 95 % para la diferencia verdadera entre las producciones medias de los de-partamentos. Comente.

71

Page 73: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 73/82

3.4.5. Intervalo de Confianza para la comparacion de varianzas

Sean X 1, . . . , X niid∼ N (µX , σ2

X ) e Y 1, . . . , Y miid∼ N (µY , σ2

Y ), ambas muestras independientes y demedia desconocida. Para comparar las varianzas de ambas muestras podemos utilizar el intervalode confianza para la diferencia para el cuociente σ2

x/σ2y dado por

s2xs2y

· F (n−1,m−1,α/2), s2xs2y

· F (n−1,m−1,1−α/2)

Ejemplo 3.4.7 Se realiza un estudio para comparar los contenidos de nicotina de dos marcas de cigarrillos. 10 cigarrillos de la marca A dieron un contenido promedio de nicotina de 3,1ml/gr, con una desviaci´ on est´ andar de 0,5ml/gr, mientras que 8 cigarrillos de la marca B dieron un contenidopromedio de nicotina 2,7ml/gr, con una desviaci´ on est´ andar de 0,7ml/gr. Suponiendo que los datos son todos independientes, encuentre un IC del 95 % para la diferencia de varainzas.

72

Page 74: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 74/82

3.5. Pruebas de Hipotesis

3.5.1. Introduccion

A menudo los datos muestrales sugieren que algo relevante esta sucediendo en la poblacion oproceso subyacente. Como suponemos que los datos provienen de una muestra aleatorio y por lo

mismo, estan sujetos a cierto grado de variacion aleatoria, la pregunta es si el resultado o el efectoaparente en la muestra es una indicacion de que algo esta sucediendo en la pobalcion (o proceso)subyacente o si el resultado observado es posiblemente una casualidad, producto de la variacionaleatoria.

Por esta razon es que postulamos una conjetura (o varias) que nos permita estimar si los resul-tados aparentes en una muestra indican que en realidad algo est a pasando. De manera formal, laconjetura puede postular en forma de hipotesis estadıstica.

Definicion 3.5.1 Una hip´ otesis estadıstica es una aseveraci´ on o conjetura con respecto a una o m´ as poblaciones.

En nuestro caso en particular, una hip´ otesis es una afirmaci´ on sobre un par´ ametro poblacional .La verdad o falsedad de una hipotesis estadıstica nunca se sabe con albosuta certeza a menos

que examinemos toda la poblacion. Esto, por supuesto, serıa poco practico en la mayorıa de lassituaciones. En su lugar, tomamos una muestra aleatoria de la poblacion de interes y utilizamoslos datos contenidos en esta muestra para proporcionar evidencia que apoye o no la hipotesis. Laevidencia de la muestra que es inconsistente con la hipotesis que se establece conduce al rechazo deesta, mientras que la evidencia que la apoya conduce a su aceptacion.

La estructura de la prueba de hipotesis se formulara con el uso del termino hipotesis nula (H 0),hipotesis que deseamos probar como verdadera. En caso contrario, es decir, si la rechazamos, esta-mos aceptando como verdadera la hipotesis alternativa (H 1), que en general escribimos como

H 0 : θ ∈ Θ0 vs H 1 : θ ∈ Θ0

Definicion 3.5.2 Una prueba de hip´ otesis es una regla de decisi´ on que especifıca para que val-ores de la muestra la decisi´ on es aceptar H 0 como verdadera y para que valores de la muestra la decisi´ on es aceptar H 1 como verdadera.

Para verificar si H 0 es verdadera debemos resumir la informacion de los datos en un estadısti-co de prueba. Dicho estadıstico se calcula para ver si la informacion que entregan los datos esrazonablemente compatible con la hipotesis nula.

Para decidir a favor de la hipotesis nula debemos establecer una region de aceptacion, la cualidentificara los valores del estadıstico de prueba que son relativamente probables dada la hipotesisnula y los valores que no lo son. ¿En que valor del estadıstico de la prueba comenzamos a decir quelos datos apoyan a a la hipotesis alternativa? Para contestar esta pregunta se requiere conocer ladistribucion muestral del estadıstico de prueba. Los valores del estadıstico de prueba que son suma-mente improbables bajo la hipotesis nula forman una region de rechazo para la prueba estadıstica.

73

Page 75: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 75/82

Cuando realizamos una prueba, podemos tomar dos decisiones. Por tanto, podemos cometer dostipos de error:

Error de tipo I: rechazar la hipotesis nula, H 0 dado que esta es verdadera.

Error de tipo II: no rechazar la hipotesis nula H 0, dado que la hipotesis alternativa H 1 es correcta.

Las consecuencias de estos tipos de error son diferentes y generalmente intentaremos minimizar elerror de tipo I.

Ejemplo 3.5.1 Determine los errores de tipo I y II.

1. H 0: el acusado es culpable

H 1: el acusado es inocente

2. H 0: el paciente est´ a enfermo

H 1: el paciente est´ a sano

La prueba adecuada serıa aquella que minimizara la probabilidad de cometer los dos tipos deerror simultaneamente, lo cual, con estadıstica clasica, es imposible.

En consecuencia, se trata de minimizar la probabilidad de cometer Error tipo II, sujeto a quela probabilidad de cometer Error tipo I no exceda un valor predeterminado α. Este ultimo error estambien llamado nivel de significancia.

Algunas propiedades importantes respecto de estos errores son:

Los errores de tipo I y tipo II estan relacionados. Una disminucion en la probabilidad de unopor lo general tiene como resultado un aumento en la probabilidad del otro.

El tamano de la region de rechazo, y por tanto la probabilidad de cometer error tipo I, siemprese puede reducir al ajustar el o los valores crıticos.

Un aumento en el tamano muestral n reducira α y β (error tipo II) de forma simultanea.

Si la hipotesis nula es falsa, β es un maximo cuando el valor real de un parametro se aproximaal valor hipotetico . Entre mas grande sea la distancia entre el valor real y el valor hipotetico,sera menor β .

Definicion 3.5.3 La potencia de una prueba es la probabilidad de rechazar H 0 dado que una alternativa especıfica es verdadera, y se puede calcular como 1 − β .

Diferentes tipos de pruebas se comparan al contrastar propiedades de potencia.

A pesar de estar fijo, la probabilidad de cometer error de tipo I puede ser calculada y recibe elnombre de valor-p.

74

Page 76: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 76/82

Definicion 3.5.4 El valor-p de una prueba de hip´ otesis es el menor valor de α para el cual rechazamos la hip´ otesis nula.

Calculado este valor, la regla sera rechazar la hipotesis nula si valor − p < α.

En este curso estudiaremos pruebas de hipotesis para tres parametros poblacionales: media,

varianza y proporcion.

3.5.2. Prueba de Hipotesis para la media

Sea X 1, . . . , X n una muestra aleatoria de una distribucion con media µ y varianza σ2 > 0.Considere las hipotesis generales

H 0 : µ ∈ Θ0 vs H 1 : µ ∈ Θ0

Es decir, queremos probar algun valor o rango de valores para la media, cuando la varianza esconocida. La estadıstica de prueba apropiada se basa en la variable X , que por TCL sabemosdistribuye N (µ, σ2/n) y que si estandarizamos obtenemos

Z = X − µ

σ/√

n ∼ N (0, 1)

Entonces distinguiremos tres casos:

Hipotesis Nula Hipotesis Alternativa Rechazo H 0 siµ = µ0 µ = µ0 |z 0| ≥ z 1−α/2

µ ≤ µ0 µ > µ0 z 0 ≥ z 1−α

µ ≥ µ0 µ < µ0 z 0 ≤ −z 1−α

donde

z 0 = x − µ0

σ/√ nEjemplo 3.5.2 Una muestra aleatoria de 100 muertes registradas en un servicio el a˜ no pasadomuestra una vida promedio de 71.8 a˜ nos. Suponga una desviaci´ on est´ andar poblacional de 8.9 a˜ nos.¿esto parece indicar que la vida media hoy en dıa es mayor a 70 a˜ nos? Utilice un nivel de signifi-cancia de 5 %.

Sea X 1, . . . , X n una muestra aleatoria de una distribucion con media µ, desconocida y varianzas2 > 0, esto quiere decir que la varianza es estimada en la muestra. Considere las hipotesis generales

H 0 : µ ∈ Θ0 vs H 1 : µ ∈ Θ0

Es decir, queremos probar algun valor o rango de valores para la media, cuando la varianza esdesconocida, por lo que la reemplazamos por s2, el estimador insesgado de la varianza. La estadısticade prueba apropiada se basa en la variable X , que por TCL sabemos distribuye N (µ, σ2/n) y ademasn−1σ2 s2 ∼ χ2 , con las que podemos construir el estadıstico

Z = X − µ

s/√

n ∼ t(n − 1)

Entonces distinguiremos tres casos:

75

Page 77: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 77/82

Hipotesis Nula Hipotesis Alternativa Rechazo H 0 siµ = µ0 µ = µ0 |t0| ≥ t1−α/2

µ ≤ µ0 µ > µ0 t0 ≥ t1−α

µ ≥ µ0 µ < µ0 t0 ≤ −t1−α

donde

t0 = x − µ0s/√ n

Ejemplo 3.5.3 Se afirma que una aspiradora gasta en promedio 46 kilowatt-hora al a˜ no. Se toma una muestra aleatoria de 12 hogares indica que las aspiradoras gastan un promedio de 42 kilowatt-hora al a˜ no con una desviaci´ on est´ andar de 11.9 kilowatt-hora, ¿esto sugiere que las aspiradoras gastan, en promedio, menos de 46 kilowatt-hora anualmente con 5 % de significancia?

3.5.3. Prueba de Hipotesis para la proporcion

Es de interes probar la hipotesis que la proporcion de exitos de un experimento binomial es

igual a un valor especıfico o esta en un rango de valores. Sea X la variable aleatoria que cuenta elnumero de exitos y sea p = X/n la estimacion del parametro p. Entonces, para n grande, podemosestablecer que

Z = x − np

np(1 − p)= p − p

p−(1− p)n

∼ N (0, 1)

Entonces distinguiremos tres casos:

Hipotesis Nula Hipotesis Alternativa Rechazo H 0 si p = p0 p = p0 |z 0| ≥ z 1−α/2

p ≤ p0 p > p0 z 0 ≥ z 1−α

p≥

p0

p < p0

z 0 ≤ −

z 1−α

donde

z 0 = p − p0 p0(1 − p0)/n

Ejemplo 3.5.4 Un medicamento que se prescribe actualmente se considera efectivo en un 60 %.Resultados experimentales con un nuevo f´ armaco se asministar a una muestra aleatoria de 100 personas, de las cuales 70 se aliviaron. ¿Esta es evidencia suficiente para concluir que el nuevomedicamento es superior al que se receta actualmente? Use α = 5 %

3.5.4. Prueba de Hipotesis para la varianza

Sean X 1, . . . , X n una muestra de una variable aleatoria con distribucion N (µ, σ2), ambos paramet-ros desconocidos. Sabemos que si s2 es el estimador insesgado de σ2, es decir,

s2 = 1

n − 1

(xi − x)2

entonces(n − 1)s2

σ2 ∼ χ2

(n−1)

76

Page 78: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 78/82

Entonces, si es de interes probar que la varianza poblacional esta en un intervalo dado, distinguire-mos tres casos:

Hipotesis Nula Hipotesis Alternativa Rechazo H 0 siσ2 = σ2

0 σ2 = σ20 Q0 ≥ χ2

n−1,1−α/2 o Q0 ≤ χ2n−1,α/2

σ2

≤σ20 σ2 > σ2

0 Q0

≥χ2n−1,1−α

σ2 ≥ σ20 σ2 < σ20 Q0 ≤ χ2n−1,α

donde

Q0 = (n − 1)s2

σ20

Ejemplo 3.5.5 Se tienen los pesos de 10 paquetes de semillas de pasto distribuidas por cierta compa˜ nıa, de la cuales se obtuvo x = 46,12 y s2 = 0,286. La empresa desea saber si los pesos registrados presentan evidencia para asegurar que la varianza poblacional es mayor a 0.2, con un nivel de significancia de 5 %.

3.5.5. Prueba de Hipotesis para la diferencia de medias

Si tenemos dos muestras de tamano n y m de poblaciones independientes, X e Y, con mediasµX y µY , estas pueden ser comparadas usando la diferencia µ1 − µ2, cuyo estimador es x − y. Ladistribucion de esta diferencia dependera de la informacion respecto de la relacion entre las varianzaspoblacionales σ2

X y σ2Y , de los cuales podemos identificar tres casos.

Varianzas conocidas.

El estadıstico de prueba es(X − Y ) − d σ2X

n + σ2Y m

∼N (0, 1)

Las hipotesis a contrastar son:

Hipotesis Nula Hipotesis Alternativa Rechazo H 0 siµX − µY = d µX − µY = d |z 0| ≥ z 1−α/2

µX − µY ≤ d µX − µY > d z 0 ≥ z 1−α

µX − µY ≥ d µX − µY < d z 0 ≤ −z 1−α

donde

Z 0 = (x − y) − d

σ2Xn + σ2

Y m

Ejemplo 3.5.6 Una muestra aleatoria de tama˜ no n1 = 25, que se toma de una poblaci´ on normal con una desviaci´ on est´ andar σ1 = 5,2, tiene una media x1 = 81. Una segunda muestra aleatoria de tama˜ no n2 = 36, que se toma de una poblaci´ on normal diferente con una desviaci´ on est´ andar σ = 3,4, tiene una media x2 = 76. Pruebe la hip´ otesis de las medias son iguales con un nivel de significancia del 5 %.

77

Page 79: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 79/82

Varianzas desconocidas pero iguales.σ2X = σ2

Y = σ

Si las varianzas desconocidas, debemos estimarlas, incorporando el hecho que sean iguales. En-tonces, dados s2

X y s2Y , los estimadores insesgados de σ2

X y σ2Y , respectivamente, definimos

s2 p = (n − 1)s2X + (m − 1)s2Y

n + m − 2El estadıstico de prueba es

(X − Y ) − d

s p

1n + 1

m

∼ tν

con ν = n + m − 2.

Las hipotesis a contrastar son:

Hipotesis Nula Hipotesis Alternativa Rechazo H 0 siµX − µY = d µX − µY = d T 0 ≥ tν,1−α/2

µX

−µY

≤d µX

−µY > d T 0

≥tν,1−α

µX − µY ≥ d µX − µY < d T 0 ≤ −tν,1−α

donde

T 0 = (x − y) − d

s p

1n + 1

m

Ejemplo 3.5.7 Una compa˜ nıa armadora de autom´ oviles grande trata de decidir si compra llantas de la marca A o de la B para sus nuevos modelos. Se lleva a cabo un experimento, para ayudar a llegar a una decisi´ on, en el que se usan 12 llantas de cada marca. Las llantas se utilizan hasta que se acaban. Los resultados son

Marca A :x1 = 37900km s1 = 5100km

Marca B :x2 = 39800km s2 = 5900km

Pruebe la hip´ otesis que no hay diferencias entre las dos marcas de llantas con un nivel de signifi-cancia del 5 %, suponiendo que las varianzas poblacionales son iguales.

Varianzas desconocidas y distintas.

Si las varianzas desconocidas y distintas, el estimador de la varianza de µX − µY es

s2 p = s2X

n +

s2Y

m

El estadıstico de prueba es (X − Y ) − d

s p∼ tν

con

ν =

s2Xn

+ s2Y m

2(s2X/n)2

n−1 + (

(s2Y /m)2

m−1

Las hipotesis a contrastar son:

78

Page 80: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 80/82

Hipotesis Nula Hipotesis Alternativa Rechazo H 0 siµX − µY = d µX − µY = d |T 0| ≥ tν,1−α/2

µX − µY ≤ d µX − µY > d T 0 ≥ tν,1−α

µX − µY ≥ d µX − µY < d T 0 ≤ −tν,1−α

donde

T 0 = (x − y) − ds p

∼ tν

Ejemplo 3.5.8 Para el ejemplo anterior, realice la prueba para la hip´ otesis que las llantas de la marca A son mejores que las de B, suponiendo que las varianzas poblacionales son distintas.

3.5.6. Prueba de Hipotesis para la diferencia de proporciones

Si tenemos dos muestras independientes X 1, . . . , X n y Y 1, . . . , Y m de poblaciones Bernoulli deparametros p1 y p2, respectivamente, estas pueden ser comparadas usando la diferencia p1 − p2utilizando que

( p1 − p2) − d p1(1− p1)

n + p2(1− p2)

m

∼ N (0, 1)

Las hipotesis a contrastar son:

Hipotesis Nula Hipotesis Alternativa Rechazo H 0 si p1 − p2 = d p1 − p2 = d |z 0| ≥ z 1−α/2

p1 − p2 ≤ d p1 − p2 > d z 0 ≥ z 1−α

p1 − p2 ≥ d p1 − p2 < d z 0 ≤ −z 1−α

donde

z 0 =

( p1

− p2)

−d

p1(1−

p1)n

+

p2(1−

p2)m

Ejemplo 3.5.9 En un estudio para estimar la proporci´ on de residentes de cierta ciudad y sus suburbios que est´ an a favor de la construcci´ on de una planta de energıa nuclear, se encuentra que 63 de 100 residentes urbanos est´ an a favor de la construcci´ on mientras que s´ olo 59 de 125 residentes suburbanos la favorecen. ¿Hay una diferencia significativa entre las proporci´ on de residentes urbanos y suburbanos que favorecen la construcci´ on de la planta nuclear? Use α = 0,05.

3.5.7. Prueba de Hipotesis para la comparacion de varianzas

Sean X 1, . . . , X n una muestra aleatoria de la distribucion N (µX , σ2X ), independiente de Y 1, . . . , Y muna muestra aleatoria de una distribucion N (µY , σ2

Y ), con todos los parametros son desconocidos.Las varianzas poblacionales pueden ser comparadas usando el cuociente σ2

X /σ2Y cuyo estimador es

s2X /s2Y . Entoncesσ2X

σ2Y

k ∼ F n−1,m−1

Entonces, si es de interes probar que las varianzas poblacionales estan en una razon dada es

79

Page 81: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 81/82

Hipotesis Nula Hipotesis Alternativa Rechazo H 0 siσ2Xσ2Y

= 1k

σ2Xσ2Y

= 1k F 0 ≥ F n−1,n−2,1−α/2 o F 0 ≤ F n−1,n−2,α/2

σ2Xσ2Y

≤ 1k

σ2Xσ2Y

> 1k F 0 ≥ F n−1,n−2,1−α

σ2Xσ2Y

≥ 1k

σ2Xσ2Y

< 1k

F 0 ≤ F n−1,n−2,α

donde

F 0 = s2X

s2Y k

Ejemplo 3.5.10 Para el ejemplo 16.9, determine si las varianzas son iguales o distintas con 2.5 % de confianza.

80

Page 82: 2011.2 - Apuntes de Clase

7/24/2019 2011.2 - Apuntes de Clase

http://slidepdf.com/reader/full/20112-apuntes-de-clase 82/82

Capıtulo 4

Bibliografıa