estadística ii

47
ESCUELA: NOMBRE: ESTADÍSTICA II FECHA: PSICOLOGÍA Dr. Gonzalo Morales 1 OCTUBRE/2008-FEBRERO/2009

Upload: videoconferencias-utpl

Post on 03-Jul-2015

3.804 views

Category:

Education


1 download

DESCRIPTION

Contenido concreto de la probabilidad, como q es, su enfoque, etc.

TRANSCRIPT

Page 1: Estadística II

ESCUELA:

NOMBRE:

ESTADÍSTICA II

FECHA:

PSICOLOGÍA

Dr. Gonzalo Morales

1

OCTUBRE/2008-FEBRERO/2009

Page 2: Estadística II

PROBABILIDAD

¿Qué es la probabilidad? Enfoque Objetivo

Probabilidad a priori Probabilidad a posteriori

Enfoque subjetivo ¿Como se calcula? ¿Qué es el Muestreo y cómo se relaciona

con la probabilidad?

2

Page 3: Estadística II

A posteriori Probabilidad de un suceso es la frecuencia relativa (%) de veces que ocurre un suceso al realizar un experimento repetidas veces.

A priori Es la frecuencia con que ocurrirá un suceso, calculada antes de que ocurra

Subjetiva (bayesiana): Grado de certeza que se posee sobre un suceso. Es personal.

En los tres tipos de definiciones aparece el concepto de suceso. Vamos a recordar qué son y algunas operaciones que se pueden realizar con sucesos.

3

Page 4: Estadística II

SUCESOS

4

E espacio muestral E espacio muestral

A

A’

E espacio muestral

A

B

UNIÓN

E espacio muestral

A

B

INTERS.

E espacio muestral

A

B

Page 5: Estadística II

AXIOMAS DE LA PROBABILIDAD

P(E)=1 0≤P(E)≤1 Si A y B Disjuntos,

entonces P(A)+P(B)=P(A)+P(B)

E espacio muestral

100%

B

E espacio muestral

A

5

Page 6: Estadística II

Probabilidad Condicionada

6

)(

)()|(

BP

BAPBAP

ᅦ= A

E espacio muestral

B

“tam

año”

de

uno

resp

ecto

al

otr

o

Page 7: Estadística II

Reglas de cálculo prácticas

Cualquier problema de probabilidad puede resolverse en teoría mediante aplicación de los axiomas. Sin embargo, es más cómodo conocer algunas reglas de cálculo:P(A’) = 1 - P(A)

P(AUB) = P(A) + P(B) - P(A ∩ B)

P(A∩B) = P(A) P(B|A) = P(B) P(A|B)

7

Page 8: Estadística II

INDEPENDENCIA DE SUCESOS

8

Dos sucesos son independientes si el que ocurra uno, no añade información sobre el otro. A es independiente de B

P(A|B) = P(A)

P(A∩B) = P(A) P(B)

8

Page 9: Estadística II

ESTADÍSTICA II

9

Tema 2: Modelos probabilísticos

Page 10: Estadística II

VARIABLE ALEATORIA

El resultado de un experimento aleatorio puede ser descrito en ocasiones como una cantidad numérica.

En estos casos aparece la noción de variable aleatoria Función que asigna a cada suceso un número.

Las variables aleatorias pueden ser discretas o continuas.

En las siguientes transparencias vamos a recordar conceptos de temas anteriores, junto con su nueva designación. Los nombres son nuevos. Los conceptos no.

10

Page 11: Estadística II

Función de probabilidad (V. Discretas)

Asigna a cada posible valor de una variable discreta su probabilidad. Recuerde los conceptos

de frecuencia relativa y diagrama de barras.

Ejemplo Número de caras al

lanzar 3 monedas.

0%

5%

10%

15%

20%

25%

30%

35%

40%

0 1 2 3

11

Page 12: Estadística II

Función de densidad (V. Continuas)

Definición Es una función no negativa de integral 1.

Piénselo como la generalización del histograma con frecuencias relativas para variables continuas.

¿Para qué lo voy a usar? No lo va a usar directamente. Sus valores no representan

probabilidades.

12

Page 13: Estadística II

¿Para qué sirve la función de densidad?

Muchos procesos aleatorios vienen descritos por variables de forma que son conocidas las probabilidades en intervalos.

La integral definida de la función de densidad en dichos intervalos coincide con la probabilidad de los mismos.

Es decir, identificamos la probabilidad de un intervalo con el área bajo la función de densidad.

13

Page 14: Estadística II

Función de distribución Es la función que asocia a cada valor de una variable, la

probabilidad acumulada de los valores inferiores o iguales.

Piénselo como la generalización de lasfrecuencias acumuladas. Diagrama integral.

14

A los valores extremadamente bajos les corresponden valores de la función de distribución cercanos a cero.

A los valores extremadamente altos les corresponden valores de la función de distribución cercanos a uno.

Page 15: Estadística II

¿Para qué sirve la f. distribución?

Contrastar lo anómalo de una observación concreta.

Relaciónelo con la idea de cuantil.

En otro contexto (contrastes de hipótesis) podremos observar unos resultados experimentales y contrastar lo “anómalos” que son en conjunto con respecto a una hipótesis de terminada.

15

Page 16: Estadística II

Valor esperado y varianza de una v.a. X

Valor esperado Se representa mediante E[X] ó μ Es el equivalente a la media

Varianza Se representa mediante VAR[X] o σ2 Es el equivalente a la varianza Se llama desviación típica a σ

16

Page 17: Estadística II

Algunos modelos de v.a. Hay v.a. que aparecen con frecuencia.

Experimentos dicotómicos. Bernoulli

Contar éxitos en experimentos dicotómicos repetidos: Binomial Poisson (sucesos raros)

Y en otras muchas ocasiones… Distribución normal (gaussiana,

campana,…) El resto del tema está dedicado a estudiar estas

distribuciones especiales. 17

Page 18: Estadística II

Distribución de Bernoulli

Tenemos un experimento de Bernoulli si al realizar un experimentos sólo son posibles dos resultados: X=1 (éxito, con probabilidad p) X=0 (fracaso, con probabilidad q=1-p)

Como se aprecia, en experimentos donde el resultado es dicotómico, la variable queda perfectamente determinada conociendo el parámetro p.

18

Page 19: Estadística II

Ejemplo de distribución de Bernoulli.

Se ha observado estudiando 2000 accidentes de tráfico con impacto frontal y cuyos conductores no tenían cinturón de seguridad, que 300 individuos quedaron con secuelas. Describa el experimento usando conceptos de v.a.

Solución. La noc. frecuentista de prob. nos permite aproximar la

probabilidad de tener secuelas mediante 300/2000=0,15=15%

X=“tener secuelas tras accidente sin cinturón” es variable de Bernoulli

X=1 tiene probabilidad p ≈ 0,15 X=0 tiene probabilidad q ≈ 0,85 19

Page 20: Estadística II

Ejemplo de distribución de Bernoulli

Se ha observado estudiando 2000 accidentes de tráfico con impacto frontal y cuyos conductores sí tenían cinturón de seguridad, que 10 individuos quedaron con secuelas. Describa el experimento usando conceptos de v.a.

Solución. La noc. frecuentista de prob. nos permite aproximar la

probabilidad de quedar con secuelas por 10/2000=0,005=0,5% X=“tener secuelas tras accidente usando cinturón” es variable

de Bernoulli X=1 tiene probabilidad p ≈ 0,005 X=0 tiene probabilidad q ≈ 0,995

20

Page 21: Estadística II

Observación En realidad no sabemos en este punto si ambas cantidades

son muy diferentes o aproximadamente iguales, pues en otros estudios sobre accidentes, las cantidades de individuos con secuelas hubieran sido con seguridad diferentes.

Para decidir si entre ambas cantidades existen diferencias estadísticamente significativas necesitamos introducir conceptos de estadística inferencial (extrapolar resultados de una muestra a toda la población).

Es muy pronto para resolver esta cuestión ahora. Esperemos a las pruebas de X2.

21

Page 22: Estadística II

nkqpk

nkXP knk ᆪᆪ│

₩== - 0 ,][

Distribución Binomial Función de probabilidad

Problemas de cálculo si n es grande y/o p cercano a 0 o 1.

Media: μ = n p

Varianza: σ2 = n p q

22

Page 23: Estadística II

Distribución Binomial

Si se repite un número fijo de veces, n, un experimento de Bernoulli con parámetro p, el número de éxitos sigue una distribución binomial de parámetros (n,p).

Lanzar una moneda 10 veces y contar las caras. Lanzar una moneda 100 veces y contar las caras. El número de personas que enfermará (en una

población de 500.000 personas) de una enfermedad que desarrolla una de cada 2000 personas.

23

Page 24: Estadística II

Contrastando una hipótesis

Creo que la edad media es 40 años...

Es demasiado...

¡Gran diferencia!

Rechazo la hipótesis

Muestra aleatoria

24

Page 25: Estadística II

Creo que el porcentaje de

enfermos será el 5%

¿Qué es una hipótesis?

Una creencia sobre la población, principalmente sus parámetros: Media Varianza Proporción/Tasa

OJO: Si queremos contrastarla, debe establecerse antes del análisis.

25

Page 26: Estadística II

Identificación de Hipótesis Hipótesis nula Ho

La que contrastamos Los datos pueden

refutarla No debería ser

rechazada sin una buena razón.

Hip. Alternativa H1

Niega a H0 Los datos pueden mostrar

evidencia a favorNo debería ser aceptada sin una

gran evidencia a favor.

26

Page 27: Estadística II

¿Cuál es la Ho? Problema: ¿La depresión está relacionada con el

género?

Solución: Traducir a lenguaje estadístico: Establecer su opuesto:

Seleccionar la hipótesis nula

27

Page 28: Estadística II

¿Cuál es la Ho? Problema: ¿El tiempo medio de reacción es de 0,6?

Solución:

Traducir a lenguaje estadístico:

Establecer su opuesto:

Seleccionar la hipótesis nula

28

Page 29: Estadística II

Razonamiento Básico

Si supongo que Ho es cierta…

¿qué hace un científico cuando su teoría no coincide con sus predicciones?

... el resultado del experimento sería improbable. Sin embargo ocurrió.

29

Page 30: Estadística II

Razonamiento Básico Si supongo que Ho es cierta…

¿qué hace un científico cuando su teoría no coincide con sus predicciones?

... el resultado del experimento sería improbable. Sin embargo ocurrió.

30

Page 31: Estadística II

Razonamiento Básico Si supongo que Ho es cierta…

¿Si una teoría hace predicciones con éxito, queda probado que es cierta?

... el resultado del experimento es coherente.

• No hay evidencia contra H0

•No se rechaza H0

•El experimento no es concluyente

•El contraste no es significativo

31

Page 32: Estadística II

Región Crítica y nivel de significación

Región crítica Valores ‘improbables’ si... Es conocida antes de

realizar el experimento: resultados experimentales que refutarían H0

Nivel de significación: Número pequeño: 1% , 5%Fijado de antemano por el

investigadorEs la probabilidad de

rechazar H0 cuando es cierta

No rechazo H0

Reg. Crit.Reg. Crit.

=5%

0 =40 32

Page 33: Estadística II

Contrastes: unilateral y bilateral

La posición de la región crítica depende de la hipótesis alternativa

Bilateral H1: 40

Unilateral

H1: <40 H1: >4033

Unilateral

Page 34: Estadística II

Significación: p

H0: =40

34

Page 35: Estadística II

Significación: p

No se rechazaH0: =40

H0: =40

35

Page 36: Estadística II

Significación: p

No se rechazaH0: =40

P

P

36

Page 37: Estadística II

Significación: p

Se rechaza H0: =40

Se acepta H1: >40

37

Page 38: Estadística II

Resumen: a, p y criterio de rechazo

Sobre Es número pequeño,

preelegido al diseñar el experimento

Conocido sabemos todo sobre la región crítica

Sobre pEs conocido tras realizar

el experimentoConocido p sabemos todo

sobre el resultado del experimento

Sobre el criterio de rechazoContraste significativo = p menor que

38

Page 39: Estadística II

Problema: ¿Está sesgada la moneda?

Experimento: Lanzar la moneda repetidamente:Experimento: Lanzar la moneda repetidamente:

P=50% P=25% P=12,5% P=6,25% P=3% P=1,5%39

Page 40: Estadística II

Riesgos al tomar decisionesEjemplo 1: Se juzga a un individuo por la Ejemplo 1: Se juzga a un individuo por la presuntapresunta comisión de un delito.comisión de un delito.

H0: Hipótesis nula

Es inocente

H1: Hipótesis alternativa

Es culpable

Los datos pueden refutarlaLa que se acepta si las pruebas no indican lo contrarioRechazarla por error tiene graves consecuencias

No debería ser aceptada sin una gran evidencia a favor.Rechazarla por error tiene consecuencias consideradas menos graves que la anterior

40

Page 41: Estadística II

Riesgos al contrastar hipótesisSe cree que un nuevo tratamiento ofrece buenos resultadosSe cree que un nuevo tratamiento ofrece buenos resultadosParece que hay una incidencia de enfermedad más altaParece que hay una incidencia de enfermedad más altade lo normalde lo normal

H0: Hipótesis nula (Ej.1) Es inocente (Ej.2) El nuevo tratamiento no tiene efecto (Ej.3) No hay nada que destacar

H1: Hipótesis alternativa (Ej.1) Es culpable (Ej.2) El nuevo tratamiento es útil (Ej. 3) Hay una situación anormal

No especulativa

Especulativa

41

Page 42: Estadística II

Tipos de error al tomar una decisión

Realidad

veredicto

OKErrorMuy grave

Culpable

ErrorMenos grave

OKInocente

CulpableInocente

42

Page 43: Estadística II

Tipos de error al contrastar una hipótesisRealidad

CorrectoEl tratamiento tiene efecto y el experimento lo confirma.

Error de tipo IEl tratamiento no tiene efecto pero se decide que sí. Probabilidad α

Rechazo H0

Acepto H1

Error de tipo IIEl tratamiento si tiene efecto pero no lo percibimos.

Probabilidad β

CorrectoEl tratamiento no tiene efecto y así se decide.

No Rechazo H0

H0 FalsaH0 cierta

43

Page 44: Estadística II

No se puede tener todo

Para un tamaño muestral fijo, no se pueden reducir a la vez ambos tipos de error.

Para reducir , hay que aumentar el tamaño muestral.

44

Page 45: Estadística II

Conclusiones Las hipótesis se plantean antes de observar los datos. En ciencia, las hipótesis nula y alternativa no tienen el

mismo papel: H0 : Hipótesis científicamente más simple. H1 : El peso de la prueba recae en ella.

α debe ser pequeño Rechazar una hipótesis consiste en observar si p<α Rechazar una hipótesis no prueba que sea falsa. Podemos

cometer error de tipo I No rechazar una hipótesis no prueba que sea cierta.

Podemos cometer error de tipo II Si decidimos rechazar una hipótesis debemos mostrar la

probabilidad de equivocarnos. 45

Page 46: Estadística II

GRACIAS

[email protected]

46

Page 47: Estadística II

47