introdução à bioestatística · vriávela aleatória distribuições de robabilidpade...

33

Upload: others

Post on 20-Aug-2020

4 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Introdução à Bioestatística · Vriávela aleatória Distribuições de robabilidpade Distribuição discreta Distribuição contínua Introdução à Bioestatística Marcelo Goulart

Variável aleatóriaDistribuições de probabilidade

Distribuição discretaDistribuição contínua

Introdução à Bioestatística

Marcelo Goulart Correia

Instituto Nacional de Cardiologia

February 22, 2016

Marcelo Goulart Correia Introdução à Bioestatística

Page 2: Introdução à Bioestatística · Vriávela aleatória Distribuições de robabilidpade Distribuição discreta Distribuição contínua Introdução à Bioestatística Marcelo Goulart

Variável aleatóriaDistribuições de probabilidade

Distribuição discretaDistribuição contínua

1 Variável aleatória

2 Distribuições de probabilidade

3 Distribuição discreta

4 Distribuição contínua

Marcelo Goulart Correia Introdução à Bioestatística

Page 3: Introdução à Bioestatística · Vriávela aleatória Distribuições de robabilidpade Distribuição discreta Distribuição contínua Introdução à Bioestatística Marcelo Goulart

Variável aleatóriaDistribuições de probabilidade

Distribuição discretaDistribuição contínua

Existem dois tipos de variáveis aleatórias

Variáveis aleatórias discretasVariáveis aleatórias contínuas

Marcelo Goulart Correia Introdução à Bioestatística

Page 4: Introdução à Bioestatística · Vriávela aleatória Distribuições de robabilidpade Distribuição discreta Distribuição contínua Introdução à Bioestatística Marcelo Goulart

Variável aleatóriaDistribuições de probabilidade

Distribuição discretaDistribuição contínua

Variável aleatória discreta

Assume um número �nito ou in�nito enumerável de valores

X : E −→ N (1)

Variável aleatória contínua

Assume um número in�nito não-enumerável de valores

X : E −→ R (2)

Marcelo Goulart Correia Introdução à Bioestatística

Page 5: Introdução à Bioestatística · Vriávela aleatória Distribuições de robabilidpade Distribuição discreta Distribuição contínua Introdução à Bioestatística Marcelo Goulart

Variável aleatóriaDistribuições de probabilidade

Distribuição discretaDistribuição contínua

Variável aleatória discreta

Função de probabilidade (f)f (xi ) a probabilidade de que X assuma um determinado valor

f : N −→ [0, 1]

xi 7−→ f (xi ) = P[X = xi ](3)

Se xi não é um valor que X pode assumir �> f (xi ) = 0

Marcelo Goulart Correia Introdução à Bioestatística

Page 6: Introdução à Bioestatística · Vriávela aleatória Distribuições de robabilidpade Distribuição discreta Distribuição contínua Introdução à Bioestatística Marcelo Goulart

Variável aleatóriaDistribuições de probabilidade

Distribuição discretaDistribuição contínua

Exemplo

Probabilidade de tirar 3 caras em 3 lançamentos de moedasf (3) = P[X = 3] = P[{KKK}] = 1/2 ∗ 1/2 ∗ 1/2 = 1/8Probabilidade de tirar 2 caras em 3 lançamentos de moedasf (2) = P[X = 2] = P[{KKC ,KCK ,CKK}] =1/8+ 1/8+ 1/8 = 3/8Probabilidade de tirar o número 6 em 3 lançamentos demoedas f (N6) = P[X = N6] = P[{N6}] = 0

Marcelo Goulart Correia Introdução à Bioestatística

Page 7: Introdução à Bioestatística · Vriávela aleatória Distribuições de robabilidpade Distribuição discreta Distribuição contínua Introdução à Bioestatística Marcelo Goulart

Variável aleatóriaDistribuições de probabilidade

Distribuição discretaDistribuição contínua

Variável aleatória discreta

Função de distribuição acumulada (F)F (xi ) a probabilidade de que X assuma um valor inferior ouigual a xi

Marcelo Goulart Correia Introdução à Bioestatística

Page 8: Introdução à Bioestatística · Vriávela aleatória Distribuições de robabilidpade Distribuição discreta Distribuição contínua Introdução à Bioestatística Marcelo Goulart

Variável aleatóriaDistribuições de probabilidade

Distribuição discretaDistribuição contínua

Exemplo

Probabilidade de tirar 1 ou nenhuma cara em 3 lançamentos demoedas F (1) = P[X ≤ 1] = f (0) + f (1) = 1/8+ 3/8 = 4/8Probabilidade de tirar 2 ou menos caras em 3 lançamentos demoedasF (2) = P[X ≤ 2] = f (0)+f (1)+f (2) = 1/8+3/8+3/8 = 7/8Probabilidade de tirar um número menor que 5 em 3lançamentos de moedas F (N6) = P[X ≤ N5] = 0

Marcelo Goulart Correia Introdução à Bioestatística

Page 9: Introdução à Bioestatística · Vriávela aleatória Distribuições de robabilidpade Distribuição discreta Distribuição contínua Introdução à Bioestatística Marcelo Goulart

Variável aleatóriaDistribuições de probabilidade

Distribuição discretaDistribuição contínua

Variável aleatória contínua

Função de probabilidade (f)f (x) a faixa de probabilidade de ocorrer algum evento

f (x) ≥ 0+∞∫−∞

f (x)dx = 1(4)

É possível também calcular uma área mais restrita de valoresutilizando:

P[a ≤ X ≤ b] =

b∫a

f (x)dx (5)

Marcelo Goulart Correia Introdução à Bioestatística

Page 10: Introdução à Bioestatística · Vriávela aleatória Distribuições de robabilidpade Distribuição discreta Distribuição contínua Introdução à Bioestatística Marcelo Goulart

Variável aleatóriaDistribuições de probabilidade

Distribuição discretaDistribuição contínua

Marcelo Goulart Correia Introdução à Bioestatística

Page 11: Introdução à Bioestatística · Vriávela aleatória Distribuições de robabilidpade Distribuição discreta Distribuição contínua Introdução à Bioestatística Marcelo Goulart

Variável aleatóriaDistribuições de probabilidade

Distribuição discretaDistribuição contínua

Variável aleatória contínua

Função de distribuição acumulada (F)F (x) a probabilidade de que X assuma um valor inferior ouigual a x

F : R −→ [0, 1]

x 7−→ F (x) = P[X ≤ x ] =

x∫−∞

f (t)dt(6)

Marcelo Goulart Correia Introdução à Bioestatística

Page 12: Introdução à Bioestatística · Vriávela aleatória Distribuições de robabilidpade Distribuição discreta Distribuição contínua Introdução à Bioestatística Marcelo Goulart

Variável aleatóriaDistribuições de probabilidade

Distribuição discretaDistribuição contínua

Marcelo Goulart Correia Introdução à Bioestatística

Page 13: Introdução à Bioestatística · Vriávela aleatória Distribuições de robabilidpade Distribuição discreta Distribuição contínua Introdução à Bioestatística Marcelo Goulart

Variável aleatóriaDistribuições de probabilidade

Distribuição discretaDistribuição contínua

Medidas de tendência central e dispersão para variáveisaleatórias

Esperança (ou valor esperado)

E [X ] =∑i∈I

xi f (xi ) (7)

E [X ] =

+∞∫−∞

x ∗ f (x)dx (8)

Marcelo Goulart Correia Introdução à Bioestatística

Page 14: Introdução à Bioestatística · Vriávela aleatória Distribuições de robabilidpade Distribuição discreta Distribuição contínua Introdução à Bioestatística Marcelo Goulart

Variável aleatóriaDistribuições de probabilidade

Distribuição discretaDistribuição contínua

Medidas de tendência central e dispersão para variáveisaleatórias

VariânciaVar[X ] = E [(X − E [X ])2] (9)

Var[X ] =∑i∈I

(xi − E [X ])2 ∗ f (xi ) (10)

Var[X ] =

+∞∫−∞

(x − E [X ])2 ∗ f (x)dx (11)

Marcelo Goulart Correia Introdução à Bioestatística

Page 15: Introdução à Bioestatística · Vriávela aleatória Distribuições de robabilidpade Distribuição discreta Distribuição contínua Introdução à Bioestatística Marcelo Goulart

Variável aleatóriaDistribuições de probabilidade

Distribuição discretaDistribuição contínua

Exercício

Marcelo Goulart Correia Introdução à Bioestatística

Page 16: Introdução à Bioestatística · Vriávela aleatória Distribuições de robabilidpade Distribuição discreta Distribuição contínua Introdução à Bioestatística Marcelo Goulart

Variável aleatóriaDistribuições de probabilidade

Distribuição discretaDistribuição contínua

Existem diversas distribuições de probabilidades:Discretas

Bernoulli, Binomial, Geométrica, Binomial negativa,

Hipergeométrica e Poisson

ContínuasUniforme, Exponencial, Normal, χ2, t de Student, F de

Snedcor

Marcelo Goulart Correia Introdução à Bioestatística

Page 17: Introdução à Bioestatística · Vriávela aleatória Distribuições de robabilidpade Distribuição discreta Distribuição contínua Introdução à Bioestatística Marcelo Goulart

Variável aleatóriaDistribuições de probabilidade

Distribuição discretaDistribuição contínua

Distribuição Binomial

Variáveis aleatórias binárias

f (k) = P[X = k] =

(n

k

)pkq(n−k) ∀ k = 0, 1, ..., n (12)

E [X ] = np (13)

Var[X ] = npq (14)

n �> Total de amostras

k �> Total de eventos ocorridos

p �> Probabilidade de um evento ocorrer

q �> Probabilidade de um evento não ocorrer

Marcelo Goulart Correia Introdução à Bioestatística

Page 18: Introdução à Bioestatística · Vriávela aleatória Distribuições de robabilidpade Distribuição discreta Distribuição contínua Introdução à Bioestatística Marcelo Goulart

Variável aleatóriaDistribuições de probabilidade

Distribuição discretaDistribuição contínua

Entendendo melhor...

Vamos lançar uma moeda "honesta" duas vezes e ver ospossíveis."Cara" = C e "Coroa" = K

Segundo \Primeiro C KC CC CKK KC KK

Marcelo Goulart Correia Introdução à Bioestatística

Page 19: Introdução à Bioestatística · Vriávela aleatória Distribuições de robabilidpade Distribuição discreta Distribuição contínua Introdução à Bioestatística Marcelo Goulart

Variável aleatóriaDistribuições de probabilidade

Distribuição discretaDistribuição contínua

Entendendo melhor...

Marcelo Goulart Correia Introdução à Bioestatística

Page 20: Introdução à Bioestatística · Vriávela aleatória Distribuições de robabilidpade Distribuição discreta Distribuição contínua Introdução à Bioestatística Marcelo Goulart

Variável aleatóriaDistribuições de probabilidade

Distribuição discretaDistribuição contínua

Entendendo melhor...

Repetindo o experimento agora lançando 3 moedas"Cara" = C e "Coroa" = K

Terceiro \Anterior CC KC CK KKC CCC KCC CKC KKCK CCK KCK CKK KKK

Marcelo Goulart Correia Introdução à Bioestatística

Page 21: Introdução à Bioestatística · Vriávela aleatória Distribuições de robabilidpade Distribuição discreta Distribuição contínua Introdução à Bioestatística Marcelo Goulart

Variável aleatóriaDistribuições de probabilidade

Distribuição discretaDistribuição contínua

Entendendo melhor...

Marcelo Goulart Correia Introdução à Bioestatística

Page 22: Introdução à Bioestatística · Vriávela aleatória Distribuições de robabilidpade Distribuição discreta Distribuição contínua Introdução à Bioestatística Marcelo Goulart

Variável aleatóriaDistribuições de probabilidade

Distribuição discretaDistribuição contínua

Entendendo melhor...

Repetindo o experimento agora lançando 4 moedas"Cara" = C e "Coroa" = K

Quarto \Anterior CCC KCC CKC CCK KKC KCK CKK KKKC CCCC KCCC CKCC CCKC KKCC KCKC CKKC KKKCK CCCK KCCK CKCK CCKK KKCK KCKK CKKK KKKK

Marcelo Goulart Correia Introdução à Bioestatística

Page 23: Introdução à Bioestatística · Vriávela aleatória Distribuições de robabilidpade Distribuição discreta Distribuição contínua Introdução à Bioestatística Marcelo Goulart

Variável aleatóriaDistribuições de probabilidade

Distribuição discretaDistribuição contínua

Entendendo melhor...

Marcelo Goulart Correia Introdução à Bioestatística

Page 24: Introdução à Bioestatística · Vriávela aleatória Distribuições de robabilidpade Distribuição discreta Distribuição contínua Introdução à Bioestatística Marcelo Goulart

Variável aleatóriaDistribuições de probabilidade

Distribuição discretaDistribuição contínua

Entendendo melhor...Resumindo:

Os valores de X são sempre inteiros

Os eventos são independentes

As probabilidades pressupõesm reposição

A ordem dos fatores não altera o produto :P

Marcelo Goulart Correia Introdução à Bioestatística

Page 25: Introdução à Bioestatística · Vriávela aleatória Distribuições de robabilidpade Distribuição discreta Distribuição contínua Introdução à Bioestatística Marcelo Goulart

Variável aleatóriaDistribuições de probabilidade

Distribuição discretaDistribuição contínua

Exemplo

A probabilidade de uma pessoa apresentar IC num teste deesforço é de 10%. Após analisar 10 pacientes, qual aprobabilidade de que 5 deles apresentarem IC? Qual aesperança e a variância?(

n

k

)= n!

k!(n−k)!

f (5) = P[X = 5] =(105

)0, 150, 9(10−5)

= 10!5!(10−5)!0, 1

50, 9(10−5)

= 0, 0015 = 0, 15%

E [X ] = 10 ∗ 0, 1 = 1Var[X ] = 10 ∗ 0, 1 ∗ 0, 9 = 0, 9

Marcelo Goulart Correia Introdução à Bioestatística

Page 26: Introdução à Bioestatística · Vriávela aleatória Distribuições de robabilidpade Distribuição discreta Distribuição contínua Introdução à Bioestatística Marcelo Goulart

Variável aleatóriaDistribuições de probabilidade

Distribuição discretaDistribuição contínua

Exercício

Marcelo Goulart Correia Introdução à Bioestatística

Page 27: Introdução à Bioestatística · Vriávela aleatória Distribuições de robabilidpade Distribuição discreta Distribuição contínua Introdução à Bioestatística Marcelo Goulart

Variável aleatóriaDistribuições de probabilidade

Distribuição discretaDistribuição contínua

Distribuição Normal

Distribuição essencial para diversos testes e hipótesestrabalhadas na EstatísticaGrande parte dos fenômenos estudados possuem essecomportamento

f (x) =1

σ√2π

e−12∗( x−µ

σ)2 ,∀x ∈ R (15)

σ �> Desvio-padrão dos dados

µ �> Média dos dados

x �> Faixa de valores que podem ocorrer

E [X ] = µ (16)

Var [X ] = σ2 (17)

Marcelo Goulart Correia Introdução à Bioestatística

Page 28: Introdução à Bioestatística · Vriávela aleatória Distribuições de robabilidpade Distribuição discreta Distribuição contínua Introdução à Bioestatística Marcelo Goulart

Variável aleatóriaDistribuições de probabilidade

Distribuição discretaDistribuição contínua

Entendendo melhor...

Marcelo Goulart Correia Introdução à Bioestatística

Page 29: Introdução à Bioestatística · Vriávela aleatória Distribuições de robabilidpade Distribuição discreta Distribuição contínua Introdução à Bioestatística Marcelo Goulart

Variável aleatóriaDistribuições de probabilidade

Distribuição discretaDistribuição contínua

Distribuição Normal

Assimetria e Curtose igual à zeroForma de sino (Depende de µ e σ)Outras distribuições podem ser aproximadas à Normal(Binomial, Poisson, ...)

Marcelo Goulart Correia Introdução à Bioestatística

Page 30: Introdução à Bioestatística · Vriávela aleatória Distribuições de robabilidpade Distribuição discreta Distribuição contínua Introdução à Bioestatística Marcelo Goulart

Variável aleatóriaDistribuições de probabilidade

Distribuição discretaDistribuição contínua

Estatística Z - Curva Normal Padronizada

Artifício utilizado para cálculo da área (probabilidades) dacurva Normal

Z =X − µσ

(18)

Marcelo Goulart Correia Introdução à Bioestatística

Page 31: Introdução à Bioestatística · Vriávela aleatória Distribuições de robabilidpade Distribuição discreta Distribuição contínua Introdução à Bioestatística Marcelo Goulart

Variável aleatóriaDistribuições de probabilidade

Distribuição discretaDistribuição contínua

Entendendo melhor...

Marcelo Goulart Correia Introdução à Bioestatística

Page 32: Introdução à Bioestatística · Vriávela aleatória Distribuições de robabilidpade Distribuição discreta Distribuição contínua Introdução à Bioestatística Marcelo Goulart

Variável aleatóriaDistribuições de probabilidade

Distribuição discretaDistribuição contínua

Exemplo

Probabilidade de uma pessoa apresentar entre 200-225mg por100ml de plasma. µ = 200 e σ = 20

z = 225−20020

= 1, 25P(0 ≤ z ≤ 1, 25) = 0, 3944

Marcelo Goulart Correia Introdução à Bioestatística

Page 33: Introdução à Bioestatística · Vriávela aleatória Distribuições de robabilidpade Distribuição discreta Distribuição contínua Introdução à Bioestatística Marcelo Goulart

Variável aleatóriaDistribuições de probabilidade

Distribuição discretaDistribuição contínua

Exercício

Marcelo Goulart Correia Introdução à Bioestatística