test di ipotesi - old · test di ipotesi - prob. e stat. a.a. 04/05 1 test di ipotesi test di...
TRANSCRIPT
Test di ipotesi - Prob. e Stat. a.a. 04/05 1
Test di Ipotesi
Test di ipotesi - Prob. e Stat. a.a. 04/05 2
DefinizioneUna ipotesi statistica è una proposizione circa uno o più parametridi una popolazione o circa la distribuzione di probabilità della va-riabile aleatoria X che descrive la popolazione.
Esempio: Si vuole stabilire se una certa moneta è equa, ossia se p=P(T)=P(C)=0.5.Si formula l’ipotesi di base (quella da sottoporre a test) che la moneta è onestae si verifica l’attendibilità di tale ipotesi contro l’ipotesi alternativa (che la monetasia disonesta).
a)alternativ (ipotesi 5.0 p nulla) (ipotesi 0.5 : 10 ≠= : HpH
Metodologia statistica che consente di prendere una decisione Metodologia statistica che consente di prendere una decisione circa:circa:- una ipotesi formulata sul modello di una popolazione - una ipotesi formulata sul modello di una popolazione - un parametro incognito del modello di una popolazione.- un parametro incognito del modello di una popolazione.
Test di ipotesi - Prob. e Stat. a.a. 04/05 3
a)alternativ (ipotesi 50
nulla) (ipotesi 0.5 :
1
0
.p : H
pH
≠=
a)alternativ (ipotesi 5.0
nulla) (ipotesi 0.5 :
1
0
<=
p: H
pH
a)alternativ (ipotesi 50
nulla) (ipotesi 0.5 :
1
0
.p : H
pH
>=
Ipotesi alternativa a due code
Ipotesi alternativa a una coda
Obbiettivo
Determinare se il valore del parametro è cambiato
Verificare la teoria sul modello
Test di conformità
Risultato da esperienza passata o conoscenza del processo
Risultato di una ipotesi formulatasul modello
Risultato di specifiche di progettoo obblighi contrattuali
Test di ipotesi - Prob. e Stat. a.a. 04/05 4
Se questa informazioneè consistente con l’ipotesi
Se questa informazione nonè consistente con l’ipotesi
erigettabil ènon 0H falsa è 0HUna ipotesi non potrà mai essera accettata con certezza, ma il risultatodel test sarà sempre accompagnato da una valutazione della possibi-lità di commettere un errore accettando o rigettando l’ipotesi.
• selezionare un campione casuale• calcolare una statistica test• usando il valore calcolato prendere una decisione circa l’ipotesi nulla
Procedura
Si chiama test di ipotesi una procedura che consente diprendere una decisione circa una particolare ipotesi (nulla) apartire dalle informazioni contenute in un campione casualeestratto dalla popolazione in esame.
Test di ipotesi - Prob. e Stat. a.a. 04/05 5
.5.48 oppure 5.51 fosse se ipotesil' rigettare di e
5.5148.5 fosse se ipotesil' rigettarenon di assumere legittimo E' . acampionari media la tarepoter valu di supponga Si
.10 tagliadi casuale campioneun osservato stato sia che assuma Si
0
0
<>≤≤
=
xxH
xH
x
n
Il complemento della regione critica viene chiamato regione di accettazione.
Esempio: Si vuole stabilire se il coefficiente di combustione medio di un propellente solido usato per potenziare un sistema di fuga in un equipaggio aereo è 50 cm al secondo.
a)alternativ (ipotesi 50 nulla) (ipotesi 50cm/s : 10 cm/s: HH ≠= µµ
me.sottoinsie talea appartienenon
teststatistca della calcolato valoreil se accetta si e mesottoinsie talea
appartiene test statistica della calcolato valoreil se rigetta si che talereali numeri di mesottoinsie quel è ipotesi diun test di La
0
0
sH
sH
critica regioneeDefinizion
Test di ipotesi - Prob. e Stat. a.a. 04/05 6
Questo tipo di procedura decisionale può condurre a due tipi di errori
veroµ48.5 51.550
x
I tipo
veroµ48.5 51.550
x
II tipo
Reg.accettazione Regione criticaRegione critica
Si commette un errore del I tipo quando si rigetta l’ipotesi nulla puressendo vera. Si commette un errore del II tipo quando non si riget-ta l’ipotesi nulla pur essendo falsa.
Test di ipotesi - Prob. e Stat. a.a. 04/05 7
Ipotesi nulla vera Ipotesi nulla falsaNon si rigetta l’ipotesi nulla no errore errore II tipoSi rigetta l’ipotesi nulla errore I tipo no errore
falsa) è quando eP(accettar tipo)II di errore(
vera)è quando eP(rigettar tipo)I di errore( : tipoI di erroreun commettere di
àprobabilit la test del tagliao test del definisce Si
0
0
HP
HP
====
βα
ivitàsignificat di livelloeDefinizion
Ipotesi nulla vera Ipotesi nulla falsaNon si rigetta l’ipotesi nulla 1-α βSi rigetta l’ipotesi nulla α 1- β
Test di ipotesi - Prob. e Stat. a.a. 04/05 8
Torniamo all’esempio del fattore di combustione. Si assuma che la deviazione standard di tale variabile aleatoria sia 2.5 cm al sec. Determinare il livello di significatività del test per un campione di taglia 10.
( ) ( ) ( )( ) ( ) ( )
0588.010/5.2
505,482
10/5.2
505,51
10/5.2
50
10/5.2
505,48
10/5.2
50
505,5150505,485050 |5,515,48
50 |critica regione 50 | rigettare vera | rigettare 000
=
−<=
−>−+
−<−=
=−>−+−<−==><=
=∈===
ZPX
PX
P
XPXPXXP
XPHPHHP
µµµ
Υ
0014.0 16 52480164.0 16 5.515.480114.0 10 52480576.0 10 5.515.48
taglianeaccettazio di Regione
≤≤≤≤≤≤≤≤
x
x
x
x
α
Test di ipotesi - Prob. e Stat. a.a. 04/05 9
vera)è | rigettarenon (
falsa) è quando rigettareP(non tipo)II di errore(
10
0
HHP
HP
===β
tipo? II di errore un commettere di àprobabilit la calcola si Come
Per calcolare l’errore di secondo tipo dobbiamo avere una ipotesialternativa specifica. Quale?
50:1 ≠µH
Si assuma che è “necessario” rigettare l’ipotesi nullase il coefficiente di combustione medio dovesse raggiungere valoriintorno a 52.
50:0 =µH
( ) 2643.052 quando 5.515.48
.52 quando 51.5 e 48.5 tracompresa acampionari media della puntuale stima una fornisce casuale campione il se tipo,II di erroreun commette si esempio, Ad
==≤≤==
µβµ
XP
Test di ipotesi - Prob. e Stat. a.a. 04/05 10
Lo statistico controlla l’errore di I tipo e in funzionedi questo seleziona la regione critica.
Rigettare l’ipotesi nulla
Accettare l’ipotesi nulla= non si rigetta l’ipotesi nulla
L’errore di II tipo dipende dal vero valore delparametro in esame, che è normalmente incognito,sicché si procede per tentativi.
Test di ipotesi - Prob. e Stat. a.a. 04/05 11
0.99180.94450.97050.8923
5000.0 0014.0 16 52482119.0 0164.0 16 5.515.485000.0 0114.0 10 52482643.0 0576.0 10 5.515.48
50.5con 52con taglianeaccettazio di Regione
≤≤≤≤≤≤≤≤
==
x
x
x
x
µβµβα
•L’errore di I tipo è legato all’errore di II tipo. Se aumenta uno decrescel’altro e viceversa.•Al crescere della taglia del campione, vengono ridotti gli errori di Ie II tipo.• L’errore di II tipo diminuisce se il valore assegnato al parametro si allontana da quello impiegato nell’ipotesi nulla.
Test di ipotesi - Prob. e Stat. a.a. 04/05 12
DefinizioneSi definisce potenza del test, la probabilità di rigettare l’ipotesi nullaquando è vera l’ipotesi alternativa.
è la probabilità di rigettare correttamente un’ipotesi nulla falsaβ−1
campione. del tagliala tare-aumen oppure aumentare può si basso, valorequesto ritiene si Se falsa. è nulla ipotesi
l' che riconosce test il 100su casi 73in con ossia 0.7357,-10.2643
allora 52, è parametro del vero valoreil se ,50: aalternativ ipotesil' contro
50: ipotesisull' test il effettua si dove ecombustion di fattore del esempioNell'
1
0
αββ
µµµ
=⇒=≠
=H
H
β−1
Test di ipotesi - Prob. e Stat. a.a. 04/05 13
critica. regione alla meno o appartiene puntale stima talese do verificannulla, ipotesil' meno o rigettare se Decidere (h)
test.statistica della puntuale stima una valutaree casuale campioneun eDeterminar (g)
..critica regione opportuna una Costruire (f).parametro) dal (dipende test statistica opportuna una Scegliere (e)
. tipoI di errore opportunoun Scegliere (d)
.code) 2 o 1 a(test aalternativ ipotesi opportuna una eSpecificar (c)
. nulla ipotesil' Formulare (b)interesse. di parametro il reidentifica problema, del contesto Dal (a)
1
0
α
αH
H
ipotesi. ditest un di ecostruzion laper generale Procedura
Esercizio: La specifica assegnata sul coefficiente di combustione di un certo propol-lente è di 50cm/s. La deviazione standard di tale caratteristica è di 2cm/s. Selezionan-do un campione casuale di taglia 25, si è trovato che la media campionaria è di 51.3cm/s. Quale conclusione si può dedurre sulla specifica al livello di significatività del5%?
Test di ipotesi - Prob. e Stat. a.a. 04/05 14
)78.50,21.49(52
96.105,52
96.150 05,50
:intervallol' è test del neaccettazio di
regione la allora -1)/
( :che sa si Poichè
-1)50|?(? vera)è |??(
:critica regione opportuna una Costruire (f)camp.). (media test statistica opportuna una Scegliere (e)
0.05. tipoI di errore opportunoun Scegliere (d)
.50: aalternativ ipotesi l' eSpecificar (c)
50: nulla ipotesil' Formulare (b). media la:interesse di parametro il reIdentifica (a)
2/2/
2/2/
0
11
00
=
+−=
+−
=<−<−
==<<⇒=><
⇒=⇒
≠⇒=⇒
nz
nz
zn
XzP
XPHXXP
X
HH
HH
σσ
ασ
µ
αµα
ααµ
µµ
αα
αα
Υ
Procedura per il test di ipotesi
Test di ipotesi - Prob. e Stat. a.a. 04/05 15
rigettata. vienenulla ipotesil' ),78.50,21.49( 51.3 poichè :critica regione alla meno o appartiene puntale stima
talese do verificannulla, ipotesil' meno o rigettare se Decidere (h).351 test.statistica della
puntuale stima una valutaree casuale campioneun eDeterminar (g)
∉
=⇒ .x
Test di ipotesi - Prob. e Stat. a.a. 04/05 16
Esercizio: Si ipotizza che l’età media dei frequentatori di una biblioteca sia 39 anni con unavarianza di 10.2 anni. Per verificare tale ipotesi vengono campionati 100 frequentatori e la loro età media risulta essere 38 anni. Si verifichi l’ipotesi iniziale (si assuma la popolazione normale).
)51.39,48.38(1019.3
96.193,1019.3
96.139 93,39
:intervallol' è test del neaccettazio di
regione la allora -1)/
( :che sa si Poichè
-1)0.39|?(? vera)è |??(
:critica regione opportuna una Costruire (f)camp.). (media test statistica opportuna una Scegliere (e)
0.05. tipoI di errore opportunoun Scegliere (d).0.39: aalternativ ipotesi l' eSpecificar (c)
0.39: nulla ipotesil' Formulare (b). media la:interesse di parametro il reIdentifica (a)
2/2/
2/2/
0
11
00
=
+−=
+−
=<−<−
==<<⇒=><
⇒=⇒
≠⇒=⇒
nz
nz
zn
XzP
XPHXXP
X
HH
HH
σσ
ασ
µ
αµα
ααµ
µµ
αα
αα
Υ
Test di ipotesi - Prob. e Stat. a.a. 04/05 17
rigettata. vienenulla ipotesil' ),51.39,42.38( 38 poichè :critica regione alla meno o appartiene puntale stima
talese do verificannulla, ipotesil' meno o rigettare se Decidere (h).38 test.statistica della
puntuale stima una valutaree casuale campioneun eDeterminar (g)
∉
=⇒ x
Test di ipotesi - Prob. e Stat. a.a. 04/05 18
T es t di Ipotes i sul la Media: var ianz a nota
( ) αµµσ
µ
µµµµ
αα −==≤≤−
−=
≠=
1 quando /
::
02/2/
01
00
zZzPn
XZ
H
H
one AccettaziRegione
test Statistica
code) due a(test Ipotesi
( ) αµµσ
µ
µµµµ
α −==−≥≤
−=
<>=
1 | )( /
)(::
0
01
00
zZPn
XZ
HH
one AccettaziR.
test Statistica
coda) una a(test Ipotesi
Test di ipotesi - Prob. e Stat. a.a. 04/05 19
T es t di Ipotes i sul la Media: var ianz a incognita
( ) αµµ
µ
µµµµ
αα −==≤≤−
−=
≠=
−− 1 quando
) (/
::
01,2/1,2/
01
00
nn tTtP
normaleepopolazionnS
XT
H
H
one AccettaziRegione
test Statistica
code) due a(test Ipotesi
( )( )( )
.zazionestandardiz
di operazione mediante ...|, alcolare (b)
., forma nella neaccettazio di regione la Ricavare (a)
121
21
=∈=
∈
µβ xxXPC
xxX
:tipo II di errorel' calcolarePer
Test di ipotesi - Prob. e Stat. a.a. 04/05 20
10? da diversa è media la quando fallimentoun ha si che
nosuggerisco dati I normale. epopolazion una da provengano campioni i che assuma Si7,9 10,1 11,4 11,9 12,7 14,9 19,5 15,4 15,4 7,5 8,8
11,4 11,4 11,9 13,6 14,1 15,4 15,8 16,7 17,6 18,5 19,8
:sono campioni22 dei fallimento di ticoefficien I lega. certa una di campioni 22su adesione diun test di
risultati i descrive (1989) giornale nel articolo Un :Esercizio gEngineerinMaterials
M edia 13,71364E rrore s tandard 0,757625M ediana 13,85M oda 11,4Deviaz ione s tandard 3,553576V arianz a c am pionaria 12,6279Curtos i -0,75137A s im m etria -0,01513Intervallo 12,3M inim o 7,5M as s im o 19,8S om m a 301,7Conteggio 22P iù grande(1) 19,8P iù pic c olo(1) 7,5Livello di c onfidenz a(95,0% ) 1,575567
0
2
4
6
8
7,5 10,575 13,65 16,725 Altro
Freq
uenz
a
Classe Frequenza7,5 1
10,575 313,65 7
16,725 7Altro 4
Dati relativiall’istogramma
Test di ipotesi - Prob. e Stat. a.a. 04/05 21
Come ver ificar e l’as s unzione che la popolazione è nor male?
7.9
19.8
13,8
11,4
15,7
Costruendo un box plot, si osserva che la popolazione è simmetrica.
Normal probability plot
)cumulative
frequenze (le 100*n0.5-i
con coppiain plottati vengonoordinati valoriTali
.,,,in ordinati
vengono,,, dati I
)()2()1(
21
n
n
xxx
xxx
ΚΚ
Test di ipotesi - Prob. e Stat. a.a. 04/05 22
T es t di Ipotes i sul la Var ianz a: Popolaz ione normale
( ) ασσχχχσ
χ
σσσσ
αα −==≤≤
−=
≠=
−−− 1 quando
) ()1(
::
20
221,2/
221,2/1
20
22
20
21
20
20
nnP
normaleepopolazionSn
H
H
one AccettaziRegione
test Statistica
code) due a(test Ipotesi
Esercizio: Una macchina per l’imbottigliamento automatico di liquido detergenteviene sottoposta a verifica, selezionando un campione di 20 bottiglie. Per queste 20 bottiglie, viene misurata la quantità di liquido contenuta in ciascuna di esse e calcolata la varianza campionaria che risulta pari a 0.0153. Se la varianza associata al processo di imbottigliamento del liquido supera lo 0.01, si corre il rischio di avere bottiglie troppo piene rispetto alla specifica assegnata o viceversa. C’è una evidenzadai dati raccolti per concludere che il processo di imbottigliamento non funziona bene?Si assuma che il volume di liquido in ciascuna bottiglia sia distribuito come una nor-male.
Test di ipotesi - Prob. e Stat. a.a. 04/05 23
T es t di Ipotes i sul le Percentuali
( )( ) ααα −==≤≤−
−−=
≠=
1 quando
1
::
02/2/
01
00
ppzZzP
pnp
npXZ
ppH
ppH
one AccettaziRegione
test Statistica
code) due a(test Ipotesi
T es t di Ipotes i sul le Differenz e tra medie - Var ianz a nota
( ) αµµ
σσ
µµ
µµµµ
αα −=∆=−≤≤−
+
−−−=
∆≠−∆=−
1 quando
)(
::
0212/2/
2
22
1
21
2121
0211
0210
zZzP
nn
XXZ
H
H
one AccettaziRegione
test Statistica
code) due a(test Ipotesi
Test di ipotesi - Prob. e Stat. a.a. 04/05 24
T es t di Ipotes i sul le Differenz e tra medie - Var ianz a incognita
( ) αµµ
µµ
µµµµ
αα −=∆=−≤≤−
+
−−−=
∆≠−∆=−
−+−+ 1,
11
)(
::
0212,2/2,2/
21
2121
0211
0210
2121 nnnn
p
tTtP
nnS
XXT
H
H
one AccettaziRegione
test Statistica
code) due a(test Ipotesi
T es t di Ipotes i sui rapporti tra var ianz e - Var ianz a incognita
( ) α
σσσσ
αα −=≤≤
=
≠=
−−−−− 1,
SS
::
01,1,2/1,1,2/1
22
21
22
211
22
210
2121 nnnn fFfP
F
H
H
one AccettaziRegione
test Statistica
code) due a(test Ipotesi