fondamenti di statistica

1395
  FONDAMENTI DI STATISTICA APPLICATA  (edizione settembre 2002)  Lamberto Soliani  con la collaborazione di  F. Sartore e E. Siri  I N D I C E 

Upload: raf051047

Post on 11-Jul-2015

1.103 views

Category:

Documents


0 download

TRANSCRIPT

FONDAMENTI DI STATISTICA APPLICATA (edizione settembre 2002)Lamberto Solianicon la collaborazione diF. Sartore e E. Siri INDICE 1. ELEMENTI DI STATISTICA DESCRITTIVA PER DISTRIBUZIONI UNIVARIATE1.1. La statistica nella ricerca ambientale 1.2. Il disegno sperimentale,il campionamento e l'inferenza 1.3. Tipi di dati e scale di misurazione 1.3.1 La scala nominale o classificatoria 1.3.2 La scala ordinale o per ranghi 1.3.3 La scala ad intervalli 1.3.4 La scala di rapporti1.4. Classificazione in tabelle 1.5. Rappresentazioni grafiche di distribuzioni univariate 1.6. Le misure di tendenza centrale 1.6.1 Le misure di tendenza centrale o posizione 1.6.2 La mediana 1.6.3 La moda 1.7. Misure di dispersione o variabilit 1.7.1 Intervallo di variazione 1.7.2 La differenza interquartile 1.7.3 Lo scarto medio assoluto dalla media 1.7.4 Lo scarto medio assoluto dalla mediana 1.7.5 La devianza 1.7.6 La varianza 1.7.7 La deviazione standard 1.7.8 L'errore standard 1.7.9 Il coefficiente di variazione 1.7.10 La varianza in dati raggruppati: correzione di Sheppard1.8. Indici di forma: simmetria e curtosi1.9. Accuratezza, precisione e scelta del numero di cifre significative1.10. Metodi per calcolare un generico quantile da una serie di dati1.11. Rappresentazione semi-grafica delle distribuzioni: Box-and-Wisker, diagrammiStem-and-Leaf1.12. Esercizi sulle misure di tendenza centrale, dispersione, simmetria e curtosi

2. DISTRIBUZIONI E LEGGI DI PROBABILITA'2.1. Elementi di calcolo combinatorio semplice 2.1.1 Permutazioni semplici 2.1.2 Disposizioni semplici 2.1.3 Combinazioni semplici 2.1.4 Risposte alle domande del paragrafo 2.1 2.2. Definizioni di probabilit: matematica, frequentista e soggettiva, con elementi di statisticabayesiana 2.3. Alcune distribuzioni discrete 2.3.1 Distribuzione binomiale 2.3.2 Distribuzione multinomiale 2.3.3 Distribuzione poissoniana 2.3.4 Distribuzione geometrica e distribuzione di Pascal 2.3.5 Distribuzione ipergeometrica 2.3.6 Distribuzione binomiale negativa 2.3.7 Distribuzione uniforme o rettangolare 2.4. Alcune distribuzioni continue 2.4.1 Distribuzione normale o di Gauss 2.4.2 Distribuzioni asintoticamente normali, con approssimazioni e trasformazioni 2.4.3 Dalla disuguaglianza di Tchebycheff all'uso della distribuzione normale 2.4.4 Approssimazioni e correzioni per la continuit 2.4.5 Distribuzione rettangolare 2.4.6 Distribuzione esponenziale negativa 2.4.7 Le curve di Pearson 2.4.8 La distribuzione gamma2.5. Distribuzioni campionarie derivate dalla normale ed utili per l'inferenza: 2 di Pearson, t di Student e F di Fisher 2.5.1 La distribuzione 2.5.2 La distribuzione t di Student 2.5.3 La distribuzione F di Fisher 3. CONFRONTI TRA TASSI E PROPORZIONI3.1. Confronti tra distribuzioni osservate e distribuzioni attese 3.2. Condizioni di validit del 2 e correzione di Yates 3.3. Il metodo di Kolmogorov-Smirnov per un campione 3.4. Il confronto tra due distribuzioni osservate, per test di indipendenza: le tabelle di contingenza 2 x 2 (fourfold tables) con la correzione di Yates e quella di Haber 3.5. Confronti tra frequenze relative con la distribuzione normale e sua correzione per la continuit 3.6. Confronto tra test 2 per tabelle 2 x 2 e test z, senza e con le correzioni per la continuit 3.7. Confronto di una proporzione osservata con una attesa :il test z per grandi campioni e la distribuzione binomiale per piccoli campioni 3.8. Tabelle di contingenza 2 x 2 in piccoli campioni: il metodo esatto di Fisher 3.9. Le tabelle 2 x N con la formula generale e quella di Brandt-Snedecor. Le tabelle M x N 3.10. Il log-likelihood ratio o metodo G 3.10.1 Confronto tra una distribuzione osservata ed una attesa con la correzione di Williams 3.10.2 Tabelle 2 x 2, con la correzione di Williams e quella di Mantel -Haenszel3.10.3 Tabelle M x N con la correzione di Williams 3.11. Confronto tra due distribuzioni osservate: il metodo di Kolmogorov-Smirnov per 2campioniindipendenti 3.12. Il chi quadro con il metodo di Cochran e di Mantel -Haenszel 3.13. Esercizi svolti per dati in tabelle di contingenza 4. VERIFICA DELLE IPOTESI E INTERVALLO DI CONFIDENZA CON LA DISTRIBUZIONE NORMALE4.1. Risultati significativi e non-significativi4.2. Procedura di verifica delle ipotesi: vero o falso? utile o dannoso? 4.3. Potenza di un test 4.4. Numero di dati necessari in rapporto allapotenza, alla significativit del test e alla direzionalit dell'ipotesi. II criterio di Cohenper la scelta di e 4.5. Intervallo fiduciale di una media con 2nota4.6. Varianza di una proporzione campionaria, estratta da una popolazione infinita oppure finita;stima del rischio aggiuntivo4.7.Intervallo di confidenza di una proporzione in una popolazione infinita e in una popolazione finita4.8.Campione necessario per la stima una proporzione con errore prefissato4.9.Test per ladattamento con una proporzione nota o ignota4.10.Test per una proporzione e sua potenza, con uso della distribuzione binomiale e delladistribuzionenormale4.11. Differenza tra due proporzioni: significativita e intervallo fiduciale (metodo di Fisher e calcolo di Feldman e Kluger)4.12. Potenza a posteriori (1- ) e a priori (n) dei test sulla differenza tra due proporzioni4.13. Intervallo di confidenza di una varianza4.14. Confronto tra una varianza campionaria (s2) e una varianza attesa (2), con stima dellapotenza aposteriori e a priori4.15. Confronto tra un coefficiente di variazione osservato ed uno teorico od atteso4.16. Parametri e statistiche: correttezza, efficienza, consistenza, sufficienza

5. INFERENZA SU UNA O DUE MEDIE CON IL TEST tDI STUDENT5.1. La distribuzione t di Student 5.2. Confronto tra una media osservata e una media attesa; calcolo dei limiti di confidenza di unamedia, con ignota 5.3. Confronto tra una osservazione e la media di un campione 5.4. Il confronto tra le medie di due campioni 5.5. Il test t per 2 campioni dipendenti o per dati appaiati ed intervallo fiduciale della media delle differenze 5.6. Il test t per 2 campioni indipendenti o per dati non appaiati 5.7. Test F, test di Levene e test di Bartlett per ipotesi bilaterali e unilaterali sull'uguaglianza di duevarianze 5.8. Significativit e intervallo fiducialedi una differenza 5.9. Potenza a priori e a posteriori del test t, con un campione e con due campioni dipendenti oindipendenti 5.10. Dimensione del campione e precisione nella stima sia di una media, sia della differenza tradue medie 5.11. Il bilanciamento di due campioni indipendenti: vantaggi e costi 5.12. Potenza a priori e a posteriori del test F per l'omoschedasticit 5.13. Correzione per il campionamento in una popolazione finita e il concetto di superpopolazione 5.14. Test per la differenza tra due coefficienti di variazione con distribuzione z oppure distribuzione tdi Student 6. METODI NON PARAMETRICI PER UN CAMPIONE6.1. Caratteristiche dei test non parametrici 6.2. Il test delle successioni per un campione 6.3. Il test dei segni per un campione 6.4. Intervallo di confidenza per una probabilit o frequenza relativa, secondo il metodo di Cloppere Pearson 6.5. Intervalli di confidenza nonparametrici e intervalli di tolleranza 6.6. Il test dei segni per ranghi di Wilcoxon, per la tendenza centrale6.7. Test t di Wilcoxon per la simmetria6.8. Il dibattito sulla significativita dei test per la bonta di adattamento, rispetto a quelli per un parametro6.9. Rinvio ad altri test per un campione

7. METODI NON PARAMETRICI PER DUE CAMPIONI7.1. Test per 2 campioni dipendenti o per dati appaiati 7.2. Il test di McNemar con la correzione di Edwards e la stima della potenza a posteriori e a priori 7.3. Il test dei segni 7.4. Il test dei segni per ranghi: test T di Wilcoxon 7.5. Test di casualizzazione per 2 campioni dipendenti 7.6. Test per 2 campioni indipendenti7.7. Test per leffetto dellordine del trattamento o test di Gart 7.8. Il test della mediana o test di Mood 7.9. Il test di Wilcoxon-Mann-Whitney della somma dei ranghi 7.10. Il test U di Mann-Whitney o dell'ordine robusto dei ranghi 7.11. Cenni del test S di Kendall e suoi rapporti con T ed U; potenza-efficienza dei tre test 7.12. Test di casualizzazione per 2 campioni indipendenti 7.13. Il test delle successioni per due campioni o test di Wald-Wolfowitz 7.14. Test di Siegel -Tukey per l'uguaglianza della vari anza: cenni del test di Freund-Ansari-Bradley e del test di Conover 7.15. Il test dei ranghi equivalenti di Moses per le differenze nella dispersione o variabilit 8. ANALISI DELLA VARIANZA (ANOVA I) A UN CRITERIO DI CLASSIFICAZIONEE CONFRONTI TRA PIU'MEDIE8.1. Analisi della varianza ad un criterio di classificazione o a campionamento completamenterandomizzato 8.2. Confronto tra analisi della varianza con due trattamenti e test t di Student per 2 campioniindipendenti 8.3. Test per l'omogeneit della varianza tra pi campioni: test di Hartley, Cochran, Bartlett, Levene 8.4. I confronti a priori o pianificati tra pi medie8.5. Confronti multipli a posteriori o post hoc (UMCP) 8.5.1Il principio di Bonferroni e il metodo di Dunn-Sidak 8.5.2La procedura LSD di Fisher e la modifica di Winer 8.5.3Il test HSD di Tukey e la precedura di Tukey-Kramer 8.5.4Il test di Student-Newman-Keuls o test SNK 8.5.5Il test di Scheff con lestensione di Gabriel 8.5.6Il test di C. W. Dunnett 8.5.7Il test di D. B. Duncan 8.5.8Test multipli sequenziali di Holm e confronto con il test di Bonferroni; cenni sul metodo di Shaffer 8.5.9Cenni su altri test 8.5.10Dibattito sul test post -hoc migliore8.6.Confronti post-hoc tra varianze8.7.Stima della dimensione n di k gruppi campionari per lanova

9. ANALISIDELLA VARIANZA A PIU' CRITERI DI CLASSIFICAZIONE9.1. Analisi della varianza a due criteri di classificazione o a blocchi randomizzati, con unasola osservazione per casella 9.2. Confronto tra analisi della varianza a due criteri e test t di Student per 2 campioni dipendenti 9.3. Analisi della varianza a tre o pi criteri 9.4. Quadrati latini e greco-latini 9.5. Dati mancanti o anomali in disegni a pi fattori 9.6. Efficienza relativa di due disegni sperimentali 9.7. Potenza a priori e a posteriori nell'ANOVA, con grafici di Pearson e Hartley 9.8. Appendice al capitolo: lettura di tabulati dell'analisi della varianza effettuata con un pacchettostatistico 10. ANALISI FATTORIALE, DISEGNI COMPLESSICON FATTORI INCROCIATI10.1 Analisi fattoriale ed interazione 10.2. Interazione tra due fattori api livelli 10.3. Rappresentazione grafica per l'interpretazione dell'interazione a due fattori 10.4. Analisi della varianza a due fattori con repliche ineguali 10.5. Il test T di Tukey per il confronto tra le medie in disegni a due fattori con repliche 10.6. Esperimenti fattoriali 2 x 2 e 23 con i confronti ortogonali 10.7. Esperimenti fattoriali con P fattori a k livelli10.8. Test di Tukey per la non-additivita con 1 df 10.9. Quadrati latini con repliche 10.10. Lettura di due tabulati di programmi informatici 11. TRASFORMAZIONE DEI DATI CON TEST PER NORMALITA', SIMMETRIA E CURTOSI11.1. Assunzioni di validita' e trasformazioni dei dati11.2.La scelta della trasformazione idonea: il metodo di Box-Cox11.3. Effetti delle trasformazioni sui risultati dellanova11.4. Test per la verifica di normalita, simmetria e curtosi, con i metodi proposti daSnedecor-Cochran11.5. Metodi grafici e altri test (Lilliefors, DAgostino-Pearson) per normalita, simmetria e curtosi(cenni dei test di Geary e di Shapiro-Wilk)11.6.Cenni del test di Cramer-Von Mises 12. LANALISI GERARCHICA E LE COMPONENTI DELLA VARIANZA12.1. Analisi gerarchica o nested in anova I, II e III12.2. Nested anova I o a effetti fissi12.3.Interazione: l'analisi gerarchica in esperimenti fattoriali12.4.Disegni con fattori nested e crossed12.5. Confronti multipli e intervalli fiduciali in nested anova I12.6.Potenza del test nellanalisi fattoriale e in nested anova I12.7.Il concetto di effetti random e condizioni di validita del test12.8.Anova II e le componenti della varianza con un solo fattore e campioni bilanciati oineguali.12.9.Cenni nested di anova II in disegni a due e a piu fattori12.10.Cenni di anova III o a effetti misti12.11.Analisi nested e pattern spaziale12.12.Analisi nested e pattern temporale

13. TEST NON PARAMETRICI PER PIU' CAMPIONI13.1. Test non parametrici analoghi all'analisi della varianza 13.2. Estensione del test della mediana 13.3. Cenni sul test di Nemenyi 13.4. Analisi della varianza per ranghi ad un criterio di classificazione: il test di Kruskal-Wallis 13.5. Confronti multipli nell'analisi della varianza per ranghi, con k campioni indipendenti 13.6. Test per l'eterogeneit della varianza con k campioni13.7. Confronti tra piu' proporzioni con confronti multipli. 13.8. Il test Q di Cochran 13.9. Estensione del test di McNemar o test di Bowker. 13.10. Analisi della varianza per ranghi, a 2 criteri di classificazione: test di Friedman con unae conK repliche 13.11. I confronti multipli tra medie di ranghi nell'analisi della varianza non parametrica, a due criteridi classificazione 14. REGRESSIONE LINEARE SEMPLICE14.1. Regressione o correlazione? 14.2. Descrizione di una distribuzione bivariata 14.3. Modelli di regressione 14.4. La regressione lineare semplice 14.5. Valore predittivo della regressione 14.6. Significativit dei parametri b e a della retta di regressione 14.7. Potenza a priori e a posteriori nellaregressione lineare 14.8. Intervallo di confidenza dei parametri e . 14.9. Limiti di confidenza per i valori medi di i stimati 14.10. Limiti di confidenza per singoli valori di i stimati 14.11. Errori delle variabili e limiti di tolleranza 14.12. Il coefficiente di determinazione: R2 e R2 adj (aggiustato) 14.13. La predizione inversa 14.14. Confronto tra due o pi rette di regressione 14.15. Confronti multipli tra pi coefficienti angolari 14.16. Analisi della relazione dose-effetto nel caso di Y ripetute: test per la linearit e calcolo dellaretta di regressione 14.17. Condizioni di validit della regressione con l'analisi dei residui;test per la costanza dellavarianza derrore (Levene modificato e Breusch-Pagan o Cook-Weisberg), trasformazioniper la retta 15. CORRELAZIONE E COVARIANZA15.1. La correlazione 15.2. Condizioni di validit e significativit di r con = 0econ # 0 15.3. Significativit della retta con R2 ? 15.4. Intervallo di confidenza di 15.5. Potenza a priori e a posteriori per la significativit di r 15.6. Differenza tra due coefficienti di correlazione in campioni indipendenti e calcolo delcoefficientecomune 15.7. Potenza a priori e a posteriori del test per la significativit della differenza tra due coefficientidi correlazione 15.8. Test per la differenza tra pi coefficienti di correlazione; coefficiente di correlazione comune rw e sua significativit 15.9. Cenni sui confronti multipli tra pi r 15.10. La correlazione parziale o netta di primo ordine e di ordine superiore; la correlazionesemiparziale 15.11. Analisi della covarianza (ANCOVA) 15.12. Lettura di tre tabulati di programmi informatici 16. TEST NON PARAMETRICI PER IL TREND E MISUREDI ASSOCIAZIONE TRA VARIABILI16.1. Il test di Cox e Stuart 16.2. Il test di Jonckheere o Jonckheere-Terpstra per alternative ordinate in k campioni indipendenti 16.3. Il test di Page per alternative ordinate 16.4. Le misure d'associazione o d'indipendenza 16.5. Associazione in tabelle 2 x 2 o fra variabili dicotomiche: il Q e l'Y di Yule, il , il Dsim e il dxy di Somers, il c; il e il c di Pearson, il v di Cramer, il dt di Tschuprow 16.6. Il cross-product ratio (CPR) 16.7. Associazione per variabili categoriali in tabelle M x N: la PRE, il simmetrico ed asimmetricodi Goodman e Kruskal le misure fondate sul chi quadrato 16.8. Cograduazione per variabili ordinali in tabelle M x N: il di Goodman e Kruskall, il k di Kendall,il dba e il dab di Somers 16.9. Stima dell'accordo con scala nominal e: il kappa di Cohen 16.10. Lettura dei tabulati di un pacchetto statistico 17. TEST NON PARAMETRICI PER CORRELAZIONE, CONCORDANZA E REGRESSIONE LINEARE17.1. La correlazione non parametrica (rho) di Spearman con la distribuzione di Hotelling-Pabsteil test di Daniels 17.2. Il coefficiente di correlazione (tau) di Kendall, conaeb. Il 2 di Mantel-Haenszel 17.3. Il coefficiente di correlazione parziale (tau) di Kendall 17.4. Cenni su misure di concordanza tra pi valutatori: la W, la U di Kendall 17.5. Misure per dati d'intervallo con classi costanti: il coefficiente di correlazione r di Pearson e ilcoefficiente eta 17.6. Odds ratio: rapporto di probabilit o tra rischi 17.7. La regressione linearenon parametrica 17.8. Calcolo della retta di regressione non parametrica con il metodo di Theil 17.9. Confronto fra la retta parametrica e la retta di Theil 17.10. Il test di Theil per la significativit di b 17.11.Il test di Hollander17.12. Trend lineare di Armitage per le proporzioni e le frequenze

18. DISEGNO SPERIMENTALE, CAMPIONAMENTO EMETODI INFERENZIALI NUOVI18.1. I motivi del disegnosperimentale e del campionamento18.2. Campioni probabilistici e non probabilistici18.3. Lerrore di stima nel campionamento: lesempio di Snedecor-Cochran18.4. I parametri rilevanti nella scelta del tipo di campionamento18.5. LANOM con misure, proporzioni e conteggi18.5.1LANOM con misure di intervalli o di rapporti 18.5.2LANOM con proporzioni o percentuali 18.5.3LANOM con conteggi 18.6. Metodi nuovi per linferenza: Monte Carlo e principio plug-i n18.7. Il Jackknife18.8. Il Bootstrap

Lettere dell'alfabeto greco antico alpha beta gamma delta epsilon zeta eta , , theta iota kappa lambda mu (my, mi) nu (ny, ni) xi (csi) omicron pi rho , sigma tau upsilon (ypsilon) phi chi psi omega 1FONDAMENTIDISTATISTICAAPPLICATACAPITOLOIELEMENTI DI STATISTICADESCRITTIVAPERDISTRIBUZIONIUNIVARIATE1.1. LA STATISTICA NELLA RICERCA AMBIENTALE.Comeintuttalaricercascientificasperimentale,anchenellescienzeambientalieinquellebiologicheindispensabilelaconoscenzadeiconcettiedeimetodistatistici,siaperiproblemidigestionesiaperquellidiindagine.Perpubblicareirisultatidiunaricerca,tuttelerivistescientificherichiedonochelapresentazione dei dati e la loro elaborazione seguano criteri ritenuti validi universalmente.Ilcomportamentonellafasediraccoltadeidati,lalorodescrizione,leanalisieinfineilriepilogosono in buona parte codificati, in modo dettagliato. Inviare ad una rivista uno studio o una relazione chedenotino una conoscenza sommaria della statistica comporta generalmente una critica dei metodi seguiti,che pu giungere fino al rifiuto delle conclusioni o almeno a una dichiarazione esplicita della loro ridottaattendibilit. Al ricerca pu essere negata la dignit della pubblicazione.Unaraccoltadidatinoncorretta,unaloropresentazioneinadeguataounanalisistatisticanonappropriatarendonoimpossibilelaverificadeirisultatidapartedialtristudiosieilconfrontocon altre ricerche e analisi del settore. Per il progresso di qualsiasi disciplina sperimentale, una finalitimportantediqualsiasiricercaanchedipiccoledimensioni,lasemplicepossibilitdisommareleesperienze e confrontare i risultati con altre, effettuate in condizioni simili oppure volutamente differenti.Permettelaccumulodelleconoscenze,laverificaditeoriegiproposte,laformulazionedinuoveipotesi.Alfinedifacilitareailettorilacorrettacomprensionedeirisultati,perpubblicareunaricercalerivisteinternazionaliequelledimaggiorprestigiorichiedonotassativamenteagliautoridiseguireunoschemapreciso che, in linea di massima, fondato sullo sviluppo di quattro fasi.1)Unaintroduzione,chepresentiinmodoaccuratosial' argomentoaffrontato,sialefinalitdellaricerca, mediante citazione dei lavori scientifici pregressi e della letteratura specifica.22) La descrizione dimateriali e metodi, nella quale devono essere definiti:-(a) il tipo discala utilizzato;-(b) le modalit delcampionamento o di raccolta dei dati;-(c) le misure sintetiche delle caratteristiche pi importanti delladistribuzionedeidati,comemediaevarianza(piraramentesimmetria,curtosiecoefficientedivariazione);spesso,soprattuttoperargomentinuovioquandosianostatipubblicatisolopochidati,prassirichiedereladistribuzionetabellarecompletaedettagliata;perrelazioninonacaratteredivulgativo,letabelleeledistribuzionidi frequenze sono da preferire alle rappresentazioni grafiche, che raramente permettono di risalire aidati originari, indispensabili per la verifica dei calcoli e quindi delle conclusioni raggiunte.3)Irisultati,chedevonocomprendereespressamentelacitazionedeitestdiinferenzautilizzati,alloscopodipermettereallacomunitscientificadivalutareselalorosceltaappropriata,ciosesonoinrapporto corretto con-(a) le ipotesi che si intendono verificare,-(b) il tipo di scala con cui sono state misurate le variabili analizzate,-(c) le caratteristiche statistiche della distribuzione dei dati.4)Ladiscussione,chedeveriportarelinterpretazionedeirisultatiottenuticonitestapplicatieinfineeventuali confronti con analisi gi pubblicate. Linterpretazionedevenonsolocomprenderelanalisistatistica,maessereestesaalsignificatoecologico,ambientaleobiologicodeirisultatiottenuti.Non sempre un risultato statisticamente rilevante assume anche un significato importante nella disciplinaspecifica.Nederivaunaspettodiestremaimportanzaperlanalisistatistica:perimpostarecorrettamenteunaricerca,performulareipotesiscientificamentevalide,perraccogliereeanalizzareidati,infineperinterpretarneirisultati,nonpossibilescindereleanalisistatistichedalla loro interpretazione disciplinare.1.2. IL DISEGNO SPERIMENTALE, IL CAMPIONAMENTO E L'INFERENZAPer condurre in modo corretto una ricerca scientifica, cio per raccogliere un campione con un numerosufficientedidati,tenendoinconsiderazionesialecondizioniesistentinellapopolazione,sialasuccessiva applicazione dei test, occorre seguire alcuni passaggi metodologici, riassumibili in 4 fasi:-il disegno sperimentale,-il campionamento,-la descrizione statistica,-la scelta dei test per linferenza.31 - Ildisegnosperimentalenecessarioperscegliereeprogrammareleosservazioniinnaturaeleripetizioniinlaboratorio,infunzionedellaricercaedelleipotesiesplicative.Ginellaprimafasedellaricerca, chiamata con termine tecnico appunto disegno sperimentale (dallingleseexperimentaldesignetradottopicorrettamenteinitalianoconprogrammazionedellesperimento),occorreaverechiaralaformulazionedell'ipotesichesiintendeverificare.Raccogliereidatiprimadiaverchiaramenteespressolefinalitdellaricercaconducespessoadanalisinonadeguateequindiarisultatipocoattendibili.Conlaformulazionedellipotesi,sideverisponderealledomande:Leeventualidifferenzeriscontratetra due o pi gruppi di dati, oppure di una serie di osservazioni con quanto atteso, possono essereimputabili afattoricausalispecificiosolamenteafattoricasualiignoti?Ledifferenzeriscontratesonogeneratedallanaturalevariabilitdellemisureedelmaterialeutilizzatooppurepiprobabilmente esiste una causa specifica che le ha determinate?2 - Ilcampionamento permette di raccogliere i dati in funzione dello scopo della ricerca, rispettando lecaratteristiche della popolazione o universo dei dati.Uno deiproblemi fondamentali della statistica comeraccoglieresolamenteunnumerolimitatodi dati (per motivi economici, di tempo, di oggetti effettivamente disponibili, cio per limiti oggettivi chequasisempreesistonoinqualsiasiricercasperimentale),maattraversolaloroanalisipervenireugualmente a conclusioni generali, che possano essere estese a tutta la popolazione.3 - La descrizione delle caratteristiche statistichedellinsiemedeidatiraccoltidevepermettereatuttidiverificaresial'adeguatezzadeldisegnosperimentaleedelcampionamento,sialacorrettezzadelleanalisi attuate e dei risultati ottenuti.4-Itestdevonoesseregiprogrammatinellafasedeldisegnosperimentale,poichdaessichedipendeiltipodicampionamento.Iltestunprocessologico-matematicocheportaallaconclusionedinonpoterrespingereoppuredipoterrespingerel' ipotesidellacasualit,medianteilcalcolodiprobabilit specifiche di commettere un errore con queste affermazioni.Lipotesicheilrisultatoottenutoconidatisperimentaliraccoltisiadovutosoloalcasochiamataipotesinulla e indicata conH0.Dinorma,conessasiaffermacheledifferenzetradueopigruppi,quelletraungruppoeilvaloreattesooppureletendenzeriscontratesianoimputabiliessenzialmente al caso.Peresempio,confrontandoiltempodiguarigionetraduegruppidiammalatiaiqualisianostatisomministratiduefarmacidifferenti,conlipotesinullaH0sisostienecheilrisultatoottenutonon4dipendedaunaeffettivadifferenzatraidueprincipiattivi,macheessodovutoalcaso.SenellesperimentoilfarmacoArisultatomiglioredelfarmacoB,sesiaccettalipotesinullaimplicitamente si afferma che, con un nuovo esperimento nelle stesse condizioni, si potrebbe ottenere ilrisultato opposto.Pergiungereaquesteconclusionisidevericorrereallinferenza,chepuesseredefinitacomelacapacitditrarreconclusionigenerali(sullapopolazioneoduniverso)utilizzandosolounnumero limitato di dati variabili (campione).Il disegno sperimentale ed il campionamento sono le due fasi preliminari-sia alla raccolta dei dati in natura,-sia per una corretta impostazione degli esperimenti in laboratorio.Tuttavia,lapresentazionedidatticaelacorrettacomprensionediquestiargomentirichiedonoconcetticomplessiemetodologiesofisticate,nonsemprefacilinintuitivi.Perquestimotivi,ildisegnosperimentale e il campionamento sono sempre trattati nella fase finale di un corso di statistica applicata,quandogistataraggiuntasufficientefamiliaritconlaterminologia,coniconcettieimetodifondamentali dellinferenza.Nellapprendimentoenellusodellastatistica,ilprimopassocomprenderecomesolamenteunacorrettaapplicazionedelcampionamentoeunasceltaappropriatadeitestpermettanodirisponderealladomanda inferenziale di verifica dell' ipotesi nulla. Con essa si pone il seguente quesito:"Nell'ipotesicheledifferenzefragruppidiosservazioniempirichesianodovuteafattoriesclusivamente casuali, quale la probabilit che fra tutte le alternative possibili si presenti propriola situazione descritta dai dati raccolti o una ancora pi estrema?"Se tale probabilit risulta alta, convenzionalmente uguale o superiore al 5%, si imputeranno le differenzea fattori puramente casuali.Alcontrario,selaprobabilitrisultabassa,inferiorealvaloreprefissato,siaccettacomeverosimilechele differenze siano dovute a fattori non casuali, rientranti tra i criteri che distinguono i gruppi di dati.Laproceduradellinferenzastatisticasemplice,nellelineelogichegenerali.Tuttavia,leanalisieleconclusionitrovanocomplicazioniperlelevatavariabilitdeidati,amotivofondamentalmenteditre cause che, in ordine crescente dimportanza, sono:- glierrori di misurazione, generati da strumenti e da differenze nell'abilit dei ricercatori;-l' operaresucampioni,percuiidatiutilizzatiinunaricercanonsonomaiidenticiaquellirilevatiinqualsiasi altra;5- la presenza di varifattoricontingentididisturboche,comeiltempoelalocalit,possonoinciderediversamente sul fenomeno in osservazione, con intensit e direzioni ignote.Pure se espressi in modo sintetico, questi concetti definiscono ilcontenutodellastatisticamoderna:laraccolta,lapresentazioneelaelaborazionenumericadelleinformazioni,peragevolarel'analisidei dati ed i processi decisionali.Inuncorsocompletodistatisticaapplicata,importanteavereinognimomentounavisionecomplessivadegliargomenti.Illoroelencoutileanchepercomprenderelediversepartiincuivienedistinta la statistica, nel percorso di apprendimento dei concetti e delle procedure.La statistica moderna pu essere distinta in tre parti: descrittiva, matematica, inferenziale.1-Lastatisticadescrittivaspiegacomeidatiraccoltidevonoessereriportatiintabella,rappresentatiingraficiesintetizzatiinindicimatematici,alloscopodiindividuarelecaratteristichefondamentali del campione.2- Lastatisticamatematicapresentaledistribuzioniteorichesiapermisurediscretesiapermisurecontinue, allo scopo di illustrarne le caratteristiche fondamentali, le relazioni che esistono tra esse, gliusi possibili;3- Linferenza statistica, la parte nettamente prevalente del corso, serve per la verifica delle ipotesi.Essa pu essere distinta in vari capitoli, in rapporto-allecaratteristichedeidati(sepermettonoomenoilricorsoalladistribuzionenormale:statisticaparametricae non parametrica-al numero di variabili (se una, due o pi: statistica univariata, bivariata, multivariata).Laprimapartedellinferenza,disolitoaffrontatainuncorso,lastatisticaunivariataparametrica.Comeargomenti,essacomprendeiltesttdiStudenteiltestFdiFisher-Snedecoroanalisidellavarianza:-ilprimoservesiaperconfrontarelamediadiuncampioneconunamediaattesaoteorica,siaperconfrontare le medie di due campioni;-ilsecondorappresentalasuageneralizzazioneepermetteilconfrontosimultaneotrapimedie,considerando uno solo oppure pi fattori di variabilit.Appuntoperchfondatisulladistribuzionenormale,questitestrichiedonocondizionidivaliditrestrittive (discusse nei capitoli seguenti), che non sempre i dati raccolti e la misura utilizzata permettonodi rispettare.6Eunasituazionechesipresentaconfrequenzaelevatanellaricercaapplicata,acausadellaestremavariabilitdeidatiedellapresenzadivalorianomali.Inquestecondizionisiricorreallastatisticaunivariata non parametrica, che formata da una serie innumerevole di test.Dinormaessisonoraggruppatisullabasedeicampioniaiqualivieneapplicata:testperuncampione,per due campioni dipendenti e indipendenti, test per k campioni dipendenti e indipendenti.Quandoperogniindividuoosituazionesiraccolgonoinformazionirelativeaduevariabili,possibileanalizzarelerelazionicheintercorronotraesse,mediantesialaregressioneelacorrelazioneparametriche, sia la regressione e la correlazione non parametriche. Si parla allora distatisticabivariataparametrica e distatistica bivariata non parametrica.Quandoidatiraccoltisonorelativiapivariabili,sidevericorrereallastatisticamultivariata.Permolteanalisisolamenteparametrica.Pirecentementesonostatipropostimetodi,dettidiricampionamento, che sono definiti test di statistica non parametrica.Inquestocorso,verrannopresentatiimetodirelativiallastatisticaunivariata ebivariatasiaparametricachenonparametrica.Allafinesonopresentatiancheilbootstrapeiljackknife,testnonparametriciapplicabili sia distribuzioniunivariate, sia bivariate che multivariate.La serie completa degli argomenti ed il loro ordine sono riportati nella presentazione del corso.Questi concetti possono essere schematizzati in una tabella, che offre il vantaggio confrontare le finalitdei tre tipi di statistica7I - STATISTICA DESCRITTIVAa)Come si presentano i dati in tabelle e grafici.b)Indici sintetici che descrivono la distribuzione dei dati:tendenza centrale, variabilit, forma.II STATISTICA MATEMATICACalcolo delle probabilit. Distribuzioni teoriche:binomiale, poissoniana, ipergeometrica, normale, III STATISTICA INFERENZIALE(dedurre leggi generali, disponendo di un campione di dati variabili)a)Ipotesi parametriche (su media, varianza, ) e ipotesi funzionali (su tutta la distribuzione).b)Distribuzioni univariate, bivariate, multivariate.c)Statistica parametrica e non parametrica.d)Test per uno, due e pi campioni.La statistica inferenziale permette di trarre conclusioni su tutti i dati di una popolazione, quandose ne conoscono solamente pochi, raggruppati in uno o pi campioni.Si supponga di voler conoscere la velocit d'accrescimento somatico di una determinata specie animale ovegetale.Eovviochenonpossibilerintracciareemisuraretuttigliindividuidiquellaspecie,lapopolazioneoduniverso;senonaltroperiltempoelerisorsenecessari,oltrealsuocontinuorinnovamentopernasciteemorti.Epossibilesolamenteutilizzarealcuneunit,unafrazionelimitatissima della popolazione: in termini tecnici, un campione.Quando poi si trattasse di misurare rapporti tra organi di una specie animale, ovvio che non possibilesezionare tutti gli individui della specie. Nello stesso modo, per contare i globuli rossi o quelli bianchi diunapersona,nonpossibileestrarretuttoilsangueperunconteggiototale,masieffettuaunprelievolimitato a pochi centimetri cubici.8LA PROCEDURA PER UNTEST DINFERENZADalCampione variabile allUniversoLa logica o filosofia scientifica per la scoperta delle leggi della naturaI IPOTESIIpotesi nulla, ipotesi alternativaII - RACCOLTA DEI DATITipo di scala; caratteristiche della distribuzione dei datiIII - SCELTA DEL TESTSulla base dell'ipotesi, del tipo di scala e delle caratteristiche dei datiIV - RISULTATO DEL TEST- PROBABILITA'Probabilit di ottenere quel risultato, nella condizione espressa dall'ipotesi nullaV DECISIONE - SCELTA TRA LE DUE IPOTESIProbabilit VI ANALISI DEL TEST E DEI DATI PER UN NUOVO ESPERIMENTOPotenza a posteriori e a priori, probabilit Tuttavialeconclusioninondevonoesserelimitateaipochi(oanchemolti)casirealmenteraccolti, misurati ed analizzati; ma devono essere generali, estese a tutti gli individui della specie o atutto lorganismo.Ricoprono effettivo interesse non le conclusioni che restano limitate al caso del campione, ai datiutilizzati,maquellechesonoesteseatuttalapopolazioneouniverso.Soloinquestomodo,laricerca riveste una importanza generale e contribuisce alla costruzione di teorie scientifiche, di modelli osemplicemente di ipotesi che possono essere universalmente validi.Unacondizioneessenzialeepreliminareallusodeimetodidistatisticainferenzialecheilcampionesiacorretto,chenonriportiinmododistortoodalteratolafrequenzadellecaratteristichepresenti nella popolazione.9Loschemaprecedenteelencaivaripassaggilogicichesononecessari.Nellosvolgimentodelprogramma, saranno descritti dettagliatamente in tutte le loro fasi.1.3. TIPI DI DATI E SCALE DI MISURAZIONENellanalisistatistica,occorreporresempremoltaattenzioneallecaratteristichedeidati.Gilafasedellesperimentocheconduceallaraccoltadelleinformazioniunpuntofondamentale,poichdaessadipendono sia i metodi di descrizione, sia i test da applicare.Schematicamente, esistonoduetipidivariabilicasuali,allequalisonoassociatiduetipididati:levariabili qualitative e le variabili quantitative.Levariabiliqualitativeocategorialisonoquantificateconconteggi,ossiaconnumeriinteriediscreti.Adesempio,pervalutareglieffettidiuntossicopossibilecontarequantecaviemuoionoosopravvivono;conunfarmaco,quantipazientiguarisconoorestanoammalati,entrountempoprefissato; con esperimenti sulle leggi di Mendel, quante piante hanno fiori rossi o bianchi.Levariabiliquantitativerichiedonorispostenumeriche,espressesuunascalacontinua.Adesempio,perunanalisideldimorfismoanimale,dopolaseparazioneinmaschiefemmine,sipossonomisurare il peso e laltezza di ogni individuo.Idatichesiraccolgonoperanalisistatistichepossonoquindiesserediscretiocontinui.Questasuddivisione,ormaistoricanellapresentazioneedelaborazionedeidati,stataresapichiaraefunzionaledallaclassificazionedellescaledimisurazionepropostadallopsicologoS.S.Stevensnel1946,(vedilarticoloOnthetheoryofscalesofmeasurement,pubblicatosuScience,vol.103,pp.:677-680).Taleclassificazionestataaggiornatanel1951conleoperazionistatisticheammissibili e in seguitodivulgata da S.Siegel,nelsuomanuale"Statisticanonparametrica"del1956. Una presentazione ampia e dettagliata pu essere trovata pure nellultima edizione del testo diS.Siegel e N. J. Castellan del 1988 (NonparametricStatisticsfortheBehavioralSciences,2nded.,McGraw Hill, New York), tradotto anche in italiano.Le misure possono essere raggruppate in 4 tipi di scale, che godono di propriet formali differenti; diconseguenza,esseammettonooperazionidifferenti.Comepertuttelediscipline,unascaladimisurazione dei fenomeni biologici ed ambientali pu essere:1) nominale o classificatoria;2) ordinale o per ranghi;3) ad intervalli;4) dirapporti.101.3.1.Lascalanominale oclassificatoriaillivellopibassodimisurazione.Eutilizzataquandoirisultatipossonoessereclassificatioraggruppatiincategoriequalitative,detteanchenominaliedeventualmenteidentificateconsimboli.Icaratterinominali,dettianchesconnessi,costituisconovariabili le cui modalit o attributi non assumono alcun ordine precostituito. In una popolazione animalesipossonodistingueregliindividuiinmaschiefemmine,contandoquantiappartengonoaiduegruppi;con una classificazione a pi voci, possono essere suddivisi e contati secondo la loro specie.Nellascalanominaleoqualitativa,esisteunasolarelazione,quelladiidentit:gliindividuiattribuitiaclassidiversesonotralorodifferenti,mentretuttiquellidellastessaclassesonotraloro equivalenti, rispetto alla propriet utilizzata nella classificazione.Uncasoparticolarequellodeicaratteridicotomicichepossonoassumeresoloduemodalit,spessoindicate in modo convenzionale con 0 e 1 oppure + (pi) e (meno).L'attribuzione di numeri per identificare categorie nominali, come avviene per individuare i giocatori neigiochi di squadra, solamente un artificio che non pu certamente autorizzare ad elaborare quei numericomesefosseroreali,adesempiocalcolandonelamedia.Quandoperlaclassificazionedeigruppialposto di nomi vengono usati numeri, si utilizza solo la funzione di identificazione degli elementi numericicome se fossero simboli; ma con tale trasformazione non si determina una informazione differente dallaprecedente o ad essa aggiuntiva.Loperazione ammessa ilconteggio degli individui o dei dati presenti in ogni categoria.Iquesitistatisticichepossonoessereposticorrettamenteriguardanolefrequenze,siaassolutecherelative.Sonopossibiliconfrontitrafrequenzeosservate(es.:"Unaclassesignificativamentepinumerosadellaltra?Levarieclassihannotuttelostessonumerodiindividui,escludendolevariazionicasuali?")oppure tra le frequenze osservate e le rispettive frequenze attese sulla base di leggi biologiche, ipotesi odaltro(es.:"IrisultatiottenutidaunesperimentosulleleggidiMendelsonoinaccordoconlasuadistribuzione teorica?").1.3.2.Lascalaordinaleoperranghirappresentaunamisurazionechecontieneunaquantitdiinformazioneimmediatamentesuperioreaquellanominale;essaassumemodalitlogicamentesequenziali, non importa se in ordine crescente o decrescente.Allaproprietprecedentediequivalenzatragliindividuidellastessaclasse,siaggiungeunagradazione tra le classi o tra individui di classi differenti.Conlaprecedentescalanominale,sihalasolainformazionechegliindividuiappartenentiagruppidifferentisonotralorodiversi,manonpossibilestabilireunordine.Conlascalaperranghi,le11differenticlassipossonoessereordinatesullabasedellintensitdelfenomeno.(es.:Sisuppongacheilrisultatodiunreagentesiadicolorareinverdeunaseriediprovette,secondolaquantitdisostanzacontenuta.Epossibilemettereinordineleprovettesecondol'intensitdelcolore,peravereunastimaapprossimatadellaquantitdisostanzacontenuta.Sesiconfrontanotreopiprovetteconintensitdicoloredifferente,facilestabilirnel'ordine;rimaneimpossibilemisurareadocchiolaquantitdicoloredi ognuna e la differenza esistente tra esse).Questamisurahaunlimitefondamentale.Inunascalaordinale,nonpossibilequantificareledifferenze di intensit tra le osservazioni.Alcunerisposte,apparentementedefinitealivelloqualitativoonominale,inrealtpossonocontenereunascalaordinaleodirango,seppureconmolteripetizioni.Eilcasodellasuddivisioneingiovane,adultoedanzianoperl'et;oppuredellaclassificazioneininsufficiente,sufficiente,discreto,buonoedottimo in valutazioni di merito.Forniscono linformazione di una scala ordinale anche- misure che sono rappresentate con simboli, come --,-,=,+,++.- raggruppamenti convenzionali o soggettiviin classi di frequenza variabili come0,1-2,3-10,11-50, 51-100,101-1.000,>1.000Restalimpossibilitdivalutarequantosialadistanzatrainsufficienteesufficiente;oppureseessasiainferiore o superiore alla distanza tra buono ed ottimo.Lascalaordinaleoperranghipertantounascalamonotonica.Allevariabilicosmisuratepossibileapplicareunaserieditestnonparametrici;manonquelliparametrici.Inquesticasi,nonsarebbepossibileutilizzarequeitestchefannoriferimentoalladistribuzionenormale,icuiparametriessenziali sono la media e la varianza, poich non si possono definire le distanze tra i valori.Tuttaviaquestaindicazionedimassimasullautilizzazionedellastatisticanonparametricaspessosuperatadall'osservazionechevariabilidiscreteonominalitendonoadistribuirsiinmodoapprossimativamente normale, quando il numero di dati sufficientemente elevato. Per coloro che sononellafaseinizialedelleapplicazionistatistiche,permanesempremoltaincertezzasullasceltadeitestpiappropriati;infattipermaneunampiavarietdiopinionisuquandoilnumerodiosservazionisiasufficientemente elevato, per ottenere una distribuzione normale. Nel seguito del corso, largomento sardiscusso in molte situazioni reali, a chiarimento dei criteri di scelta dei test.1.3.3.La scala ad intervalli aggiunge la propriet dimisurareledistanzeodifferenzetratuttelecoppie di valori.Lascaladiintervallisifondasuunamisuraoggettivaecostante,ancheseilpuntodiorigineel'unitdimisurasonoarbitrari.Esempiclassicidiscaleadintervallisonolatemperatura12(misurata in gradiCelsiusoFahrenheit,manonKelvin)ediltempo(misuratosecondocalendaridifferenti).Valoriditemperatura,oltreapoteresserefacilmenteordinatisecondolintensitdelfenomeno,godonodellaproprietcheledifferenzetralorosonodirettamenteconfrontabiliequantificabili;ledatediqualsiasicalendario,nonimportasegregoriano,islamico,ebraicoocinese,possonoesseretraloroordinatedallapianticaaquellapirecenteeledifferenzetemporalisonomisurate con precisione oggettiva.Malascalaadintervallihaunlimite,nongodediun'altraproprietimportantenellaelaborazionestatistica dei dati, quella del rapporto tra coppie di misureAdesempio,unatemperaturadi80gradiCelsiusnonildoppiodiunadi40gradi.Seunapersonaponesse la mano destra in una bacinella con acqua a 80 gradi e la mano sinistra in unaltra con acqua a10gradi,nondirebbecertamentechelaprimascotta8voltepidellaseconda,masolochelaprimamolto calda e la seconda fredda.In una scala ad intervalli, solo le differenze tra i valori sono quantit continue ed isomorficheallastruttura dell'aritmetica. Solo per le differenze sono permesse tutte le operazioni:possonoesseretralorosommate,elevateapotenzaoppuredivise,determinandolequantitchestannoallabasedellastatistica parametrica.Da una scala dintervalli possibile scendere ad una scala di ranghi (es.: utilizzando solo linformazionedellordine dei valori) oppure ad una scala nominale (es.: suddividendo le misure in alte e basse, sopra osottounvaloreprefissato).Pertanto,lascaladintervalligodeanchedelleproprietdefiniteperleduescale precedenti.Nellapresentazionedeitestnonparametriciverrannodiscusselesituazioniincui,avendodatimisuratisuscaledintervalliodirapporti,convenientescendereneltipodiscalaseppureconunaperdita dinformazione.1.3.4.Lascaladirapportihailvantaggiodiavereunoriginereale.Sonotipichescaledirapportil'altezza, la distanza, la velocit, l'et, il peso, il reddito, la temperatura in gradiKelvin;piingenerale,tutte quelle misure in cui0 (zero) significa quantit nulla.Non solo le differenze, maglistessivaloripossonoesseremoltiplicatiodivisiperquantitcostanti,senza che l'informazione di maggiore importanza, il rapporto tra essi, ne risulti alterata.Alle variabili misurate con unascaladirapporti,iltipodimisurazionepisofisticatoecompleto,puessereapplicatoqualsiasiteststatistico.Possonoessereutilizzatianchelamediageometricaedilcoefficiente di variazione, i quali richiedono che il punto 0 (zero) sia reale e non convenzionale.Pureconunascaladirapportipossibilescenderenellascaladimisurazione,trasformandolainunascaladirangooaddiritturaqualitativa.Ovviamente,sihaunaperditaancorpirilevantedellaquantit13dinformazione,cheessafornisce;diconseguenza,rappresentaunoperazionechedeveessereevitata,quando non imposta da altre condizioni dellanalisi statistica o dalle caratteristiche della distribuzione deidati.Riassumendo i concetti fondamentali esposti,- nella scala nominale, esistono solo relazioni diequivalenza;- in quella ordinale, alla precedente si aggiungono relazioni diminore o maggiore di;-inquellaadintervallialledueprecedentisiaggiungelarelazionedirapportotraognicoppiadintervalli;-nellascaladirapportisihaanchelaquartarelazionedirapportoconosciutotraognicoppiadivalori.Come sar pi volte discusso nei prossimi capitoli, anche nella ricerca e nella gestione ambientali occorreporreestremaattenzionealrealesignificatodaattribuireaivalorinumericichevengonoutilizzati. Si possono avere numeri che apparentemente hanno le stesse caratteristiche, ma che in realtrichiedonoelaborazionidiverseedimpongonoilricorsoatestdifferenti,perrispondereaimedesimiquesiti.Peresempio,igrammidiunadeterminatasostanzainquinantescioltainunlitrodacqua,lapercentualediquestasostanzasulpesocomplessivo,ilpunteggiodellaqualitdellacquadeterminatadalla presenza di quella sostanza sono misure che utilizzano scale diverse.-Nelprimocaso,sihaunaclassicascaladirapportiedpossibileusaretestparametrici,seladistribuzione dei dati normale;-nelsecondocaso,possibileutilizzarelestesseprocedurestatisticheeglistessitestparametrici,solamente dopo apposita trasformazione dei valori;-nel terzo, si ha una scala di ranghi, poich la reale informazione fornita da questa serie di punteggi solo quella di una graduatoria della qualit, nella quale non hanno reale significato n i rapporti n ledifferenze tra loro.1.4. CLASSIFICAZIONE IN TABELLEUn insieme di misure detto serie statistica o serie dei dati. Quando la serie non ordinata, si ha uninsieme disordinato di numeri che non evidenzia le caratteristiche fondamentali del fenomeno.Una sua prima ed elementare elaborazione pu essere una distribuzione ordinata di tutti i valori, in modocrescente o decrescente, detta seriazione.Il valore minimo e ilvalore massimo insieme permettono di individuare immediatamente ilcampo(odintervallo) di variazione.Successivamente,laseriepuessereraggruppatainclassi,contandoquantivaloriodunitstatisticheappartengono ad ogni gruppo o categoria.14Si ottiene una distribuzione di frequenza o di intensit, detta anche semplicemente distribuzione.Comeprimaapplicazione,utileconsiderareuncasosemplice:unavariabilediscretaottenutadaunconteggio del numero di foglie, germogliate su 45 rami di lunghezza uguale.Tabella 1. Numero di foglie contate su 45 rami.5 6 3 4 7 2 3 2 3 2 6 4 3 9 32 0 3 3 4 6 5 4 2 3 6 7 3 4 25 1 3 4 3 7 0 2 1 3 1 5 0 4 5Il primo passaggio, quasi intuitivo in una distribuzione discreta, consiste neldefinire le classi:- sufficiente identificare ilvalore minimo (0, nei dati della tabella) e quello massimo (9),-contandoquantevoltecompareognimodalitdiespressione(cioquantisonoiramiconunnumero di foglie uguali).Queste informazioni di norma sono presentate in una tabella impostata come la seguente:Tabella 2. Distribuzione di frequenze assolute e relative delle foglie in 45 rami.Classe x 0123456789freq.assoluta n 337 12754301freq.relativa f 0,070,070,150,270,150,110,090,070,000,02freq. cumulata 0,070,140,290,560,710,820,910,980,981,00in cui:-la classe una modalit di espressione (in questo caso un valore o conteggio);-la frequenza assoluta della classe il numero di volte con la quale compare ogni valore;-lafrequenza relativa della classe la sua frequenza assoluta divisa per il numero totale;-lafrequenzacumulatadiunaclasse(chepuesserestimataconquelleassolutee/oconquellerelative) la somma di tutte le frequenze delle classi minori con quella della classe stessa.15La trasformazione da frequenza assoluta a frequenza relativa risulta utile quando si vogliono confrontaredue o pi distribuzioni, che hanno un differente numero complessivo di osservazioni.Lafrequenzacumulataoffreinformazioniimportantiquandosiintendestimareilnumerototalediosservazioni inferiore (o superiore) ad un valore prefissato (ad es.: il 71% dei rami ha meno di 5 foglie; il56% ha un massimo di 3 foglie).Ladistribuzionedeidatieladistribuzionedellefrequenzecumulatefornisconoinformazioninondissimili,essendopossibilepassareconfacilitdallunaallaltra.Sonodiversenellaloroforma,comesivedrconmaggioreevidenzanellerappresentazionigrafiche.Laprimahaunaformaacampana,lasecondaunaformaaS,ditipoasintotico;siprestanoadanalisidifferentielasceltafattasullabase del loro uso statistico.Ladistribuzionedifrequenzaoffreunaletturarapidadellecaratteristichepiimportantidellaserie di dati. Nella tabella precedente, il ramo tipico ha 3 foglie; se dovessimo sintetizzare con un solovaloreilnumerodifogliepresentisuiramiraccoltidiremmo3,cherappresentalatendenzacentrale.Altra caratteristica importante il numero minimo e il numero massimo, 0 e 9, che insieme forniscono ilcampodivariazione,unaindicazionedellavariabilitodispersione.Ladistribuzionedelnumerodifoglie tende ad diminuire in modo simile allontanandosi da 3, seppure mantenga frequenze pi alte nelleclassiconunnumeromaggioredifoglie:sonoindicazionisullaformadelladistribuzione,cheinquestoesempiononsimmetrica(maasimmetrica)rispettoallatendenzacentrale,acausadiuneccessodeivalori pi alti.Nellacostruzioneditabellesintetiche(comelatabella2rispettoalla1)unodeiproblemipirilevantiquanteclassidifrequenzacostruire.LasceltadipendestrettamentedalnumerototaleNdiosservazioni e, in misura minore, dalla variabilit dei dati.Se,inriferimentoalladimostrazioneprecedente,idatifosserostatiinnumeroinferioreai45presentati(ad esempio i 15 valori della prima riga), il campo di variazione sarebbe stato pi ridotto (non pi da 0 a9,mada2a9).Leclassinonsarebberostate10comeprima,masolamente8.Tuttavia,comesipuosservare dai dati, 8 classi per 15 osservazioni sarebbero ugualmente un numero troppo alto, per riuscireadevidenziareerappresentareinmodocorrettolecaratteristicheprincipalielaformarealedelladistribuzione.Ledistribuzionidifrequenzatendonoamostrareladistribuzionerealedelfenomenosoloquando possibile utilizzare un numero sufficientemente elevato di osservazioni.16Lesperienza ha insegnato che il numero di classi abitualmente varia da un minimo di 4-5 (con N=10-15)adunmassimodi15-20(conN>100),infunzionedelnumerocomplessivodiosservazioni.Unnumerotroppobassodiclassi,raggruppandoeccessivamenteidati,determinaunaperditadiinformazionesullecaratteristichedelladistribuzioneelarendenonsignificativa;intuitivocheunaoduesoleclassideterminanolimpossibilitdievidenziarequalunquecaratteristicadelladistribuzione.Inversamente,maconunrisultatofinalesimile,unnumerotroppoelevatodiclassidisperdeivalorienon rende manifesta la forma della distribuzione.Perstimareinmodooggettivoilnumerodiclassi,sonostatipropostivarimetodi;traessiutilericordarne due:1 - quello diH.Sturges che nel 1926, sulla base del numero di osservazioniN, ha indicato ilnumeroottimale di classi CconC N + 110310log ( )2 - quello diD.Scottchenel1979hadeterminatolampiezzaottimalehdelleclassi(dallaqualeovviamente dipende direttamente anche il numero di classi C), mediante la relazionehsN 3 5 ,dove- s la deviazione standard,che sar presentata pi avantitra le misure di variabilit dei dati.Nella costruzione di distribuzioni di frequenza, non strettamente obbligatorio utilizzare intervalli uguali,ancheseprassiconsolidataperunaletturapisemplice.Nelcasodiclassidiampiezzadiversa,larappresentazione grafica ed il calcolo dei parametri fondamentali esigono alcune avvertenze, non sempreintuitive (di seguito presentate).Nelcasodiunavariabilecontinua,ilraggruppamentoinclassirichiedealcuniaccorgimentiulterioririspetto a quelli utilizzati per una variabile discreta. Si supponga che sia stata misurata laltezza in cm. di40 giovani piante della stessa specie, arrotondata allunit per semplificazione.17Tabella 3. Altezza in cm. di 40 giovani piante.107 83 100 128 143 127 117 125 64 11998 111 119 130 170 143 156 126 113 127130 120 108 95 192 124 129 143 198 131163 152 104 119 161 178 135 146 158 176E evidente come non sia conveniente fare una classe per ogni cm., in analogia a quanto fatto con i datidellatabella1.Inquestocaso,ilnumerodimodalitsarebbenettamentesuperiorealnumerodiosservazioni, anche se il campione avesse un numero di osservazioni doppio o triplo. Di conseguenza, siimpone la necessit di un raggruppamento in classi, che comprendano pi modalit di espressione.Una volta individuato il valore minimo e quello massimo (64 e 198), si stabilisce l'intervallo di variazione(198 - 64 = 134). Nella formazione delle classi, il limite inferiore della prima classe ed il limite superioredellultimaclassenondevonoesserenecessariamenteivaloriosservati,malidevonoovviamentecomprendere.Equindipossibilecostruireuncampodivariazione,adesempiodi140cm.(semprepiampiodiquellocalcolato),partendodacm.60earrivandoacm.199compresi.Sullabasedelnumerodi dati (40), si decide il numero di classi. Nel caso specifico, potrebbero essere 7 classi, con unampiezzadi 20 cm. ognuna.Enecessariodefinireconprecisioneilvaloreminimoequellomassimodiogniclasse,ondeevitareincertezzenell'attribuzionediunsingolodatotradueclassicontigue.Conidatidellesempio,leclassipossonoessere60-79laprima,80-99laseconda,100-119laterzaecosviafinoa180-199perlultima.E da evitare la suddivisioni in classi come 60-80, 80-100, 100-120, Poich la scala continua, i cm. riportati devono essere intesi con almeno 2 cifre decimali, per cui nellaclasse60-79ilprimonumerodeveessereintesocome60,00cm.e79come79,99;nellostessomodola classe 180-199 deve essere intesa tra i cm. 180,00 e 199,99.Nonostanteleindicazionidimassimapresentate,ladeterminazionedeivaloriestremi,delnumerodiclassi e dell'intervallo di ogni classe ampiamente soggettiva. Nella costruzione di una tabella,lasceltasoggettivadiunaparticolareserieodiun'altraputradursiinunarappresentazionecompletamentediversadeglistessidati.Perpiccolicampioni,l'alterazioneeledifferenzepossonoesseresensibili;maall'aumentaredelnumerodiosservazioni,glieffettidellesceltesoggettive,quando18nonsianoestreme,incidonosempremenosullaconcentrazionedeivaloriesullaformadelladistribuzione.Tralealtreavvertenzeimportanti,daricordarechelaclasseinizialeequellaterminalenondevonoessereclassiaperte(come 0,se la curva ha asimmetria positiva (o destra : media > mediana > moda); d < 0,se la curva ha asimmetria negativa (o sinistra : media < mediana < moda).5700.050.10.150 6 12 18 24MEDIAMEDIANAMODA00.050.10.150 6 12 18 24MODAMEDIANAMEDIAFigura 21.Asimmetria destra o positiva (d>0)Figura 22.Asimmetria sinistra o negativa(d 0-unilaterale sinistraH0: 0 contro H1: < 0dove- il valore del parametro nel campione estratto dalla popolazione studiata- 0 il valore delleffetto teorico atteso o prescelto come confronto.SecondoFisher,nontutteleipotesipossonoesseresceltecomeipotesialternative:devonoesseresceltesullabasedeltestedelleconoscenzeacquisiteprimadellesperimento(adesempio,dinormailconfronto tra leffetto di un farmaco e quello del placebo richiede unipotesi unilaterale).Mediante il ricorso ai test, nel capitolo precedente si sempre pervenuti alla stima di una probabilitcomplessiva,checorrispondeaquelladiotteneredifferenzeugualiosuperioriaquellesperimentalmenteriscontrate,nellipotesicheiduecampioniaconfrontofosseroestrattidallastessapopolazione.Quandolaprobabilitrisultatainferioreaquellaprescelta,siconclusocheesisteva una differenza statisticamente significativa.Perunacorrettacomprensionedeiconcettiutilizzatiinstatistica,importanteevidenziareche,accettandoquestaconclusione,possibilecommettereunerrore:ladifferenzariscontratanellesperimentoinrealtpotrebbenonesistere.Tuttavia,laconclusioneugualmentecorretta,poichconiltestnonsipervieneadunaaffermazioneassoluta,maadunaprobabilitconosciuta di poter commettere un errore.Questi concetti possono essere ulteriormente approfonditi in modo chiaro e semplice, con due esempi.Come primo caso, si supponga che un giocatore utilizzi una moneta perfettamente bilanciata, ma dicuieglinonconoscalecaratteristiche.Mediantealcunilanci,eglidevedecidereselamonetabilanciata(H0)oppuretruccata(H1).Sisuppongaquindicheeglilanciquestamoneta6volteecheottenga croce tutte le volte.Se il giocatore fosse uno statistico ragionerebbe in questo modo: "Avere questa risposta di 6 croci su 6lanci un evento raro; pi esattamente ha una probabilit di 0,56 = 0,0156 o 1,56%, se la moneta nonfosse truccata (H0 vera). Con una ipotesi bilaterale e quindi comprendendo anche la possibilit di avere6 volte testa, la probabilit esattamente uguale a 3,12%. Quindi, ottenere 6 volte testa oppure 6 voltecroce sono eventi complessivamente poco probabili, seppure possibili". Se egli avesse prefissato comevaloresoglialaprobabilitdel5%,conquestoteststatisticorifiuterebbelipotesinulla.Giungerebbe266allaconclusionechetraatteso(3voltetestee3voltecrocesu6lanci)edosservato(6voltecroceoppurel'opposto)esisteunadifferenzasignificativaechepertantolamonetatruccata;manoisappiamo che in realt essa non la .E un errore, che in statistica si chiamaerrorediItipo(scrittospessoconl'inizialemaiuscolaTipo;in altri testi, diprima specie):consiste nel rifiutare lipotesi nulla H0, quando in realt essa vera.Si supponga ora, come secondo caso, che sempre allinsaputa del giocatore questa volta la monetasiatruccataediasolocroce.Sequestavoltaeglilalanciasolo3volte,ovviamenteotterrebbe3voltecroce.Inquestocaso,sefosseunostatisticoseguirebbequestoragionamento:"Selamonetanonfossetruccata (H0 vera), la probabilit di trovare per caso 3 volte croce alta, pi esattamente uguale a 0,53=0,125o12,5%".Conuntestbilateralelaprobabilit0,25.Pertanto,eglinonrifiuterebbelipotesinulla. Errando, arriverebbe alla conclusione che la moneta non truccata.In questo caso, si ha lerrore di II tipo (o seconda specie):consiste nel non rifiutare l'ipotesi (o accettare) nulla H0, quando in realt essa falsa.In statistica non possibile eliminare questi due tipi di errore. E possibile solamente ridurre laloro frequenza al minimo e conoscere con precisione la probabilit con la quale avvengono.Solo conoscendo la probabilit di sbagliare, possibile scegliere in modo corretto.Lastatisticalascienzachepermettediscegliereeprenderedecisioninonperchimmunedaerrori, ma perch fornisce la probabilit di errare, associata ad ogni scelta; quindi di conoscereil rischio che si corre, se la scelta si dimostrasse errata.4.2. PROCEDURA DI VERIFICA DELLE IPOTESI. VERO O FALSO ?UTILE O DANNOSO ?Perevidenziareconuntestleffettodiuntrattamento,nelcontrollodiunipotesistatisticapossibile commettere due tipi di errore:- l' errore di primo tipo o errore (alfa), se si rifiuta l'ipotesi nulla quando in realt essa vera;- l' errore di secondo tipo o errore(beta), se si accetta l'ipotesi nulla, quando in realt essa falsa.La probabilit di commettere lerrore di I tipo chiamata livello di significativit ed indicataconvenzionalmente con(alfa);essacorrispondeallaprobabilitcheilvalorecampionariodellindice statistico cada nella zona di rifiuto, quando lipotesi nulla vera.267LaprobabilitdicommetterelerrorediIItipo,indicatoconvenzionalmentecon,laprobabilitdiestrarredallapopolazioneuncampionechenonpermettedirifiutarelipotesinulla, quando in realt essa falsa.Da questi concetti derivano direttamente anche quelli di livello diprotezione e dipotenzadiuntest,chesonoiparametripiimportantiperscegliereiltestpiadattoallecaratteristichedeidatiealquesito. Sono concetti tra loro legati, secondo lo schema riportato nella tabella seguente, che confrontala realt con la conclusione del testREALT'H vera0H falsa0CONCLUSIONEDELH vera0(statisticamentenon significativo)EsattoP = 1-ProtezioneErrore II tipoP = TESTH falsa0(statisticamentesignificativo)Errore I tipoP = SignificativitEsattoP = 1-PotenzaUn test statistico conduce ad una conclusione esatta in due casi:-se non rifiuta lipotesi nulla, quando in realt vera;-se rifiuta lipotesi nulla, quando in realt falsa.Per aumentare la probabilit (1-) del primo caso, occorre incrementare la protezione;per quella (1-) del secondo caso, occorre aumentare la potenza.Esiste una sorta di concorrenza tra errori di primo tipo ()ederroridisecondotipo():sesiabbassaillivellodisignificativit,ciolaprobabilitdicommettereerroridiItipo(),siaccresce quella dell'errore di II tipo (); e viceversa.Si tratta di vedere quale dei due pi dannoso nella scelta che si deve effettuare.Lunicomodoperridurlientrambiquellodiaumentareilnumerodeidati.Tuttavianonsemprepossibileampliareledimensionidelcampione,perchgiraccoltooppureperchicostiediltemponecessaridiventano eccessivi, per le disponibilit reali del ricercatore.268Per linferenza statistica sono stati proposti due approcci, quello classico e quello decisionale.La soluzione adottata nellapproccio classico allinferenza statistica consiste:1)nelfissaredapprimaunlivellodisignificativitconvenientebasso,percontenereentroillimiteprescelto la probabilit di commettere errori di I tipo;2)successivamente nel scegliere la zona di rifiuto, in modo che sia minimo.Pertanto, nellapproccio classico si tenta di ridurre soprattutto lerrore di I tipo.Lapproccioclassicoallinferenzastatistica,cosdettoperchstoricamentehaprecedutoglialtri(lapprocciodecisionaleequellobayesiano),quellopinotoedapplicato.Fariferimentoallaconcezionefrequentistadellaprobabilitedrivoltoallapuraconoscenza,allaesclusivafinalitscientifica di accettare o respingere un modello teorico. Non considera le iniziative che possono essereintraprese o le scelte da attuare, in seguito alle conclusioni raggiunte. E tipico della ricerca pura, comepu essere quella biologica ed ecologica, quando evidenzia leggi o regolarit (come quelle di Mendel oladistribuzionegeograficadiunaspecieanimale)perlequalinonesistealcunvantaggioodannoderivante da unazione successiva alla scelta dellipotesi H0 oppure H1.Nellapproccioclassico,linferenzafondatasulprincipiodiripetizionedelcampionamento,percuiidatisperimentaliraccoltiinnaturaoprodottiinlaboratoriosonosolamenteunodegliinfinitipossibilicampioni,cheteoricamentesiottengonoripetendoloperazioneinfinitevoltenellestessecondizioni.Linferenzaottenutanonconsiderasoloilcampioneraccolto,matuttiipossibilidaticheteoricamente potrebbero essere ottenuti ripetendo lesperimento.Nellapproccio decisionale, si prendono in considerazione anche le conseguenze derivanti dagli errorie si cerca di valutare le perdite, determinate da eventuali decisioni sbagliate.Lapprocciodecisionale,propostoperlaprimavoltainmodocompletodaWaldnel1950,intendefornire metodi per decidere in situazioni dincertezza:il concetto di base la perdita o il rischio chederivano da una decisione, se successivamente essa si rivelasse errata.Lapproccio decisionale ha finalit operative: la conclusione non solo pu essere corretta od errata, mapu avere conseguenze pi o meno costose, se a posteriori si rivelasse sbagliata. Per lambientalista, frequentelasituazioneincuisidevonodecidereinterventi,senzasapereinanticipoconprecisionequali possono esserne le conseguenze (es.: nuove norme sulle discariche in un lago, che possono avereconseguenzenegativeperaltriaspetti,comequellieconomici,sulleaziendevicine;lasospensionedeltrafficoperabbassareitassidinquinamentoatmosferico,chepususcitareirritazionenellacittadinanzaequindilaperditadiconsensiallamministrazione).Ladiffusionedellascienzaapplicatadetermina unimportanza crescente della teoria delle decisioni.269Ladifferenzatraapproccioclassicoeapprocciodecisionalepiscolasticachereale.Daunaparte,semprepispesso,laconoscenzascientificasuccessivamentetradottainapplicazioni,chedanno risultati economici (come i principi della selezione genetica applicati a piante da frutto oppure aanimalidomestici);dallaltra,avolteledecisioniamministrativeimplicanorischiperlavitaolasalutedellepersoneoppuredannipermanentiallambiente,chenonpossonoesseretradottiinvaloreeconomico (come uneventuale dispersione territoriale di sostanze radioattive, che pu incrementare lafrequenza di tumori e di decessi).Lapprocciodecisionalehaapplicazionidiestremautilitquandoleconseguenzedellesceltepossonoesseretradotteinconseguenzeeconomiche,senoninmodoprecisoalmenoconbuonaapprossimazione. Ma la teoria delle decisioni esula dagli argomenti affrontati in questo corso.Conunapresentazionedeiconcettiprecedentipiformaleemenodiscorsiva,utileallapprendimentodel linguaggio scientifico, si pu affermare che il controllo statistico delle ipotesi ammette una pluralitdi procedure, che differiscono sotto il profilologico-metodologico.Inquestocorso,sifariferimentoaquelle che trovano le loro premesse- nella teoria della significativit e- nella teoria dei test.Sonoprocedurediversenellaimpostazioneteoricaelogica;ma,sottoparticolaricondizioni,convergono tecnicamente.Nellateoriadellasignificativit,dovutaprevalentementeaR.A.Fisher,ilcontrollo,sullabasediuna generico test, attiene ad una sola ipotesi detta ipotesi nulla (dallinglesenullhypothesis)indicataconH0. Essa configuralacompletaaccidentalitdellesitocampionario:ipotizzachetaleesitosiagiustificabileneiterminidellerroredicampionamentodauninsiemepivasto,dettapopolazioneouniverso.Inquestocontesto,siconvienediritenerefalsa(quindidirifiutare)lipotesiH0quandoleventochesiverificato(edeventipiestremidiesso)ha,sottoquellaipotesi,unaprobabilitdiaccadimentoinferioreaunlivelloprefissato(dettolivellodisignificativit).Noncerto che lipotesi nulla sia falsa; ma ad essa associata una probabilit di errore non superiore ad .Nella teoria della significativit, H0 rifiutata o non rifiutata; mai accettata.Nella teoria dei test dipotesi, dovuta a J. Neyman e E. Pearson, sono poste a confronto due ipotesiH1eH2,sullabasediunagenericastatisticatestTeilrifiutodellunaimplicanecessariamentelaccettazione dellaltra. Si conviene di rifiutare H1, quindi accettare H2,quandolesitocampionario(oesiti pi estremi) risulta, dato H1,menoverosimilechenellacondizioneincuisiaveralipotesiH2.Sipu allora incorrere in 2 errori: rifiutare unipotesi quando vera, (errore di I tipo) o accettarla quando falsa (errore di II tipo). Le loro rispettive probabilit di accadere(o meglio i valori massimi ammessiper esse) vengono indicate con e .270Intuitivamente,laregolamiglioredidecisionesullasortediunaipotesidovrebbeconsentirechecontemporaneamente sia lerrore di I tipo sia lerrore di II tipo abbiano la minor probabilit possibile diavvenire. Tuttavia una tale regola non esiste, poich le probabilit esonolegatedaunarelazioneinversa: se una cresce, laltra cala.Pertanto,-si fissa il valore di -si cerca di individuare la procedura, o test, che dia luogo al con il valore minimo.La quantit=1-,definitapotenzadellaregoladidecisione,misuralaprobabilitdirifiutare(correttamente) unipotesi quando falsa.Unadelledueipotesiposteaconfrontopuesserelipotesidicompletaaccidentalit(H0)elipotesialternativaHA(pispessoH1)unanegazione(unilateraleobilaterale)diH0.Inquestoschemadiriferimento,glistrumentiperilcontrollostatisticodiH0nellambitodellateoriadeitestcoincidono, da un punto di vista tecnico, con quelli sviluppati nella teoria della significativit.4.3. POTENZA DI UN TESTIlcomplementodi(1-)misuralapotenza(dapower;inalcunitestidistatisticainitalianochiamata anche forza) di un test statistico, definita come la probabilit di rifiutare lipotesi nullaquando falsa; la probabilit di non commettere lerrore di secondo tipo.Ifattoriche,conmodalitedintensitdifferente,incidonosullapotenzadiuntestperlaverificadellipotesi nulla sono 6:1 - il livello di significativit ();2 - la dimensione della differenza (d oppure ), di cui si vuole verificare la significativit;3 - la variabilit (s2 oppure 2) dei dati (nel caso di confronti tra medie);4 - la direzione dellipotesi (unilaterale oppure bilaterale);5 - la dimensione (n) del campione;6-lecaratteristichedeltest(agrandilinee,parametricooppurenon-parametrico,macondifferenze rilevanti entro questi due gruppi).1)IltimoredicommettereerroridiItipotendeafarabbassarealricercatoreillivellodisignificativit.Ma,riducendoilvaloredi,eglidiminuiscelaprobabilitdiscopriredelledifferenze,anchequandonellarealtesistono;inaltritermini,egliaumentalaprobabilitdicommettere un errore di II tipo.Il rischio implica che si arrivi alla conclusione che esiste una differenza significativa; permette quindiche si arrivi ad una decisione, che a posteriori pu rivelarsi errata e le cui conseguenze possono anche271esseremoltogravi.Semoltoimportanteprenderequestadecisionesenzacorreretroppirischidisbagliare, abitualmente si abbassa il livello di probabilit .Due esempi possono chiarire meglio i due contrastanti interessi entro i quali il ricercatore pu trovarsiequindiicriteriperlasceltadi,giinparteevidenziatinellapresentazionedellecaratteristichedellapproccio decisionale.ESEMPIO1.Unaziendapensadiessereingradodiprodurreunfarmaconuovoperlacuradeitumori, che assicuri una pi alta percentuale di guarigione.Si supponga che questa azienda si trovi in ottime condizioni economiche, con una buona immagine sulmercato, con prodotti ritenuti di alta qualit e che il guadagno dato dalla vendita del nuovo prodotto siapercentualmente piccolo, rispetto al fatturato totale. In queste condizioni, il rischio che lazienda correnellimmetteresulmercatoilnuovofarmacopuesserealto.Potrebbeaccadereche,dopounbuonperiododivendite,ilfarmacononsimanifestirealmentepiefficacedelprecedente.Lapubblicitnegativadiquestanotiziapotrebberovinarelimmaginedellasocietsututtiisuoiprodotti.Nepotrebbe derivare una forte perdita economica.Colui che deve prendere per la ditta la decisione se immettere o meno il prodotto sul mercato tenderateneremoltobassoillivellodisignificativitsultestconclusivo,(peresempio,ugualea0.0001enoncertamente0.05)perridurrealminimoilpericolocheilprodottononsiarealmentepiefficace del precedente.La conseguenza di questa sceltaunaumentodelrischioovveroilrischiodinonmetteresulmercato un prodotto realmente pi efficace; e questo danneggerebbe soprattutto gli ammalati.Unbassodiminuisceilrischioperlasocietfarmaceuticadimetteresulmercatounfarmacononeffettivamentemiglioredelprecedente,mariduceanchelaprobabilitditrarneglieventualivantaggi.Ovviamentenonpueccedereinquestacautela,inquantononimmetterebbepisulmercatoalcunprodotto nuovo. Non diversamente dallo studente universitario che, per non correre il rischio di essererespinto, non si presenti a nessun esame; non raggiunger mai la laurea.ESEMPIO2.Sisuppongaoracheilnuovofarmacoanti-tumoralesiaprodottoesperimentatodaun'aziendaingravedifficolteconomiche,laqualesitrovinellecondizionididoverassolutamenteaumentarelevendite,sevuoleevitareilfallimento.Sisuppongainoltreche,perlasuasituazione,leventuale danno determinato dal fallimento del farmaco per lazienda sia relativamente molto basso,essendo essa prossima al fallimento nella situazione attuale. Il responsabile della ditta tender ateneremolto elevato il livello di (per esempio, uguale a 0.10 o addirittura 0.20 e non certamente 0.05)alfinediaumentaresensibilmenteneitestlaprobabilitdievidenziareunmiglioramentosignificativonelconfrontoconilfarmacoprecedente.Siavrcosunrischiomoltoelevatodimetteresulmercatounnuovoprodottochenonsiarealmentepiefficace(errorediItipo)edareulterioredimostrazione272dincapacit;macontemporaneamentesiavrunanuovaopportuniteunvantaggiomaggiorepergliammalati,chepotrannoprovareedeventualmentescegliereunnuovoprodottochepotrebbedimostrarsirealmentemigliore(diminuiscelaprobabilitdicommettereunerrorediIItipo).Eunadiminuzione del rischio di accettare lipotesi nulla, quando in realt il farmaco pi efficace.2)La dimensione della differenza tra il valore osservato e il valore atteso nell'ipotesi nulla (di solito,la media) il secondo fattore che incide sulla potenza di un test.La potenza di un test statistico funzione crescente della differenza, presa in valore assoluto.Eintuitivochesiapifacilerilevaredifferenzegrandidiquellepiccole.Quandoladifferenzagrande, la potenza del test maggiore rispetto al caso in cui la differenza piccola, perch maggiore laprobabilitdirifiutareconiltestl'ipotesinulla,chenellarealtessafalsa(appuntoperchesistetale differenza).Mediante la distribuzione normale, una esemplificazione chiara fornita dal test per verificare se esisteunadifferenzasignificativatralamediacampionaria(x)equelladellapopolazione(),quandosianotaladeviazionestandard()dellapopolazioneedovviamenteladimensionedelcampione(n).Essa infatti dipende dalla formulazxn Daessasipuagevolmentededurrecheilvaloredizsartantopigrandeequindiiltestrisultermaggiormentesignificativoquantopigrandeladifferenzatralamediacampionaria( x )equelladellipotesi ().Per avere un test significativo, necessario che la differenza tra media campionaria e media ipotizzata( x-)siamaggioreodugualealprodottodelvalorediz,allaprobabilitprefissata,perlerrorestandard della mediax zn dovez il valore della distribuzione normale per la probabilit prefissata (per uguale al 5%, z uguale a 1,645)n la misura della dispersione della media, calcolata su n dati.273Ladifferenzatralemediedi2campionix1- x2puesseremaggioreominoredelladifferenzavera1-2.Equindipreferibilefondarelerichiestesulvalorerealedelladifferenzatra1-2,chedinormaindicatocon(delta).Condaticampionari,nonsipumaiesseresicuriditrovareunadifferenzasignificativa:lefluttuazionicampionariedelladifferenzatraduemedie( x1- x2)possonoessere molto pi piccole della differenza reale (1- 2) e quindi non risultare significativamente diverseda zero.Soventeutilescegliereilvalorediinrapportoalladifferenzaminimaritenutaimportanteper il fattore in esame.3)La variabilit dei dati il terzo fattore.La potenza di un test funzione decrescente della varianza.Leformuleriportateperlanalisidelladifferenzarichiedonochesiconoscaladeviazionestandarddellapopolazione.Nellapratica,raroconoscereprimadellesperimento,anchesepuesserestimatadaricercheprecedenti,eventualmentereperibiliinletteraturaonellesperienzadelricercatore.Siricorrequindialladeviazionestandarddelcampione(s),conlaqualeoccorreutilizzarenonladistribuzionenormalestandardizzataz,maladistribuzionetdiStudent,chesarpresentatanelcapitolo successivo.Riprendendo la trasformazione della formula precedente e con la medesima simbologia,zn evidente che-aldiminuiredi,aumentailvaloredizequindilapotenzadeltestnellevidenziareuneffetto di una determinata grandezza assoluta ;-viceversa, allaumentare di diminuiscezelapotenzadeltestnelrenderesignificativalastessadifferenza.Molto spesso,linfluenza della differenza e della deviazione standard,derivatidaimedesimidati, vengono considerate assieme mediante il rapporto= / Questo indice(phi),appuntoperchdeterminatodalrapportodivaloristimatidaglistessidati,hailvantaggio di essereadimensionaleequindiconvalorirelativamentestabili,chedinormavarianoda0,5a1.Neconsegueche,nelcalcolodellafunzionedipotenzadiuntest,offreilvantaggiopraticodiridurreilnumerodeivaloridaconsiderare,nettamenteinferioreaquellodelleinnumerevolicombinazioni possibili tra valori diversi della differenza e della deviazione standard .2744) L'ipotesi alternativa H1, da verificare con un test, pu essere bilaterale o unilaterale.E'bilateralequandocisichiedesetralamediadelgruppoAequelladelgruppoBesisteunadifferenza significativa, senza sapere a priori quale dei due gruppi potr risultare migliore.E' unilateralequandopossibileescludereapriori,comeprivodisignificatoerisultatosolodierrorinella conduzione dellesperimento, il fatto che la media diBpossaessereminoreomaggioredellaA.Il test statistico serve per verificare solamente se la media diB sia significativamente superiore a quelladi A o viceversa; non entrambi.Per esempio, in tossicologia-si ha un test bilaterale quando si confronta l'effetto di due sostanze (A eB)sull'accrescimentodidue gruppi di animali, per valutare quale abbia leffetto maggiore: sono due risposte alternative, che losperimentatore ritiene ugualmente logiche e possibili;-sihainveceuntestunilateralequandosiconfrontanoirisultatidiunprincipioattivoconilplacebo. E' evidente che da questo secondo confronto non ci si pu ragionevolmente aspettare che glianimaliaiqualistatosomministratoiltossicoabbianorisultatimigliorinellacrescitaenellasopravvivenzadicoloroaiqualistatosomministratoilplacebo.L'unicadomandarazionaleseglianimaliaiqualistatosomministratoiltossicoabbianounaccrescimentosignificativamentepeggiorediquellitrattaticonilplacebo.Seilgruppoalqualestatosomministratoiltossicoavesseunrisultato medio migliore dellaltro,sarebbeillogicoequindisarebbeinutileproseguirelanalisi,con qualunque test statistico.I concetti su test bilaterale e test unilaterale spesso sono espressi sinteticamente con un grafico.Ladifferenzatratestunilateraleetestbilateralenonsolamenteunaquestioneteorica:unascelta con effetti pratici rilevanti sulla potenza del test,poichimportanteperladeterminazionedellazonadirifiutodell'ipotesinulla.Inuntestunilateraleessasarsolamenteinunacodadelladistribuzione; in un test bilaterale essa sar equamente divisa nelle due code della distribuzione.275In una distribuzione normale, prendendo come livello di significativit il 5%,-in un test ad una coda l'area di rifiuto dell'ipotesi nulla inizia dal valore critico Z = 1,645- in un test a due code essa inizia dal valore critico Z = 1,96.Allostessolivellodisignificativit(),conlastessadeviazionestandard(),lamedesimadifferenzainvaloreassoluto()edunugualenumerodidati(n),untestunilateralesemprepi potente del corrispondente test bilaterale,poichilvaloredellindicealqualesirifiutalipotesinulla sistematicamente minore, in valore assoluto.Un test unilaterale quindi senza dubbio preferibile; ma per esso occorre una quantit dinformazionesuperiore sui possibili risultati dellesperimento, che non sempre disponibile.5)Ladimensionedelcampione(n)ilparametrochehal'effettopifacilmentemisurabilesulla potenza di un test.Applicando l'equazionex zn con labituale simbologia della distribuzione normale,semplicecalcolarechelasignificativitdiunadifferenzamediacampionaria(x)inversamenteproporzionale alla radice quadrata del numero di dati del campione (n).ESEMPIO.Iconcettirelativiaifattorichedeterminanolapotenza(1-)diuntestpossonoesserespiegati con un esempio e la sua illustrazione grafica, come riportata nella figura sottostante.Per una comprensione pi semplice, utile scomporre i diversi passaggi logici in due fasi.276I - Dapprima si supponga che leffetto di un fattore sia nullo (ipotesi H0vera,comenelladistribuzionenormale inferiore), quindi che la sua media sia = 0. Supponendo inoltre che-la sua deviazione standard sia = 2,8-da questa popolazione sia stato estratto un campione di dimensione n = 6-lipotesi alternativa H1 sia bilaterale,-con = 0.05non si rifiuter lipotesi nulla fino a quando la media campionariaxsar compresanellintervallo fiducialex= t z nCon i dati dellesempio, risulta68 , 296 , 1 0 t= t2,24che xpu variare tra-2,24e+2,24senza essere statisticamente diversa da 0.II-Ora,sidevepassareallaltradistribuzione,laprobabilit,ipotizzandocheH0siafalsa(comenella distribuzione normale riportata nella parte superiore della figura).Se leffetto reale del trattamento (H1 vera) in realt = 3, non si potr rifiutare lipotesi nulla sela mediaxdi un campione estratto da questa popolazione sar pi vicina a 0 di +2,24.Per la stima di , il test unilaterale.Supponendo sempre, come nel caso precedente, che-la sua deviazione standard sia = 2,8-da questa popolazione si estragga un campione di dimensione n = 6,la probabilit di estrarre una media campionariaxminore di+2,24 sardata daZ = nx Con i dati dellesempioZ = 68 , 23 24 , 2 = -0,67si ottiene un valore di z uguale a 0,67.277QuestastimahasignificatosoloselamediarealediH1dallastessapartedelcampione,rispetto alla media reale dellipotesi H0. Di conseguenza, la probabilit di deveesserestimatasu una distribuzione normale unilaterale.Inunatavolanormaleunilaterale,alvalorediZ=0,67corrispondeunaprobabilit=0,251.Diconseguenza,lapotenza(1-)diquestotest(ciolaprobabilitdirifiutarelipotesinulla,chenoisappiamo in realt essere falsa) uguale a (1 - 0,251) cio 0,749 o 74,9%.E semplice dimostrare che-scegliendo una probabilit maggiore,-diminuendo ,-aumentando n-incrementando , la distanza tra le medie reali delle due ipotesi,diminuisce anche la probabilit e quindiaumentalapotenza(1-)deltest,ciolaprobabilitdirifiutare lipotesi nulla, con i dati del campione che sar raccolto.Seaparitdituttiglialtrifattoriconsiderati,comenellafigurasuccessiva,larealedellipotesinullafosse stata uguale a 5,il valore diZ sarebbe risultatoZ = 68 , 25 24 , 2 = -2,40278ugualea2,40equindisisarebbeottenutounaprobabilit=0.008eunapotenza(1-)parial99,2%.Questa stima di chiamata potenza a posteriori.Dinorma,quandoiltestnonrisultasignificativo,ricorrendoalladistribuzionetdiStudentservepervalutarequalepotevaesserelaprobabilitdirifiutare lipotesi nulla, con le caratteristiche ( x , s) e la quantit (n) dei dati raccolti.Spesso utile stimare la potenza a priori.Al momento della programmazione dellesperimento, un problema pratico che si pone al ricercatore quantidatidebbaraccogliere,alfinedidimostrareconiltestpresceltocheunacertadifferenzasignificativa. La dimensione minima di un campione pu essere determinata dopo aver fissato-uno specifico livello di significativit (da cui dipende z),-un errore campionario (che dipende dalla variabilit del fenomeno, misurata con ).La dimensione del campionenpuesseredeterminataperunprefissatolivellodisignificativit()edi potenza del test (1-) mediante la distribuzione normale standardizzata z, con la formula( )( )21 022 Z Zndove-2 la varianza della popolazione,-Z il valore diz per il livello di significativit,-Z il valore di z per il rischio dell'errore di II tipo,-0 la media della popolazione nell'ipotesi nullaH0,-1 la media della popolazione nell'ipotesi alternativaH1.Si tratta quindi di determinare, attraverso una ricerca o uno studio preliminare, i valori di2,0e1poich nella distribuzione normale, per un test unilaterale, con-un livello di significativit = 0.05 si ricava Z = 1,645-una potenza dell'80%) 20 . 0 ( si ricava Z = 0,84mentre per un test bilateralecon gli stessi dati viene modificato solamente il valore diz che alla significativit del 5% risulta ugualea 1,96.Il numero n di dati necessari risulta quindi-direttamente proporzionale al valore della varianza della popolazione,279-inversamenteproporzionalealladifferenzatralemediedellapopolazione,espressenell'ipotesinulla H0 e nell'ipotesi alternativa H1(Lemodalitperstimareledimensioniutilidelcampioneconiltestt,l'analisidellavarianza,laregressione lineare semplice e la correlazione saranno spiegati nei capitoli successivi).Luso principale del calcolo della potenza la stima del numero di dati necessari a rilevare uneffettoabbastanzagrande,daesserescientificamenterilevanteostatisticamentesignificativo.Quandoapplicandountestnonsistatiingradodirifiutarelipotesinulla,aposterioripuesseredigrandeutilitcalcolarelapotenzadeltestattuato,alfinedievidenziareediscutereleventualecontributo fornito,-dalla differenza analizzata-dalle dimensioni del campione raccolto.Ilcalcolodellapotenzaserveperstimareledimensionidelcampionediunasuccessivaricerca,affinchladifferenzamediarilevatapossarisultaresignificativa.Sovente,piuttostocheconcentrarelattenzionesullaalternativaaccettazione-rifiutodellipotesinullautilevalutarelapotenzaconlaquale i dati suggeriscono la presenza di un effetto.Inconclusione,perstimareconprecisionequantidatisidevonoraccogliereaffinchuntestrisultisignificativo, devono essere stimati in anticipo-leffetto che si pensa di osservare o che valga la pena rilevare (),-il grado di fiducia con il quale si spera di accettare () e-di rifiutare () lipotesi nulla di inefficacia,-la deviazione standard () della popolazione studiata.Idatipossonoesseretrattidarisultatigipubblicati,dastudi-pilotacondottidalricercatoreoppureessere fondati su supposizioni pi o meno logiche.6)A partire dagli stessi dati,nontuttiitesthannolastessacapacitdirifiutarel'ipotesinullaquando falsa.E quindimolto importante scegliere il test pi adatto,-in rapporto alle caratteristiche dei dati (qualitativi o quantitativi),-al tipo di scala o misura (scale di rango, di intervalli o di rapporti),-alla variabilit dei dati,-alla simmetria della distribuzione,-alla omoschedasticit dei gruppi a confronto.280Testdiversihannocondizionidivaliditdifferentiesonopiomenorobusti(sopportanoinmodo differente lallontanamento dalle condizioni di validit).E'gistatofattoosservareche,conunnumeroridottodiosservazionisuddiviseinvarigruppi,iltestdi Kolmogorov-Smirnov pi potente del test2.Neitestdistatisticanonparametricacheverrannopresentati,sifarsoventeunconfrontodipotenzarispettoaglialtritest,soprattuttoaquellicorrispondentidistatisticaparametrica.E'infattimoltoimportanteutilizzareiltestpipotente,infunzionedeltipodiscalaedinaccordoconlecaratteristichedeidati.Adesempio,perilconfrontotraletendenzecentraliinduecampionidipendentipossonoessereutilizzatitestdifferenti:traquellinonparametricipossibilesceglieretrailtest dei segni, il test T diWilcoxon, il test dicasualizzazione;traquelliparametricipossibilesceglieretra l'analisi della varianza a due criteri di classificazione oppure ad un solo criterio.Errare nella scelta del test, significa non scegliere il pi potente per quelle condizioni specifiche; quindiilrisultatopuesserequellodinonrifiutarelipotesinulla(chesappiamofalsa),rendendonulloillavoro di raccolta ed analisi dei dati.Nellasceltadeltestpiappropriato,sempreutileconsiderareancheilconfrontotralepotenze.Aquestoscopo,peritestnonparametricistatosoventeriportatalapotenzarispettoalcorrispondenteparametrico.Dinorma,quantopiscarsiodebolisonoipostulatisucuiiltestfondato,tantopileconclusionihannounvaloregenerale.Emenoprobabileottenererisultatisignificativi;maleventualeaffermazionedisignificativitmoltodifficilmentepuesserecontestata.Perquestomotivo, con i test di statistica non parametrica solitamente pi difficile rifiutare l'ipotesi nulla, quandoessa falsa; ma questi test hanno il vantaggio di avere condizioni di validit meno restrittive e quindi disollevare meno obiezioni o dubbi sulle conclusioni raggiunte.Questiconfrontitratestsonovalidi,quandosiutilizzanocampioniconlostessonumerodiosservazioni. Infatti, il numero di dati un parametro che incide direttamente sullapotenza-efficienzadi un test.Il concetto dipotenza-efficienzadeltestArispettoaltestBfondatosulnumerodiosservazioninecessario al test A per avere la stessa potenza del test B.potenza efficienza del test A inNNba % 100doveNa e Nb sono rispettivamente il numero di dati od osservazioni utilizzati nei due test A e B.281Per esempio, se-il test A richiede 30 osservazioni per avere la stessa potenza del test B con 20 osservazioni,-la potenza di A sar 20/30 x 100 di B e corrisponde al 66%.Significa che ogni 6,6 osservazioni per il test B occorrono 10 osservazioni per A, se si vuole la stessapotenza.A volte, quando possibile aumentare il numero di osservazioni o rifiutare comunque lipotesinullaallaprobabilitprefissata,preferibileavereuntestconcondizionidivaliditmenorestrittive anche se meno potente, perch le conclusioni non potranno essere contestate.Secondolecaratteristichedeidati,inparticolareinrapportoallalorovariabilit,quandosianalizzanopifattoridiventaimportantescegliereildisegnosperimentalepiadatto,quellocherendemassimalefficienza dellanalisi. Si parla allora diefficienzarelativa(ilconcettoverrripresonellanalisidellavarianza).Sperimentazioniprogettateecondotteinmodocorrettoedanalizzateconmetodiappropriatipossonononevidenziaredifferenzerealiequantitativamenteimportantinelladisciplinastudiata,acausadiuncampionetroppopiccolo,nondigradoinfornireunapotenzasufficienteperrendereleffettostatisticamentesignificativo.Lanalisidellapotenzapermettedivalutareinmodocriticoirisultati per ripetere lesperimento con un numero di dati adeguato.Altrevolte,lastimadellapotenzapuevidenziarelanecessitdiuncampionetroppogrande,peressere attuato nelle condizioni reali del ricercatore. La causa principale della non significativit sarebbeallora da ricercare nelleffetto troppo piccolo che si vuole analizzare o nella grande variabilit dei dati.Comunque se la potenza del test evidenzia la necessit di un campione che superi le possibilit reali delricercatore,peritempirichiestinellaraccoltadeidatioppurepericostidellesperimentooperlimpossibilitoggettivadidisporreditanticasi,siraggiungonoconclusioniugualmenteimportantiperla ricerca.Lasituazionepidiffusaquellaincuiilnumerodidatipuvariareconrelativafacilit,nonrappresentandoilvincolofondamentaledellaricerca.Negliesperimentiinlaboratorioenellaraccoltadeidatiinnatura,generalmentelambientalistadovrebbefissareilnumerodiosservazioniprimadiiniziarne lesecuzione.Inaltrisettoridellaricerca,ognisingolodatomoltocostososottolaspettoeconomicoomorale;inaltriancora,sitrattadieventicheavvengonomoltoraramente,agrandidistanzaditempo.Ladimensione della ricerca non prevista allinizio come nei casi trattati in precedenza: si cerca deciderein modo definitivo, appena i dati permettono di giungere ad una conclusione. Elanalisisequenziale,esposta nell'ultimo capitolo.282Nellanalisisequenziale,idatiraccoltisonoanalizzatiognivoltachesiaggiungeunnuovodato.Lapplicazione del test permette 3 risposte:-accettare definitivamente lipotesi nulla;-rifiutarla definitivamente;-aggiungereoaspettareunnuovodato,inquantoconidatigiraccoltinonpossibiledecidereinnessuna delle due precedenti direzioni.La procedura relativamente pi sofisticata dei test che verranno proposti nel corso.Perleanalisisequenzialisonodisponibiligraficisuiqualiriportareirisultatigiottenuti.Alcuniricercatoriliutilizzanoalpostodeitestclassici,perevitareicalcolirichiesti.Eunerrore,inquantoitest classici permettono lutilizzazione migliore dei dati raccolti.Epureerratoripetereitestclassici,tuttelevoltechesiaggiungeundatonuovoaiprecedenti:taleprocedura determina valori di probabilit P troppo ottimistici. Sono concetti che verranno approfonditiquando si tratteranno i confronti multipli nellanalisi della varianza parametrica e non parametrica.4.4.NUMERODIDATINECESSARIINRAPPORTOALLAPOTENZA,ALLASIGNIFICATIVITA DEL TEST E ALLA DIREZIONALITA DELLIPOTESI.IL CRITERIO DI COHEN PER LA SCELTA DIERiprendendo i concetti gi presentati nei paragrafi precedenti, utile ricordare che:-indicalaprobabilitdirifiutare(erroneamente)lipotesinullaH0quandoessavera;lasignificativitdeltesteilrisultatochiamatofalsopositivo,poichconessosiaccettacomesignificativa una differenza che in realt non esiste;-1 - la probabilit di accettare lipotesi nulla quando vera (risultato esatto);- indica la probabilit di non trovare (erroneamente)unadifferenzasignificativaquandoinrealtessaesiste;ilrisultatochiamatoanchefalsonegativo,poichsinegalesistenzadiunadifferenza che in realt esiste;-1 - la probabilit di trovare significativa una differenza che in realt esiste (risultatoesatto);la potenza del test.Il valore diingenerefissatoalmomentodellanalisi.Lasuasceltadipendeessenzialmentedalleconseguenzenegativediunaconclusioneerrata,quandosidichiarasignificativaunadifferenzacheinrealt non esiste. Lerrore di II Tipo, misurato da,dipendesoprattuttodallaprogrammazionedellesperimento.Adesempio,comesivedrnellanalisidel