grafici e tabelle permettono di fare valutazioni ... · indici di dispersione • campo di...

54
Grafici e tabelle permettono di fare valutazioni qualitative, non quantitative. E’ necessario poter sintetizzare i dati attraverso due importanti indici : Indici di posizione Indici di variazione

Upload: lamtuyen

Post on 15-Feb-2019

216 views

Category:

Documents


0 download

TRANSCRIPT

Grafici e tabelle permettono di fare valutazioni qualitative,

non quantitative. E’ necessario poter

sintetizzare i dati attraverso due importanti indici :

Indici di posizione Indici di variazione

Indici di posizione

Numeri che sono rappresentativi dei dati e forniscono indicazioni sull’ordine di grandezza del fenomeno in studio.

La tendenza centrale

•  Una tendenza centrale è una misura statistica che consente di riassumere un’intera distribuzione di frequenza in un solo numero

•  La tendenza centrale è un tentativo di identificare gli aspetti “tipici”, “medi” di una distribuzione

Difficoltà

•  Qual è il valore tipico nelle tre rappresentazioni?

1 2 3 4 5 6 7 8 90

0,5

1

1,5

2

2,5

3

3,5

4

4,5

5

5,5

6

f

Voto

Casi

1 2 3 4 5 6 7 8 90

1

2

3

4

5

6

7

8

9

10

11

12

Voto

Tre misure di tendenza centrale

•  Media aritmetica •  Mediana •  Moda

Una parentesi: il segno sigma

•  La sommatoria dei valori di X per tutte le osservazioni prese in considerazione

∑ X i

La media aritmetica

La media di una distribuzione è la somma dei valori osservati diviso il numero delle osservazioni

NX∑=µ

Popolazione

N: La grandezza della popolazione

nXX ∑=

Campione

n: La grandezza del campione

i i

ESEMPIO

•  La media aritmetica dell’età di 10 studenti si calcola:

9,2610269

10)30292927272626252525(

==

+++++++++=X

Esempio Determinare l’età media di 50 giovani presenti in una pizzeria un sabato sera:

1.Costruire una tabella che riporti in una colonna l’età (Variabile X) e in un’altra colonna il numero di giovani (frequenza assoluta).

2.Moltiplicare il valore della variabile X per la frequenza e sommare.

3. Dividere per il numero delle osservazioni.

ESEMPIO

Età Frequenza

14 4

15 6

16 12

17 18

18 10

Esempio

14*4 + 15*6 + 16*12 + 17*18 + 18*10 824 x = ————————————————— = —— 50 50

16,48

La formula della media di una distribuzione di frequenza assumerà pertanto questo

aspetto

∑∑∑ ==

fXf

nXf

X

Proprietà della media

•  Dati un insieme di valori possiamo calcolare una sola media aritmetica.

•  E’ facile da calcolare. •  E’ sempre compresa tra il valore più

piccolo e quello più grande.

Proprietà della media

La media aritmetica, molto duttile nelle elaborazioni statistiche, in quanto ottenuta con calcoli matematici, ha un unico grosso inconveniente, quello che può essere influenzata notevolmente dai valori estremi.

Attenzione: se abbiamo utilizzato la media aritmetica per l’analisi dei dati dobbiamo riferirci a test di significatività della media (test parametrici)

Esempio

Come cambia il valore della media se ai dati dell’esempio precedente aggiungiamo un valore molto piccolo ? ovvero un valore molto grande?

Esempio

Età : 25,25,25,26,26,27,27,29,29,30 Media aritmetica : 26,9 Aggiungendo un soggetto con età 6 Media aritmetica : 25 Aggiungendo un soggetto con età 61 Media aritmetica : 30

• La media è una buona misura di tendenza di misura centrale per le distribuzioni “normalmente” distribuite

1 2 3 4 5 6 7 8 90

0,5

1

1,5

2

2,5

3

3,5

4

4,5

5

f

Voto

Casi

21,5=X

• La media è una misura inadatta per le distribuzioni che contengono un numero esiguo di dati e valori estremi

1 2 3 4 5 6 7 8 90

1

2

3

4

5

6

7

8

9

10

11

12

Voto

42,5=X

mediana La mediana è una media di posizione e rappresenta il valore

centrale della distribuzione quando i dati sono ordinati. Si definisce mediana il valore che bipartisce la distribuzione,

ossia il valore non inferiore a metà dei valori e non superiore all’altra metà.

Dato un insieme di valori ordinati se n è dispari la mediana è il valore centrale, se n è pari è la semisomma dei due valori centrali. :

∑ xi 1+ ∑ xi — se n è pari ――― se n è dispari 2 2

Proprietà della mediana

•  Dati un insieme di dati possiamo individuare una sola mediana.

•  E’ facile da calcolare. •  Non è influenzata da valori estremi

Proprietà della mediana

La mediana, in quanto ottenuta senza calcoli matematici non si presta per le le più comuni elaborazioni statistiche.

Attenzione : se abbiamo utilizzato la mediana come misura di posizione centrale, dobbiamo riferirci a test di significatività della mediana (test non parametrici)

Esempio

Età : 25,25,25,26,26,27,27,29,29,30 Mediana : (26+27)/2 = 26,5 Aggiungendo un soggetto con età 6 6,25,25,25,26,26,27,27,29,29,30 Mediana : 26 Aggiungendo un soggetto con età 61 25,25,25,26,26,27,27,29,29,30,61 Mediana : 27

Uso della mediana

Utile quando le distribuzioni dei dati sono fortemente asimmetriche. Utile quando le distribuzioni dei dati contengono un numero esiguo di valori estremi.

MODA

La moda o valore modale è una media di posizione.

Si definisce moda o valore modale di una distribuzione il valore della variabile al quale corrisponde la massima frequenza

Moda numero di posti letto secondo il reparto di ricovero

REPARTO N°posti lettocardiochirurgia 24cardiologia 37chirurgia 50chirurgia plastica 2chir.vascolare 19gastroenterologia 46medicina 96nefrologia 24neurochirurgia 30neurologia 40oculistica 21ortopedia 20ostetricia 52pediatria 34terapia intensiva 12unità coronarica 12urologia 28TOTALE 547

La moda di una distribuzione è data da

quel valore che compare più

frequentemente nella distribuzione stessa

Proprietà della moda •  Facile da calcolare •  La moda puo' essere assente (specie se le osservazioni sono poche) •  Puo' essere plurima (es. distribuzioni bimodali con 2 picchi). •  La moda è l’unica misura che possiamo ottenere da dati riferiti a variabili qualitative.

Nelle distribuzioni "normali" (cioe' unimodali e simmetriche) media, mediana e moda coincidono.

Indici di dispersione

Numeri che forniscono informazioni sulla variabilità (eterogeneità del fenomeno in studio)

Gli indici di posizione non dicono tutto…….

Esempio : dati due campioni A : 5,5,5,1,9 media aritmetica : 5 B : 5,5,5,4,6 media aritmetica : 5 Potremmo concludere sulla base della media ottenuta che i due campioni sono uguali?

Indici di dispersione

•  Campo di variazione (range) •  Differenza interquartile •  Deviazione standard •  Coefficiente di variazione

Campo di variazione

E’ la differenza tra il valore più grande e il valore più piccolo della serie di osservazioni. Nell’esempio precedente: A : 9 - 1 = 8 B : 6 - 4 = 2

Proprietà

•  Facile da calcolare. •  Dipende solo dai due valori estremi,

non dà alcuna informazione sulla distribuzione degli altri dati.

•  Si utilizza per dati asimmetrici. •  E’ la misura di variazione da utilizzare

con la mediana.

Deviazione standard

•  Misura la “dispersione” di tutti i dati rispetto alla media aritmetica.

•  Tiene conto di tutti i valori. •  E’ la misura di variazione da utilizzare

con la media aritmetica

Formula della deviazione standard

σ = ( Σxi-µ)2 per dati di popolazione

s = ( Σxi- x)2 per dati campionari N

N-1