gli indici di dispersione. la variabilità un valore medio rappresenta una distribuzione ma non da...

21
Gli indici di dispersione

Upload: mafalda-chiari

Post on 02-May-2015

216 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Gli indici di dispersione. La variabilità Un valore medio rappresenta una distribuzione ma non da informazioni circa i singoli dati a)5, 5, 5, 5, 5 b)1,

Gli indici di dispersione

Page 2: Gli indici di dispersione. La variabilità Un valore medio rappresenta una distribuzione ma non da informazioni circa i singoli dati a)5, 5, 5, 5, 5 b)1,

La variabilità

• Un valore medio rappresenta una distribuzione ma non da informazioni circa i singoli dati

a) 5, 5, 5, 5, 5

b) 1, 3, 5, 7, 9

c) 1, 1, 1,1, 21 X = 5

d) 1, 2, 3, 4,15

Page 3: Gli indici di dispersione. La variabilità Un valore medio rappresenta una distribuzione ma non da informazioni circa i singoli dati a)5, 5, 5, 5, 5 b)1,

La variabilità

• È la capacità di un fenomeno di assumere valori quantitativi o caratteri qualitativi diversi

Variabilità nell’individuo

statura nell’età evolutiva

Variabilità nel gruppo

statura in un gruppo di individui della stessa età

Page 4: Gli indici di dispersione. La variabilità Un valore medio rappresenta una distribuzione ma non da informazioni circa i singoli dati a)5, 5, 5, 5, 5 b)1,

La variabilità

• Occorre un criterio per quantificare la variabilità delle misure rispetto a un termine di riferimento :

indice di tendenza centrale

• La forma della variabilità è visibile ponendo su un piano cartesiano i valori della distribuzione

• La variabilità delle misure può essere valutata in base alla loro dispersione rispetto ai valori medi e misurata dagli indici di dispersione

Page 5: Gli indici di dispersione. La variabilità Un valore medio rappresenta una distribuzione ma non da informazioni circa i singoli dati a)5, 5, 5, 5, 5 b)1,

LA VARIABILITÀ

X

0 x1 x2... ..... x i ..... x n

L’indice di variabilità rappresenta quanto ciascun termine è

distante, in media, da X

Page 6: Gli indici di dispersione. La variabilità Un valore medio rappresenta una distribuzione ma non da informazioni circa i singoli dati a)5, 5, 5, 5, 5 b)1,

Distribuzione simmetricala maggior parte delle

osservazioni si avvicina alla media

Ci sono tanti soggetti inciascuna classe

Molte osservazionisono lontane dalla media

Molti soggetti nella classeiniziale e pochi nelle altreLa maggior parte delle

osservazioni sonolontane dalla media

Variabilità rispetto alla media

Page 7: Gli indici di dispersione. La variabilità Un valore medio rappresenta una distribuzione ma non da informazioni circa i singoli dati a)5, 5, 5, 5, 5 b)1,

Indici di variabilità

• La più elementare misura di dispersione è l’intervallo di variazione (range): differenza tra valore più alto e più basso

Es: la statura di 5 persone adulte in cm.

150 168 170 171 172

R = 22

Page 8: Gli indici di dispersione. La variabilità Un valore medio rappresenta una distribuzione ma non da informazioni circa i singoli dati a)5, 5, 5, 5, 5 b)1,

Intervallo di variazione

• Lo scarto indica la dimensione della variabilità ma non fornisce informazioni circa la variabilità della distribuzione

• Considera solo i dati estremi e non informa circa

i valori intermedi

• Scarsamente utile, utilizzata solo in alcuni casi (es. temperature)

Page 9: Gli indici di dispersione. La variabilità Un valore medio rappresenta una distribuzione ma non da informazioni circa i singoli dati a)5, 5, 5, 5, 5 b)1,

Scarto medio semplice assoluto • Definiamo lo SCARTO come la differenza tra la singola

osservazione e la media della distribuzione

• Dati n valori xi di media aritmetica x , si chiama scarto

semplice medio assoluto la media aritmetica dei valori

assoluti degli scarti xi – x

N

xx

N

xxxxxxs

n

ii

nim

)()(....)()(

_

1

__

2

_

Page 10: Gli indici di dispersione. La variabilità Un valore medio rappresenta una distribuzione ma non da informazioni circa i singoli dati a)5, 5, 5, 5, 5 b)1,

SCARTO E DEVIANZA

• Gli SCARTI esprimono la distanza di ciascuna osservazione dalla media della distribuzione.

• Potremmo rappresentare la variabilità totale della distribuzione come la somma di tutti gli scarti, e cioè:

Variabilità totale =

Ma, per una proprietà della Media aritmetica, risultasempre essere = 0 la somma degli scarti:

)(_

xx

0)(_

xx

Page 11: Gli indici di dispersione. La variabilità Un valore medio rappresenta una distribuzione ma non da informazioni circa i singoli dati a)5, 5, 5, 5, 5 b)1,

Devianza

• Per superare il problema dei valori negativi alle differenze dalla media si possono elevare al quadrato i valori

• La Devianza è un indice di valutazione della variabilità di una distribuzione

• Da essa discendono la Varianza e la Deviazione Standard

2_

)( xx

Page 12: Gli indici di dispersione. La variabilità Un valore medio rappresenta una distribuzione ma non da informazioni circa i singoli dati a)5, 5, 5, 5, 5 b)1,

Varianza

• La devianza non contiene l’informazione sul numero di osservazioni utilizzato per il calcolo

• La varianza è una devianza media che si rapporta al numero di osservazioni

• Essa da informazioni circa la variabilità dei singoli valori invece che per quella complessiva

Nxxs \)( 22

Page 13: Gli indici di dispersione. La variabilità Un valore medio rappresenta una distribuzione ma non da informazioni circa i singoli dati a)5, 5, 5, 5, 5 b)1,

Varianza corretta• In campo biostatistico la formula

viene modificata in considerazione della minore numerosità delle distribuzioni che penalizzerebbero l’informazione sulla variabilità

• Viene introdotto il concetto di gradi di libertà nel denominatore per valutare al massimo il grado di dispersione

• I gradi di libertà rappresentano il numero di osservazioni indipendenti della distribuzione

( N-1) poiché sui dati disponibili è già stata calcolata la media

1

)( 22

N

xxs

Page 14: Gli indici di dispersione. La variabilità Un valore medio rappresenta una distribuzione ma non da informazioni circa i singoli dati a)5, 5, 5, 5, 5 b)1,

I gradi di libertà

• Date 6 osservazioni vincolate dalla media x =25

N. misura attribuzione arbitraria

1 1 54 2 2 - 9 3 . ... 11 4 ..... 86 5 N – 1 1 6 N ?

54 – 9+11+86+1=143

La sesta misura si ricava indirettamente

Allora Σx= N x = 6 25 =150Pertanto considerati i valori arbitrari la sesta misura sarà

X6=150 – 143=7

5

1iix

625

6

1

6

1_

iii xi

N

xx

Page 15: Gli indici di dispersione. La variabilità Un valore medio rappresenta una distribuzione ma non da informazioni circa i singoli dati a)5, 5, 5, 5, 5 b)1,

Deviazione standardo

Scarto Quadratico Medio• E’ più conveniente esprimere

la variabilità nello stesso ordine di grandezza dei dati e della loro media

• La varianza è espressa con un ordine di grandezza al quadrato rispetto ai dati originali

• Per esprimere la variabilità nello stesso ordine di grandezza si applica alla varianza la trasformazione inversa al quadrato: la radice quadrata

1

)( 2

N

xxs i

Page 16: Gli indici di dispersione. La variabilità Un valore medio rappresenta una distribuzione ma non da informazioni circa i singoli dati a)5, 5, 5, 5, 5 b)1,

Esempi di variabilità di distribuzioni

• Modalità 1 2 3

Frequenze 3 5 3 si ha x =

s =

• Modalità 0 2 4

frequenze 3 5 3 si ha x =2

s =

211

335231

738.011

3)23(5)22(3)21( 222

477.111

3)24(5)22(3)20( 222

Page 17: Gli indici di dispersione. La variabilità Un valore medio rappresenta una distribuzione ma non da informazioni circa i singoli dati a)5, 5, 5, 5, 5 b)1,

VARIANZA E DEVIAZIONE STANDARD DI DATIRAGGRUPPATI IN CLASSI

Come fatto per il calcolo della media anche in questo caso andremo amodificare la formula per il calcolo della VARIANZA e dello SCARTO

QUADRATICO MEDIO considerando le “Frequenze” (fi) di ciascunaclasse. Abbiamo pertanto:

Varianza

Scarto quadratico medio

mi = valori centrali delle singole classi

i i

iii

f

fxmi1

2

2

1

2

2

i

fi

f

xm

i

iii

Page 18: Gli indici di dispersione. La variabilità Un valore medio rappresenta una distribuzione ma non da informazioni circa i singoli dati a)5, 5, 5, 5, 5 b)1,

Calcolo e interpretazione di s

• 5 reparti di un ospedale secondo il numero di posti letto

12 60 42 54 32

X = (12 + 60 + 42 + 54 + 32) / 5 = 200 / 5 = 40

Se tutti i reparti avessero lo stesso numero di posti letto, avrebbero 40

posti letto ciascuno

Dev.=(12 – 40)2 + (60 -40)2 + (42 – 40)2 + (54 - 40)2 + (32 – 40)2 =1448

s = 1448 / 5 = 289,6 s = 289,6 = 17

Ciascun reparto ha un numero di posti letto che è diverso da quello

medio (40) in media di 17

Page 19: Gli indici di dispersione. La variabilità Un valore medio rappresenta una distribuzione ma non da informazioni circa i singoli dati a)5, 5, 5, 5, 5 b)1,

Coefficiente di variazione

Es: una popolazione di adulti ha un peso medio di 75 Kg. una di neonati con peso medio 3.2Kg.s adulti = 4 Kg s neonati = 0.6

Si può affermare che la variabilità per gli adulti è maggiore rispetto a quella dei neonati?

Si possono confrontare i rapporti con le medie

1875.0

2.3

6.0

La variabilità del peso degli adulti è inferiore

x

sCV

053.075

4

Page 20: Gli indici di dispersione. La variabilità Un valore medio rappresenta una distribuzione ma non da informazioni circa i singoli dati a)5, 5, 5, 5, 5 b)1,

Coefficiente di variazione

• Gli indici di variabilità sono espressi nella stessa unità di misura delle osservazioni e non consentono confronti fra la variabilità di due distribuzioni espresse in unità di misura diverse

• Non consentono il confronto di distribuzioni che hanno medie diverse: sono influenzate dall’intensità del carattere

• Il CV è una misura relativa di variabilità: esprime la variabilità in proporzione alla dimensione media del carattere

• Il CV può essere definito come il rapporto tra la deviazione standard e la media (in %)

• E’ una misura adatta a confrontare la variabilità fra popolazioni diverse o fra caratteri diversi

Page 21: Gli indici di dispersione. La variabilità Un valore medio rappresenta una distribuzione ma non da informazioni circa i singoli dati a)5, 5, 5, 5, 5 b)1,

Coefficiente di variazione• ES : Si considerino i dati relativi a un gruppo di studenti a cui siano stati

rilevati la statura e il peso. Conoscendo media e scarto quadratico medio si vuole stabilire quale fra i caratteri in studio ha minore variabilità

Carattere media deviazione standard

statura 168,59 6,49

peso 64,48 7,27

C. V..(statura)

C. V.(peso)

85,310059,168

49,6

27,1110048,64

27,7

La statura è il carattereche presenta una minore

variabilità