indici di - unime.it · indici di tendenza centrale scale di misura nominale ordinale intervalli...
Post on 09-Sep-2019
8 Views
Preview:
TRANSCRIPT
Indici di …posizione:-quantili-decili-percentili
tendenza centrale:-Media-Moda-Mediana
variabilità e dispersione:-Devianza- Varianza-Deviazione standard
Indici di tendenza centrale
Indici di tendenza centrale
Scale di misura
Nominale Ordinale Intervalli Rapporti
ModaMedianaMedia
x xx
xxx
xxx
Media� punto di equilibrio centrale dell’insieme dei valor i
considerati (somma dei valori di ogni osservazione)
(numero di osservazioni)
n
Σi=1
nX =
X = media
Xi = valore i-esimo della distribuzione X
n
Σ = sommatoria di tutti i dati dal primo (i=1) a ni=1
n = numerosità totale del campione
Xi
Se i dati sono raggruppati in classi …n
Σi=1
nX =
X = media
Xi = valore i-esimo della distribuzione X
n
Σ = sommatoria di tutti i dati dal primo (i=1) a ni=1
n = numerosità totale del campione
fi Xi
fi = frequenza relativa della classe i-esima
Come si procede …I valori della variabile su cui calcolare la media sono determinati dalla somma dei limiti (inferiore e superiore) /2 dell’intervallo di classe che va moltiplicata per la frequenza ad esso associata.
Classi Xi fi Xi * fi45-49 (45+49)/2 47 1 47
40-44 (40+44)/2 42 2 84
35-39 (35+39)/2 37 3 111
30-34 (30+34)/2 32 5 160
25-29 (25+29)/2 27 4 108
20-24 (20+24)/2 22 1 22
16 532
X = 532/16= = 33.25
Mediana� Divide la distribuzione in due parti di uguale
numerosità e corrisponde al 50° percentile.� Determina semplicemente il valore che divide i
dati in due parti numericamente uguali,prescindendo dal valore dei dati e dal fatto chequesti siano bilanciati rispetto ad essa.
� Diversamente dalla media che non dividenecessariamente i dati in due partinumericamente uguali, ma li divide in base adun valore medio della variabile.
rappresenta il valore per cui si ha il picco di frequenza.
Moda
Indici di variabilità e di dispersione
Varianza
DS = Σ (x- M)2 = devianza = varianzaN-1 gradi di libertà
oscillazione media intorno alla media
SS = Σ (x- M)2 oppure Σx2 - (Σx)2
N
s2= MS = Σ (x- M)2 = devianzaN-1 gradi di libertà
Devianza scarti quadratici della media
Radice quadrata della varianza
Deviazione standard
� Gruppo A:
� Gruppo B:
11
1+0+12
2
1
0
1
0
1
0
-11
10100200
100100+0+1002
100
0
100
0
10
0
-10
-5
-5
-5
-5
-5
-5
deviazione standard
varianzadevianzascarti dalla media
Deviazione standard
varianzadevianzascarti dalla media
Media= (4+5+6)/3=
5
Media= (-5+5+15)/3=
5
Σ6
15
5
4
15Σ15
5
-5
DS=1
DS=10
Gruppi
1120
Media deviazione standard
varianzadevianzascarti dalla
media
5A
B 5 0 200 100 10
1) Perché calcoliamo iquadrati degli scarti dallamedia (devianza) ?Per poter evidenziare ledifferenze fra i gruppi.La sommatoria degli scartiè sempre uguale a 0.Calcolando la devianza ivalori negativi diventanopositivi e la somma nonsarà più 0.
2) Perché calcoliamo la deviazione standard ?L’utilizzo di scarti elevati al quadrato (devianza) rende la varianza non omogenea con l’unità di misura dei dati di partenza, pertanto si utilizza la radice quadrata delle varianze (deviazione standard).
3) Per garantire l’indipendenza delle osservazioni (dati) si calcolano i G.d.L. togliendo 1 dato al n° totale delle osservazioni.
A 4
5
6
Σ 15
B -5
5
15
Σ 15
Distribuzione normale
Distribuzione normale� unimodale� simmetrica (media, mediana e moda coincidono)� mesocurtica (la varianza è circa ¼ della media)
-3 -2 -1 0 1 2 3
68 %
95 %
99 %
Simmetrica
Se è bimodale… non c’è rimedio� Moda : rappresenta il valore per cui si ha il picco di
frequenza. Una distribuzione più essere unimodale o bimodale a seconda che sia presente un solo picco o due picchi intercalati da un avvallamento.
Bimodale
Media=Mediana
Se non è simmetrica ….Per correggere la simmetria e/o la curtosi:� se media = varianza si estrae la radice quadrata� se varianza > media si fa il log x o log x + C
(Anscombe)
Asimmetrica positivaMODA
MEDIANA
MEDIA
Asimmetria negativaMODA
MEDIANA
MEDIA
Rappresentazione della curtosi
LEPTOCURTICA
PLATICURTICA
MESOCURTICA
Teorema Bernouille
Dato un universo di media µ e deviazionestandard σ se si estraggono n campioni lamedia delle medie sarà uguale alla mediadella popolazione e l’errore standard ugualealla deviazione standard della popolazione.
Indici di posizioneper conoscere la posizione che una
osservazione occupa all’internodi una distribuzione
Primi passi …
� Calcolare il valore mediano� Stabilire se il nostro valore appartiene
nella metà inferiore o superiore di una distribuzione.
� Gli indici di posizione dividono la distribuzione in quattro (quantili), dieci (decili) o cento (percentili) parti.
Q1 Q2 Q3
Quantili (Q)
25 %25 % 25 % 25 %
D1 D2 D3 D4 D5 D6 D7 D8 D9
Decili (D)
10%
50 %
P10 P20 P30 P40 P50 P60 P70 P80 P90
Percentili (P)
10%
50 %
ALCUNE CONSIDERAZIONI
� MEDIANA = Q2 = D5 = P50 = 50 %� Q1 = P25
� Q2 = P50
� Q3 = P25
Calcolo degli indici di posizioni� Se non sono raggruppati in classi …a) Disporre i dati della distribuzione in
ordine crescenteb) Identificare la posizione mediante la
formula:
c) Identificare il valore che corrisponde alla posizione
P Perc = Perc (n +1)100
Perc = percentile (1 -99)n= numero dei dati della
distribuzione
Valore percentile = XPPerc
Calcolo degli indici di posizioni� Se sono raggruppati in classi …a) Identificare la posizione mediante la
formula:
Perc = percentile (1 -99)n= numero dei dati della distribuzionel inf = limite reale inferiore della classe che contiene il percentilefc inf = frequenza cumulata della classe precedente a quella del percentilei = ampiezza della classe che contiene il percentile (limite reale superiore
meno limite reale inferiore)f = frequenza della classe che contiene il percentile
Valore percentile= X PPerc = l inf
Perc n100
+
- fcinf ** i
f
EsercizioClassi Limiti reali fi fc3-6 7
7-10 9
11-14 5
15-18 3
24
7
16
21
24
2.5 – 6.5
6.5 – 10.5
10.5 – 14.5
14.5 – 18.5
7
7+9 =
7+9+5 =
7+9+5+3 =
Valore percentile= X PPerc = l inf
Perc n100
+
- fcinf ** i
f
1) Individuare la classe che contiene Q3 o P75
Perc n100
* = (75 * 24)100
= 18
(75 * 24)100 16 (14.5 -10.5)4
5
10.5
12.1Ricordiamoci di procedere
per interpolazione
Ranghi
� Corrispondono alle posizioni occupate dalle singole osservazioni.
� Se due o più valori sono uguali (cadono sullo stesso rango) bisogna calcolare il rango medio
� Il rango dipende dal n° delle osservazione
Ranghi percentili
� Libera le singole osservazioni dal denominatore
� Consente di confrontare direttamente la prestazione di un soggetto
* 100(n – R)
n - 1R= Rango
n = numerosità delle osservazioniR %= Rango percentile
R %=
Esempio : calcolare il rango percentile corrispondente al valore 20
� Il rango percentile del punteggio 20 corrisponde al 64% circa
=� Sotto al punteggio 20 cadono il
64% dei valori della distribuzione=
� Il punteggio 20 corrisponde in percentuale al 36 – esimo posto della distribuzione (64-100=36)
X = 27 – 11 – 26 – 12 – 24 – 16 - 21 – 20 – 17 – 14 – 13 – 22 – 19 – 18 - 15
X = 27 – 26 – 24 – 22 - 21 – 20 – 19 – 18 – 17 –16– 15 – 14 – 13 –12- 11
* 100(n – R)
n - 1R %=
* 100 =(15 – 6)
15 - 1R %=
= 64.28
top related