1
Fonti e strumenti statistici per la comunicazione
La costruzione di misure relative semplici e complesse
Prof.ssa Isabella Mingo
A.A. 2017-2018
Numeri indice complessi
Si usano quando l’obiettivo dell’analisi è quello didescrivere in modo sintetico la variazione di un insieme difenomeni connessi tra loro.
Esempi: Analizzare le variazioni dei prezzi di un insieme di beni
e/o di servizi: es. Indici dei prezzi al consumo. Analizzare le variazioni del benessere di una collettività :
es. Indici di Qualità della vita
Tali indici sono valori sintetici che quantificano le “variazionicongiunte” che possono avvenire in situazioni differentiterritoriali o temporali.
FSSC - I.Mingo 2017-2018
2
Numeri indice complessi: procedura di costruzione
Fasi:1. Scelta dei caratteri “elementari” (ad esempio quali beni e
servizi o quali aspetti della qualità della vita) dovrannoessere considerati;
2. Costruzione di indici semplici, scegliendo la “base” delrapporto, ossia la situazione a cui ciascun carattere deveessere confrontato;
3. Individuazione di un eventuale sistema di “pesi”, qualora sivoglia attribuire importanza diversa ai singoli caratterielementari presi in considerazione;
4. Scelta della formula di sintesi degli indici semplici.
FSSC - I.Mingo 2017-2018
Approfondimento:Sintesi delle informazioni quantitative
Le informazioni contenute in una matrice di dati possonoessere sintetizzate secondo i due versi della matrice, lecolonne e le righe
Gli indici di tendenza centrale (le medie), di variabilità edispersione, ecc., rappresentano dei valori di sintesi perciascuna colonna, rappresentano cioè, per ciascunavariabile, un solo valore calcolato considerando tutti i valoriassunti dalle unità statistiche rappresentate nelle righe dellamatrice;
Altri indici possono invece essere costruiti operando dellesintesi per ciascuna riga, in modo che rappresentino, perciascuna unità statistica, più variabili rilevate su di essa eposte nelle colonne della matrice.
FSSC - I.Mingo 2017-2018
3
FSC - I.Mingo 2017-2018
Matrice di dati e sintesi dei valori assunti da ciascuna unità statistica ( sintesi per ogni riga)
X =
I1
I11
I21
…
Ii1
…
In1
X1 X2 … Xj … Xk
u1 x11 x12… x1j
… x1k
u2 x21 x22… x2j
… x2k
… … … … … … …
ui xi1 xi2… xij
… xik
… … … … … … …
un xn1 xn2… xnj
… Xnk
FSSC - I.Mingo 2017-2018
FSSC - I.Mingo 2017-2018Il sole 24Ore12 dicembre 2016
4
FSSC - I.Mingo 2017-2018
http://www.ilsole24ore.com/speciali/qvita_2016_dati/home.shtml
FSSC - I.Mingo 2017-2018
Le variabili del 2016
5
FSC - I.Mingo 2017-2018
Un caso di studio Gli indici QdV secondo il Sole 24 Ore
Il concetto di qualità della vita viene:1. scomposto in sei dimensioni differenti :
• tenore di vita, affari e lavoro, servizi e ambiente, criminalità,popolazione, tempo libero
2. Operazionalizzato utilizzando trentasei variabili, sei perdimensione.
Le variabili utilizzate hanno le seguenti caratteristiche:•sono rapporti statistici, espressi in unità di misure diverse (persone,euro, domande..) con campi di variazione eterogenei;
•si muovono in direzioni diverse: alcuni di essi sono indicatori positividi qualità della vita (es. depositi bancari, importo delle pensioni,numero di ristoranti..) altri hanno invece una valenza negativa rispettoa tale concetto (es: numero di rapine, di furti, di divorzi…).E’ evidente pertanto che gli indicatori elementari non possono essereutilizzati per ottenere indici sintetici senza una preventivatrasformazione.
FSC - I.Mingo 2017-2018
Sintesi delle informazioni quantitative: problemi
Nella pratica di ricerca non è raro il caso in cui le variabiliconsiderate:
si riferiscono a unità di misura incommensurabili: numerodi persone, quantità di moneta, numero di ore, numero diabitazioni e così via. Hanno «direzione» differente (positiva o negativa)rispetto al fenomeno che quantificano .
Per una corretta procedura di sintesi è opportuno tenere sotto controllo:
•La direzione delle variabili, indicatori elementari del concetto•La diversa unità di misura variabili, indicatori elementari del concettoSpesso sono necessarie delle trasformazioni delle variabili originarie !
6
FSSC - I.Mingo 2017-2018
QdV secondo il Sole 24 Ore
La trasformazione delle variabili: i numeri indiceNel caso di indicatori positivi di qualità della vita, latrasformazione viene effettuata come rapporto dal valoremassimo e cioè
Nel caso di indicatori negativi, in cui è il valore minimo dell’indicatore adesprimere un elevata qualità della vita, il rapporto viene invertito:
=
Esempio - Metodo dei numeri indiceIndicatore di qualità nella classifica della QdV del Sole 24 Ore
4486/33126x1000=135,4
FSSC - I.Mingo 2017-2018
7
Esempio - Metodo dei numeri indice
Indicatore di disagio nella classifica della QdV del Sole 24 Ore
66,91/494,96*1000=135,2
FSSC - I.Mingo 2017-2018
EsercizioNormalizzare indicatori di disagio
Sapendo che l’indicatore % di disoccupati in alcune province consideratevaria da 1,34 a 27,74, applicando il metodo dei numeri indice utilizzatonello studio sulla Qdv del Sole 24ore, normalizzare il valore di unaprovincia che è pari a 21,41.
Si tratta di un indicatore di disagio, negativamente correlato con la qualitàdella vita, pertanto l’indicatore normalizzato sarà pari a:
valore minimo/ valore effettivo * 1000
1,34 / 21,41 *1000= 62,58
FSSC - I.Mingo 2017-2018
8
EsercizioNormalizzare indicatori di qualità
Sapendo che l’indicatore importo medio mensile delle pensioni inalcune province considerate varia da 395 euro a 849 euro,applicando il metodo dei numeri indice utilizzato nello studio sullaQdv del Sole 24ore, normalizzare il valore di una provincia che èpari a 518 euro.
Si tratta di un indicatore di qualità, positivamente correlato con laqualità della vita, pertanto l’indicatore normalizzato sarà pari a:
valore effettivo/ valore massimo *1000,
518/849 *1000= 610,13
FSSC - I.Mingo 2017-2018
EserciziNormalizzare indicatori con il metodo dei numeri indice
1- Sapendo che l’indicatore importo medio dei protesti per abitanti in alcuneprovince considerate varia da 9.17 euro a 1767 euro, applicando il metododei numeri indice utilizzato nello studio sulla Qdv del Sole 24ore,normalizzare il valore di una provincia che è pari a 102 euro.
valore minimo/ valore effettivo *10009.17/102*1000=89.90
2- Sapendo che l’indicatore “Nuove iscrizioni di imprese alla Camera dicommercio in rapporto alle cessazioni” in alcune province consideratevaria da 0.89 imprese a 2.19, applicando il metodo dei numeri indiceutilizzato nello studio sulla Qdv del Sole 24ore, normalizzare il valore diuna provincia che è pari a 1.07 .
valore effettivo/valore massimo *10001.07/2.19*1000=488.58
FSSC - I.Mingo 2017-2018
9
Indici sintetici di dimensione e di Qdv
Per ogni dimensione l’indice sintetico perciascuna provincia è dato dalla media aritmeticasemplice dei 6 indicatori elementari trasformatiche appartengono a quella dimensione.
L’indice finale di Qdv è dato dalla mediaaritmetica semplice di tutti i 36 indicatorielementari trasformati.
FSSC - I.Mingo 2017-2018
provincia tenore di vita (media dei 6 indicatori elementari trasformati)
affari e lavoro ( media dei 6 indicatori elementari trasformati)
popolazione (media dei 6 indicatori elementari trasformati)
servizi (media dei 6 indicatori elementari trasformati)
criminalità (media dei 6 indicatori elementari trasformati)
tempo libero (media dei 6 indicatori elementari trasformati)
Bologna 672 588,48 355,53 581,95 193,03 641,72 505,45Milano 797,88 568,82 349,22 546,2 218,15 546,72 504,50Trento 550,25 529,17 471,68 559,68 478,45 431,33 503,43Forlì 595,78 456,55 400,07 552,9 360 637,93 500,54Firenze 610,95 514,2 416,6 563,3 237,42 643,2 497,61Siena 554,63 433,62 460,83 540,28 432,8 544,3 494,41Aosta 702,85 397,42 467,15 497,08 369,95 527,38 493,64Trieste 596,78 517,5 304,52 685,95 313,6 531,7 491,68Bolzano 542,93 541,88 376,73 551,47 476,05 438,02 487,85Gorizia 598,05 479,27 351,15 534,28 489,33 468,27 486,73….. ….. ….. ….. ….. ….. ….. …..
Indici Medi di dimensione Indice QDV complessivo (media aritmetica dei 6 Indici medi di dimensione)
Tab.FSSC - I.Mingo 2017-2018
10
QdV Sole 24 Ore
Schema del processo di sintesi: matrici e procedure
Matrice indicatori elementariProvince x 36 indicatori elementari
Matrice indicatori elementari trasformatiProvince x 36 indicatori elementari trasformati
Matrice indici sintetici di dimensione
Province x 6 indici sintetici
Matrice indice sintetico di QDV(vettore colonna)Province x 1 indice sintetico
X =
Xnk…Xnj…Xn2Xn1Un
…………………Xik…Xij…Xi2Xi1Ui
…………………X2k…X2j…X22X21U2
X1k…X1j…X12X11U1
Vk…Vj…V2V1
Xnk…Xnj…Xn2Xn1Un
…………………Xik…Xij…Xi2Xi1Ui
…………………X2k…X2j…X22X21U2
X1k…X1j…X12X11U1
Vk…Vj…V2V1
In1
…Ii1…I21
I11
I1
In1
…Ii1…I21
I11
I1
Trasformazione in numeri indice
Sintesi
Sintesi
FSSC - I.Mingo 2017-2018
Calcolo dell’Indice sintetico di QdvEsercizio
FSSC- I.Mingo 2017-2018
A partire dai punteggi della tabella, si applichi la procedura di sintesi utilizzata dal Sole 24Ore, per calcolare l’indice sintetico di qualità della vita per le seguenti Provincie. In quale Provincia si vive meglio?
L’indice sintetico di Qdv per ciascuna provincia sarà uguale alla media aritmetica dei punteggi ottenuti nelle diverse sottodimensioni. L’indice di Ragusa, ad esempio, sarà:
QDVRG= (521+427+540+539+307+346)/6= 466,67Indice di QDV
Ragusa 446,67Perugia 536,67Roma 557,50
11
La costruzione di indici complessi: fasi
In definitiva, la costruzione di indici compelssi compositi passa per le fasiseguenti:
Individuazione delle dimensioni ritenute rilevanti per la misurazionedel fenomeno
Operativizzazione delle singole dimensioni (costruzione e/o sceltadelle variabili)
Costruzione di indici semplici ed eventuale trasformazione pereliminare l’effetto delle diverse unità di misura, o della diversadirezione
Eventuale ponderazione delle dimensioni o nel loro ambito degliindici semplici (ponderazione)
Ricombinazione degli indici semplici per dimensione (scelta delmetodo di sintesi)
Ricombinazione degli indici di dimensione nell’indice sintetico finale(scelta del metodo di sintesi).
FSSC - I.Mingo 2017-2018
Ancora sui metodi di trasformazione
Per eliminare i problemi relativi alle diverse unità di misura Trasformare i caratteri in numeri indice (es.
QdV sole 24 ore)
Per controllarne anche la diversa variabilità si può: Relativizzare i valori con il campo di variazione Standardizzare
FSSC - I.Mingo 2017-2018
12
La relativizzazione con il campo di variazione
Tra i diversi metodi utilizzabili per eliminare l’influenza della diversità delcampo di variazione, si può adottare il seguente metodo che trasformala distribuzione di ogni variabile in modo che il suo valore minimo valga0, il suo valore massimo valga 1 o multipli di 10 , mentre gli altri valorivengono riscalati e ricollocati tra questi due estremi:
Questo tipo di trasformazione è utile nei casi in cui si voglionoconfrontare distribuzioni che presentano campi di variazioni differenti.
FSSC - I.Mingo 2017-2018
Rendere omogenei i campi di variazioneEsempio
Tabella 10.17. Trasformazione del campo di variazione: esempio.
Regione
Speranza di vita
Reddito Pro-
capite
Speranza di vita
trasformato
Reddito pro-capite
trasformato Regione
A 82,5 770 0,72 0,16
Regione B
77,4 2400 0,00 1,00
Regione C
84,5 1670 1,00 0,63
Regione D
79,6 450 0,31 0,00
Regione E
78,2 560 0,11 0,06
Min 77,4 450 0,00 0,00 Max 84,5 2400 1,00 1,00
FSSC - I.Mingo 2017-2018
13
Relativizzare con il campo di variazione esercizio
Si trasformi la seguente distribuzione in modo da ottenere una nuova variabile con min=0 e max=1
Es.
FSSC - I.Mingo 2017-2018
Normalizzare la variabilità: il metodo della standardizzazione
Seguendo questo metodo i valori delle variabili vengono espressicome differenza dalla media aritmetica e rapportati allo scartoquadratico medio, in modo da ottenere una nuova variabile(dettastandardizzata) con media 0 e varianza pari a 1.
zij = (xij – Mx)/σ
M= media aritmeticaσ = scarto quadratico medio
A seguito di questa trasformazione i valori originari inferiori alla media diventano negativi mentre quelli superiori positivi.
Gli indicatori così trasformati risultano liberati dall’unità di misura e dalla differente variabilità, in quanto ciascun indicatore presenta media uguale a 0 e varianza unitaria
FSSC - I.Mingo 2017-2018
14
FSC - I.Mingo 2017-2018
Metodo della standardizzazione: esempio
FSSC - I.Mingo 2017-2018
EsercizioStandardizzare un valore
Sapendo che la media di una variabile X è pari a 1550 e lo scarto quadratico medio è 8,5, calcolare il punteggio standardizzato dell’unità statistica i che presenta il valore x=1140.
La formula di standardizzazione è: zi = (xi – Mx)/σ
Nel nostro caso :zi=(1140 – 1550)/ 8,5 = - 48,24.
15
EserciziStandardizzare un valore
Sapendo che la media di una variabile X è pari a 50.5 e lo scarto quadratico medio è 5.5, calcolare il punteggio standardizzato del valore x= 75.
z= (75 – 50.5)/ 5.5 = 4.45
Sapendo che la media di una variabile X è pari a 180 e lo scarto quadratico medio è 9, calcolare il punteggio standardizzato del valore x= 135.
z= (135 – 180)/ 9 = -5
FSSC - I.Mingo 2017-2018
Esercizio
FSSC-FSSC - I.Mingo 2017-2018
Trasformare il seguente carattere, che ha media 118,65 e = 10, 39, applicando: 1- Il metodo della standardizzazione (2,5 punti) 2- La relativizzazione con il campo di variazione (2,5 punti) (esplicitare in entrambi i casi le caratteristiche della distribuzione ottenuta e la formula applicata.)
prov1 X1 Trend delitti Z1 (X1standardizzato
Y1 (X1 relativizzato con il campo di variazione)
Avellino 125,60 Catania 99,36 Enna 113,97 Pesaro 132,67 Sondrio 121,67
16
FSSC - I.Mingo 2017-2018
Esercizi
Sapendo che l’indicatore % di disoccupati in alcune province considerate varia da 1,74 a 28,15,applicando il metodo dei numeri indice utilizzato nello studio sulla Qdv del Sole 24ore, normalizzare ilvalore di una provincia che è pari a 20,35.
Sapendo che l’indicatore Associazioni culturali su 1000 abitanti in alcune province considerate variada da 40,5 a 96,38 abitanti, applicando il metodo dei numeri indice utilizzato nello studio sulla Qdvdel Sole 24ore, normalizzare il valore di una provincia che è pari a 53,34.
Applicando il metodo della relativizzazione con campo di variazione, si relativizzi l'indicatoreSperanza di vita alla nascita che in un Paese assume un valore pari a 79, sapendo che il minimo è 25e il massimo 86.
Applicando il metodo della relativizzazione con campo di variazione, si relativizzi l'indicatoreRapporto lordo di iscrizione che in un Paese assume un valore pari a 85., sapendo che il minimo è 15e il massimo 98.
Sapendo che la media di una variabile X è pari a 80 e lo scarto quadratico medio è 1,5, calcolare ilpunteggio standardizzato del valore x= 86,4.
Sapendo che la media di una variabile X è pari a 18 e lo scarto quadratico medio è 2, calcolare il punteggio standardizzato del valore x= 24.
Esempi di uso di indici compositi:il BES Il progetto BES, realizzato dall’Istat con lo scopo di individuare
gli indicatori statistici più adeguati al fine di misurare le dimensioni del «Benessere equo e sostenibile»
Complessivamente sono stati individuati 12 domini e 130indicatori, che tengono conto sia di aspetti che hanno undiretto impatto sul benessere umano ed ambientale sia di quelliche misurano gli elementi funzionali al miglioramento delbenessere della collettività e dell’ambiente che la circonda.
Questi indicatori sono diventati strumenti di programmazione e valutazione della politica economica nazionale, come previsto dalla riforma della Legge di Bilancio, entrata in vigore nel settembre 2015.
FSSC - I.Mingo 2017-2018
17
I dominio del BES
FSSC - I.Mingo 2017-2018
Costruzione di indici compositi per alcuni domini
FSSC - I.Mingo 2017-2018
18
Indici compositi nel tempo
FSSC - I.Mingo 2017-2018
Diagramma a radar: caratteristiche
FSSC- Mingo 2017-2018
• E’ un grafico bidimensionale in cui si rappresenta unasequenza di raggi che si originano da un puntocentrale e formano angoli uguali tra loro.
• Ogni raggio può rappresentare una delle unitàstatistiche, oppure una diversa modalità di una o piùcaratteri.
• La distanza dal centro a ciascuno dei punti segnati suogni raggio è proporzionale all’intensità o allafrequenza che si rappresenta, rispetto al valoremassimo raggiungibile.
• I punti sui raggi vengono congiunti con segmenti, cosìche il grafico ha la forma di una stella o di unaragnatela.
19
FSSC - I.Mingo 2017-2018
Indici compositi nel tempoper ripartizione
Analisi dei dati per la comunicazione
Introduzione all’analisi bivariata: il caso di caratteri qualitativi
Prof.ssa Isabella Mingo
A.A. 2017-2018
20
Che cosa è l’analisi bivariata?
ADC-FSSC
E’ lo studio congiunto di due caratteri• Esempio nel casi di caratteri qualitativi:
I valori delle celle derivano dall’analisi della tabella unitaria!
Distribuzione doppia di frequenze: caratteristiche
Tabella che consente di sintetizzare l’informazionedisponibile su due caratteri osservati contemporaneamentesul medesimo collettivo di n u.s.
In colonna : Lista di modalità del carattere 1
In riga : Lista di modalità del carattere 2
Nella tabella si considerano tutte le possibili coppie dimodalità (una del car. 1 ed una del car. 2).
I valori rappresentati sono il conteggio, ossia le frequenzeassolute, del numero di u.s. del collettivo considerato chepresentano una coppia di modalità dei 2 caratteri.
ADC-FSSC
21
Distribuzione doppia di frequenze: struttura
Distribuzioni marginali di riga e di colonna
Distribuzioni condizionate
Ha un numero di righe uguale al numero di modalità dellavariabile rappresentata in riga più 1 e un numero di colonneuguale a quello delle modalità della variabile rappresentata incolonna più 1.
ADC-FSSC
Dalla distribuzione unitaria multipla alla distribuzione doppia di frequenza: esempio
ADC-FSSC
1- Costruiamo un tabella che ha:• un numero di righe uguale al numero di
modalità della variabile che vogliamorappresentare in riga più 1 per i totali dicolonna
• un numero di colonne uguale a quellodelle modalità della variabile che vogliamorappresentare in colonna più 1 per i totalidi riga.
22
Dalla distribuzione unitaria multipla alla distribuzione doppia di frequenza: esercizio (segue)
ADC-FSSC
2 – Contiamo per ciascun carattere le unitàche presentano una stessa modalità escriviamo i totali nelle rispettive cellemarginali della tabella.3- Contiamo le unità statistiche chepresentano congiuntamente le modalità a duea due e scriviamo le frequenze nelle rispettivecelle condizionate4- verifichiamo che le somme dei valori sianocoerenti.
Sesso Uso_PC1-Si 2-No Totale
1-Maschio somma dei maschi2-Femmina somma delle femmineTotale somma dei SI somma dei NO Totale unità
Frequenze assolute del carattere XDistribuzione marginale di X
Frequenze assolute del carattere YDistribuzione marginale di Y
x 1 x 2 … x j … x K
y 1 n 11 n 12 … n 1j … n 1K n 1.y 2 n 21 n 22 … n 2j … n 2K n 2.: : : … : … : :
y i n i 1 n i 2 … n ij … n iK n i .: : : … : … : :
y H n H 1 n H 2 … n Hj … n HK n H .n .1 n .2 … n .j … n .K n
X
Y
Tot.
Tot.
ADC-FSSC
…la formalizzazione
23
…la formalizzazione
x 1 x 2 … x j … x K
y 1 n 11 n 12 … n 1j … n 1K
y 2 n 21 n 22 … n 2j … n 2K
: : : … : … :y i n i 1 n i 2 … n ij … n iK
: : : … : … :y H n H 1 n H 2 … n Hj … n HK
n
Y
Tot.
Tot.
X
Frequenze assoluta della coppia di modalità (yi, xj)
ADC-FSSC
x 1 x 2 … x j … x K
y 1 n 11 n 12 … n 1j … n 1K n 1.y 2 n 21 n 22 … n 2j … n 2K n 2.: : : … : … : :
y i n i 1 n i 2 … n ij … n iK n i .: : : … : … : :
y H n H 1 n H 2 … n Hj … n HK n H .n .1 n .2 … n .j … n .K n
X
Y
Tot.
Tot.
Tot. Somma Frequenze n.j
Tot. Somma Frequenze ni.
Colonna jRiga i
ADC-FSSC
24
Esempio
CDL 1 2 3 4 5 6 7 TotaleSTC 12 19 50 47 20 3 1 152SCPO 2 23 49 32 12 5 1 124SCOSV 1 1 4 1 0 0 0 7Totale 15 43 103 80 32 8 2 283
Numero Corsi Frequentati
Distribuzione degli studenti di Scienze dellaComunicazione frequentanti il corso di Analisidei dati nell’a.a. 2011/2012 per Corso di Laureae Numero di Corsi Frequentati
n.6n24
n2.
nADC-FSSC
CDL 1 2 3 4 5 6 7 TotaleSTC 12 19 50 47 20 3 1 152SCPO 2 23 49 32 12 5 1 124SCOSV 1 1 4 1 0 0 0 7Totale 15 43 103 80 32 8 2 283
Numero Corsi Frequentati
Distribuzione condizionata del carattere CDL alla modalità x5=5 del carattereNum.Corsi Freq.
Distribuzione condizionata del carattere Num.Corsi Freq. alla modalità y1=STC del carattere CDL
Esempio
ADC-FSSC
25
Osserviamo che…
CDL 1 2 3 4 5 6 7 TotaleSTC 12 19 50 47 20 3 1 152SCPO 2 23 49 32 12 5 1 124SCOSV 1 1 4 1 0 0 0 7Totale 15 43 103 80 32 8 2 283
Numero Corsi Frequentati
CDL nj
STC 152
SCPO 124
SCOSV 7
Totale 283
Num. Corsi Freq. nj
1 15
2 43
3 103
4 80
5 32
6 8
7 2
Totale 283
Distribuzione marginale del CDL
• Distribuzione marginale del Num. Corsi Freq.
AdC
Frequenze assolute
FSC
Tipi di distribuzioni doppie: assolute e percentuali
Frequenze percentuali sul totale (n=43290)20757/43290 *100=47,9%
1179/43290 *100=2,7%
26
Frequenze percentuali (sui totali=ni. ) profili di riga %
ADC-FSSC
Tipi di distribuzioni doppie : profili di riga %
Frequenze assolute
5370/43290 *100=12,4%
2514/22533 *100=11,2%
2856/20757 *100=13,8%
Frequenze percentuali (sui totali=n.j ) : profili di colonna %
FSC
Tipi di distribuzioni doppie : profili di colonna%
Frequenze assolute
22533/43290 *100=52,1%18947/35669*100=63,1% 2514/5370*100=46,8%1072/2251*100=47,6