universita’ degli studi di perugia statistica medica … didattico... · la trasformazione da...
TRANSCRIPT
STATISTICA MEDICA
20/11/2014
Prof.ssa Donatella Siepi
tel: 075 5853525
UNIVERSITA’ DEGLI
STUDI DI PERUGIA
3° LEZIONE
Statistica descrittiva
C
Rilevazione dei dati Rappresentazione dei dati Elaborazione dei dati
STATISTICA DESCRITTIVA
piano tabelle grafici Medie e indici di
variabilitàA
D
E
B
C
A
D
E
B
In seguito
Presentazione dei dati
• Un insieme di misure è detto serie
statistica o serie dei dati.
Peso 100 neonati
3,2 3,0 2,9 2,8 3,1 3,1 3,1 3,1 3,1 3,4
2,9 3,4 2,5 3,0 3,5 3,1 3,0 3,2 3,6 3,3
3,1 3,3 3,1 3,4 2,9 3,2 2,8 3,3 3,2 2,8
2,9 2,6 3,0 3,1 3,1 3,0 3,0 2,9 2,9 3,1
2,8 3,1 3,3 3,0 2,8 3,1 3,5 3,2 3,3 2,8
3,0 3,3 3,1 2,7 3,0 3,2 3,6 2,9 2,9 3,4
3,3 3,1 3,1 3,2 2,9 3,0 3,4 2,7 3,2 3,5
3,4 3,2 3,0 2,6 3,3 3,5 3,1 2,8 3,4 3,0
2,7 3,0 3,2 3,2 2,9 3,1 2,7 3,1 3,0 3,3
3,3 3,0 2,9 3,2 3,3 3,2 3,7 3,2 3,1 3,2
Tabelle di frequenza
• Una sua prima ed elementare elaborazione può
essere una distribuzione ordinata di tutti i valori, in
modo crescente o decrescente, detta seriazione.
• Il valore minimo e il valore massimo insieme
permettono di individuare immediatamente il
campo (od intervallo) di variazione.
Tabelle di frequenza
2,5 2,6 2,6 2,7 2,7 2,7 2,7 2,8 2,8 2,8
2,8 2,8 2,8 2,8 2,9 2,9 2,9 2,9 2,9 2,9
2,9 2,9 2,9 2,9 2,9 3,0 3,0 3,0 3,0 3,0
3,0 3,0 3,0 3,0 3,0 3,0 3,0 3,0 3,0 3,0
3,1 3,1 3,1 3,1 3,1 3,1 3,1 3,1 3,1 3,1
3,1 3,1 3,1 3,1 3,1 3,1 3,1 3,1 3,1 3,1
3,2 3,2 3,2 3,2 3,2 3,2 3,2 3,2 3,2 3,2
3,2 3,2 3,2 3,2 3,2 3,3 3,3 3,3 3,3 3,3
3,3 3,3 3,3 3,3 3,3 3,3 3,4 3,4 3,4 3,4
3,4 3,4 3,4 3,5 3,5 3,5 3,5 3,6 3,6 3,7
Presentazioni dei dati
• Tabelle di frequenza
• Aggregazione di classi di frequenza
• Distribuzione e frequenza delle
osservazioni di conteggio
• Successivamente, la serie può essere
raggruppata in classi, contando quanti
valori od unità statistiche appartengono
ad ogni gruppo o categoria.
• Si ottiene una distribuzione di frequenza
o di intensità, detta anche
semplicemente distribuzione.
Peso 100 neonati
2,45-2,54
2,55-2,64
2,65-2,74
2,75-2,84
2,85-2,94
2,95-3,04
3,05-3,14
3,15-3,24
3,25-3,34
3,35-3,44
3,45-3,54
3,55-3,64
3,65-3,74
2,5
2,6
2,7
2,8
2,9
3,0
3,1
3,2
3,3
3,4
3,5
3,6
3,7
I
II
IIII
IIIIIII
IIIIIIIIIII
IIIIIIIIIIIIIII
IIIIIIIIIIIIIIIIIIII
IIIIIIIIIIIIIII
IIIIIIIIIII
IIIIIII
IIII
II
I
1
2
4
7
11
15
20
15
11
7
4
2
1
CLASSE FREQUENZA DI CONTEGGI FEREQUENZA
CLASSE
-la classe è una modalità di espressione (in
questo caso un valore o conteggio);
- la frequenza assoluta della classe è il numero
di volte con la quale compare ogni valore;
- la frequenza relativa della classe è la sua
frequenza assoluta divisa per il numero totale;
- la frequenza cumulata di una classe (che può
essere stimata con quelle assolute e/o con
quelle relative) è la somma di tutte le frequenze
delle classi minori con quella della classe stessa.
La trasformazione da frequenza assoluta a frequenza
relativa risulta utile quando si vogliono confrontare due o più
distribuzioni, che hanno un differente numero complessivo di
osservazioni.
La frequenza cumulata offre informazioni importanti quando
si intende stimare il numero totale di osservazioni inferiore (o
superiore) ad un valore prefissato.
La distribuzione dei dati e la distribuzione delle frequenze
cumulate forniscono informazioni non dissimili, essendo
possibile passare con facilità dall’una all’altra. Sono diverse
nella loro forma, come si vedrà con maggiore evidenza nelle
rappresentazioni grafiche.
La prima ha una forma a campana, la seconda una forma
a S, di tipo asintotico; si prestano ad analisi differenti e la
scelta è fatta sulla base del loro uso statistico.
Tabella semplice
Frequenza assoluta
(peso) di un evento è il
numero totale di volte che
essa si presenta nelle
unità rilevate
Voto
(modalità)
Allievi
(frequenza)
4 3
5 5
6 8
7 5
8 3
Frequenze
• Frequenza relativa, o frequenza di un evento
è il rapporto fra la sua frequenza assoluta e il
numero totale delle unità rilevate, se moltiplicata
per 100 è detta frequenza relativa percentuale
Voti Allievi
(frequenza)
Frequenza
relativa
Frequenza
relativa %
4 2 0.09 9
5 4 0.18 18
6 8 0.36 36
7 5 0.23 23
8 3 0.14 14
Totale 22 1 100
2 / 22 0.09
4 / 22 0.18
….
????????????• Matrice dei dati o
serie di dati
• Tabelle semplici
• Tabelle a doppia
entrata
• Curve di frequenza
• Grafici a dispersione
• Areogrammi
• Cartogrammi
• Istogrammi
• Grafici a barre
• Poligoni
Rappresentazione dei dati
• Rappresentazione dei dati (grafici)perché con l’immagine si riesce a dare un quadro
generale della situazione indagata riuscendo a dare
informazioni facilmente, rapidamente comprensibili.
• hanno però l’inconveniente fondamentale di
mancare di precisione e soprattutto di essere
soggettive, quindi di permettere letture diverse
degli stessi dati.
• Ai fini di una elaborazione mediante i test e di un
confronto dettagliato dei parametri, è sempre preferibile
la tabella, che riporta i dati esatti.
Rappresentazione dei dati
• Rappresentazione dei dati (grafici)
Le rappresentazioni grafiche proposte sono
numerose. Esse debbono essere scelte in
rapporto al tipo di dati e quindi alla scala
utilizzata.
• Quali grafici?Istogrammi, diagrammi a torta, grafici cartesiani,
cartogrammi, ecc.
i motivi che devono spingere il
ricercatore a costruire rappresentazioni
grafiche dei suoi dati:
• - un esame preliminare delle caratteristiche
della distribuzione,
• - un suggerimento per il test da scegliere,
adeguato appunto ai dati raccolti,
• - un aiuto alla comprensione delle
conclusioni,
• - senza per questo essere un test, ma solo
una descrizione visiva.
Tabelle e grafici
Tabelle ?
QUALI?
Grafici?Consumo carni
carni rosse
24%
carni
bianche
18%cacciagion
e
9%
pesce
12%
altro
37%
carni rosse carni bianche cacciagione pesce altroQUANDO????
Le rappresentazioni grafiche hanno l’obiettivo di illustrare, mediante:
-figure,
-linee o segmenti,
-superfici o aree,
-solidi,
-simboli convenzionali
-ecc.
una distribuzione di frequenze o di intensità in funzione delle modalità di uno o più caratteri.
a) Obiettivo
Visualizzazione immediata dell’andamento del fenomeno e della struttura della distribuzione, che consente una efficace e globale descrizione dei dati;
-Sintesi e quindi possibilità, in poco spazio, di confrontare più distribuzioni (curve, spezzate ecc.);
-Potenzialità investigative:
• mette in risalto i casi ‘‘anomali’’ (particolari picchigrafici), imputabili a errori nei dati o a effettivi casi anomali, che vanno ulteriormente approfonditi,
• evidenzia le correlazioni tra caratteri aventi tra loro un legame logico,
• permette di individuare andamenti di fondo (trend)interpolabili con funzioni matematiche (ad es. curva normale, retta ecc.).
Potenzialità della rappresentazione grafica
Per ogni distribuzione statistica semplice o doppia o multipla esiste il tipo di rappresentazione grafica adatta e una stessa distribuzione può essere rappresentata con più tipologie di grafico.
In generale esistono dei vincoli tra tipo di rappresentazione grafica e livello di misurazione dei caratteri da rappresentare che vanno rispettati affinché questa sia corretta, ossia fornisca un’immagine visiva quanto più possibile fedele del fenomeno e della sua distribuzione statistica.
Affinché una rappresentazione grafica sia utile ed efficace dovrebbe contenere con immediatezza e chiarezza tutte le informazioni necessarie alla comprensione dei dati in essa rappresentati.
Diverse possibilità di rappresentazione a
seconda del livello di misurazione dei
caratteri
Le componenti di un grafico• I dati: sono rappresentati in barre, linee, aree o punti.
• Le componenti di supporto: consentono la comprensione deidati:
− Il titolo del grafico
− I titoli degli assi
− Le etichette degli assi
− L’unità di misura dei dati
− La griglia
− La legenda
− Le etichette dei dati
− Le note
− La fonte dei dati.
• Gli elementi decorativi: non sono legati ai dati.
Le componenti di supporto• Il titolo del grafico deve essere breve e coinciso.
Ne esistono di due tipi:
• Il titolo informativo contiene le informazioni necessarieper comprendere i dati. Risponde alle tre domande:“Cosa?”, Dove?” e “Quando?”.
p.e. Tasso di disoccupazione in Italia, anni 2009-2012
• Il titolo descrittivo sintetizza in poche parole il trend oil pattern rappresentato nel grafico.
p.e. L’aumento della disoccupazione in Italia dal 2009al 2012.
• I titoli degli assi identificano le mutabili o le variabilirappresentate dagli assi. Se si possono evincere dal titolo delgrafico non è necessario ripeterli.
• Le etichette degli assi identificano le modalità o i valorirappresentati nel grafico.
Le componenti di supporto
• L’unità di misura dei dati (p.e. “in migliaia” , “%” etc.).
Se l’unità di misura è ovvia, non è necessario specificarla(p.e. “anni” per le serie storiche).
• La griglia può essere aggiunta per agevolare la lettura e ilconfronto dei dati.
• La legenda identifica simboli, tratteggi o colori usati perrappresentare i dati.
• Le etichette dei dati visualizzate sopra o vicino alle barre, allearee o alle linee facilitano la lettura del grafico.
• Le note possono essere aggiunte per fornire definizioni oinformazioni sulla metodologia.
• La fonte di provenienza dei dati.
La rilevanza dei datiPer massimizzare l’efficacia di un grafico l’attenzione deveessere concentrata sui dati.
Pertanto le componenti di supporto:
• Devono essere presenti solo se necessarie: titoli degli assi,legende e etichette in alcuni casi possono essere essenzialiper la comprensione del grafico, ma in altri possono esseredel tutto inutili.
• Devono essere lievi: è preferibile usare linee più leggere pergli assi e per la griglia e linee più marcate per i dati.
Gli effetti decorativi non devono allontanare l’attenzione dellettore dai dati.
La rilevanza dei datiUn grafico confuso
15
25
10
0
10
20
30
A B C
Serie1
Un grafico chiaro
10
15
25
0
10
20
30
A B C
Il grafico a destra è più facileda leggere.Il ricorso a poche componentidi supporto permette diconcentrare l’attenzione suidati.
Nel grafico a sinistra tutte lecomponenti hanno il massimoimpatto.Il risultato è un grafico confuso,difficile da leggere anche sesono presenti solo 3 valori.
a) Grafici a barre
b) Diagrammi circolari
c) Diagrammi in coordinate polari
d) Cartogrammi, mappe tematiche
Rappresentazioni grafiche di
caratteri qualitativi
I grafici a barre (o ortogrammi) sono impiegati per rappresentaregraficamente serie sconnesse o rettilinee e possono essere di duetipi:
-A colonne, se sono costituiti da una successione di colonne,segmenti verticali o rettangoli (a base uguale o arbitraria)equidistanti, in numero pari alle modalità del carattere, e hannoaltezza uguale o proporzionale alla frequenza (assoluta o relativa)o all’intensità della modalità da rappresentare;
-A nastri, se sono costituiti da tanti nastri (segmenti orizzontali,rettangoli) sovrapposti ed equidistanti, in numero pari allemodalità del carattere, e hanno lunghezza uguale o proporzionalealla frequenza (assoluta o relativa) o all’intensità della modalitàda rappresentare.
I grafici a barre sono pertanto caratterizzati dall’avere un soloasse (verticale nel caso a colonne, orizzontale nel caso a nastri)in scala graduata, secondo l’unità di misura che si è scelta perrappresentare le frequenze o intensità. Sull’altro asse, invece,figureranno le modalità (qualitative), per convenzioneequidistanti.
Grafici a barre
Se la rappresentazione grafica riguarda una serie sconnessa, l’ordinein cui saranno poste le modalità è arbitrario; se si tratta invece diuna serie rettilinea (es. titolo di studio), le modalità saranno postenell’ordine naturale che esse presentano nella serie.
Ortogramma a colonne Ortogramma a nastri
Grafici a barre
I diagrammi circolari (o aereogrammi) per la loro forma circolare,sono comunemente noti come ‘‘diagrammi a torta’’.
Sono particolarmente adatti alle serie sconnesse o rettilinee.
Sono efficaci per mettere in evidenza l’importanza relativa dellesingole modalità rispetto al totale.
Ne esistono di vari tipi e principalmente:
-A spicchi o settori variabili, con angoli al centro corrispondentialle frequenze assolute ( o relative) delle singole modalità e raggiofisso;
-A spicchi o settori fissi, con angoli al centro uguali e raggiovariabile corrispondente alle frequenze assolute (o relative) dellesingole modalità.
Diagrammi circolari
In questa rappresentazione grafica sia il punto di partenza
sulla superficie circolare sia l’ordine della modalità (spicchi)
è arbitrario.
Rappresentazione grafica particolarmente idonea nel caso
di caratteri qualitativi ordinati (es. graduatorie), in cui l’ordinamento
è stabilito a priori in funzione delle frequenze assolute.
Diagrammi circolari
Si utilizzano per rappresentare serie cicliche.
Le serie cicliche sono distribuzioni di mutabili che dispongono di unordinamento naturale ma non di una prima e un’ultima modalità.
Esempio. I nati, i matrimoni, le vendite di determinati prodotti,fenomeni astronomici o atmosferici e così via secondo i mesidell’anno, i giorni della settimana ecc.
Se il carattere ciclico puòconsiderarsi continuo (ossiasoggetto a subire variazionicontinue nel tempo) sipossono congiungere gliestremi dei raggi vettori al finedi dare maggiore rilievoall’andamento del fenomeno.
Diagrammi in coordinate polari
I cartogrammi sono grafici utili per rappresentare serie territoriali.
Per costruire un cartogramma occorre disporre di una carta geografica o topografica in cui siano chiaramente delimitate le diverse zone, regioni, circoscrizioni (geografiche, politiche, amministrative) rispetto alle quali viene analizzata l’intensità o la frequenza di uno o più caratteri (es. nati, morti, reddito pro capite, secondo le Regioni, Province, Comuni).
Cartogrammi, mappe tematiche
Le mappe tematiche consentono, anche se molto empiricamente e in prima approssimazione, di tener conto dell’autocorrelazione spaziale, intesa come possibilità che un fenomeno che interessa un certo territorio sia influenzato nelle sue manifestazioni dalla contiguità spaziale esistente tra i luoghi in cui il fenomeno è osservato.
Cartogrammi, mappe tematiche
a) Istogrammi
b) Diagrammi cartesiani a segmenti
c) Poligono e curve di frequenza per variabili continue
d) Rappresentazioni di tipo informatico:
- a ramo e foglia (stem and leaf plot)
- a scatola (boxplot)
- le facce di Chernoff
- ideogrammi o pictogrammi
Rappresentazioni grafiche di
caratteri quantitativi
Gli istogrammi si impiegano per rappresentare graficamentedistribuzioni di frequenza di caratteri quantitativi le cui modalitàsono costituite da classi di valori.
A tal fine occorre distinguere due casi, ovvero:
-Le classi di valori hanno uguale ampiezza. In questo caso avremotanti rettangoli contigui, ciascuno avente base uguale all’ampiezzadella classe e altezza uguale o proporzionale alla frequenza(assoluta o relativa) assunta nell’insieme delle unità della classe;
L’ipotesi di base su cui sifonda la rappresentazioneper istogrammi è che leunità classificate in ciascunaclasse di valori siano in essaequidistribuite.
Istogrammi
Per rendere più evidente l’andamento e la forma delladistribuzione, si possono congiungere con segmenti di retta i punticentrali dei lati superiori dei rettangoli ottenendo una lineaspezzata detta poligono di frequenza, la quale deve essere chiusatoccando l’asse delle ascisse all’esterno delle classi estreme, inmodo che l’area all’interno del poligono di frequenza equivalga aquella dell’istogramma.
- Le classi di valori hanno diversa ampiezza. In quest’altro casoavremo una serie di rettangoli aventi basi diverse ugualiall’ampiezza delle classi e altezze da calcolarsi, in modo che lefrequenze siano proporzionali alle aree dei rispettivi rettangoli.
In ordinata, pertanto, avremole cosiddette densità difrequenza date dal rapportotra la frequenza (assoluta orelativa) di ciascuna classe ela relativa ampiezza.
Istogrammi
POLIGONI• I poligoni sono figure simili
agli istogrammi e sono
utilizzati di norma per la
rappresentazione di valori
relativi o di percentuali, in
quanto è implicito che l’area
totale sottesa sia uguale a 1
o 100%.
• Come nel caso degli
istogrammi, l'asse orizzontale
rappresenta il fenomeno,
mentre l'asse verticale
rappresenta la proporzione o
percentuale di ogni classe.
Le distribuzioni cumulate sono rappresentate sia con istogrammi cumulati sia
con poligoni cumulati.
Sono impiegati per rappresentare graficamente caratteriquantitativi discreti, non divisi in classi, e possono configurarsi asegmenti verticali.
Esempio. Numero dei componenti per famiglia, numero dellestanze delle abitazioni, numero di unità locali delle aziende e cosìvia.
Essi si costruiscono come gli usuali diagrammi cartesiani aventidue assi perpendicolari: l’asse delle ascisse (x) e l’asse delleordinate (y), aventi origine comune in zero. Ogni coppia ordinatadi valori (xi,yi) determinerà un punto nel piano e l’insieme di tuttele coppie (xi = modalità quantitativa i-esima, yi = frequenza dellamodalità i-esima) determinerà l’insieme dei punti nel piano checostituiscono la rappresentazione grafica della distribuzioneconsiderata.
Per rendere maggiormente visibili tali punti, si tracciano deisegmenti verticali congiungenti l’ascissa (xi) con il punto del pianocorrispondente all’ordinata (yi).
Diagrammi cartesiani a segmenti
E’ da notare che in questo caso è scorretto costruire il poligonoo spezzata di frequenza congiungendo tra loro i punti poiché ilcarattere considerato è discreto e quindi, per sua natura, nonpossiede i valori intermedi a quelli indicati dalle modalitàquantitative. Una spezzata di frequenza che unisse tra loro lemodalità, infatti, attribuirebbe anche valori intermedi allemodalità stesse.
Diagrammi cartesiani a segmenti
I diagrammi cartesiani ortogonali sono impiegati anche perrappresentare graficamente i caratteri quantitativi continui (comead esempio età, prezzi) o, nel caso delle serie storiche, per queicaratteri che si suppone si modifichino con continuità nel tempo.
La costruzione di tali diagrammi è del tutto analoga a quella vistaper i diagrammi ad aste o segmenti salvo che, in questo caso, unavolta ottenuti nel piano cartesiano i punti (xi,yi) rappresentanti ladistribuzione considerata, essi vanno uniti mediante una spezzatadetta poligono di frequenza.
Poligono e curve di frequenza per
variabili continue
All’aumentare del numero di unità rilevate il poligono di frequenzasi approssima sempre più a una linea continua detta curva difrequenza, la quale talvolta è esprimibile anche mediante l’ausiliodi funzioni matematiche.
Poligono e curve di frequenza per
variabili continue
Problemi di scala: questi grafici rappresentano la stessadistribuzione ma l’andamento della serie viene percepito inmaniera diversa.
Fonte: UNECE, Making Data Meaningful Part 2: A guide to presenting statistics,United nations, Geneva 2009.
Il grafico a sinistra mostra un trend stabile per circa 10 anni, seguito da una moderata crescita.
Riducendo la scala sull’asse delle ordinate (grafico a destra), risultano più evidenti le variazioni intervenute nei primi dieci anni e sembra più marcata la crescita dell’ultimo periodo.
Poligono e curve di frequenza pervariabili continue
Problemi di scala: quando l’asse delle ordinate non inizia dallozero è opportuno evidenziarlo, in modo da richiamare l’attenzionedel lettore su quest’aspetto.
Poligono e curve di frequenza pervariabili continue
Ne possiamo distinguere quattro tipologie principali:
- a ramo a foglia (stem and leaf).
Si considerino i dati relativi ai voti di maturità di 10 ragazzi:
65 74 79 83 83 86 88 92 97 99
Il primo passaggio è quello di dividere le decine dalle unità come:
Il secondo passaggio è quello di raggrupparei rami posizionando le relative foglie unaaccanto all’altra:
Nella rappresentazione a ramo efoglia si considerano le due cifreiniziali del quoziented’intelligenza come ‘‘rami’’ e laterza cifra come ‘‘foglia’’ottenendo:
Rappresentazioni di tipo informatico
6|5
7|4
7|9
8|3
8|3
8|6
8|8
9|2
9|7
9|9
6|5
7|49
8|3368
9|279
Questa tipologia di rappresentazione grafica poneimmediatamente in evidenza sia quali sono i dati aventi comeprima cifra 6, 7, 8, 9 sia il loro numero.
In tal modo è possibile visualizzare più modalità quantitative chedifferiscono tra di loro, ad esempio, sulle unità.
Le foglie possono anche disporsi in ordine crescente ottenendo:
Giusto per avere un’idea, da questa tavola si legge che un soloragazzo ha un voto di maturità pari a 65, tre superiori a 90.
Rappresentazioni di tipo informatico
- a scatola (boxplot), la quale consente di disporre delleprincipali caratteristiche di una distribuzione statisticasemplice.
Nell’esempio di rappresentazione a boxplot riportata di seguito:
figura un rettangolo in cui:
a) I lati inferiore e superiore indicano rispettivamente il 1° quartile(Q1) e il 3° quartile (Q3) della distribuzione considerata
b) La linea tratteggiata all’interno del rettangolo indica la posizionedella mediana (Q2=2° quartile)
c) Il simbolo ‘‘+’’ rappresenta la media aritmetica
d) La linea verticale tratteggiata (whiskers) indica l’estensionedella distribuzione prima di Q1 e dopo Q3.
Rappresentazioni di tipo informatico
- le facce di Chernoff, una rappresentazione grafica particolare,introdotta nel 1973 ed eseguibile soltanto tramite computer esoftware apposito, in cui si utilizzano i tratti di un volto (occhi,naso, bocca) per rappresentare le diverse componenti diun’informazione;
Tali rappresentazioni sono adatte sia per distribuzioni statistichesemplici che multiple.
Un limite di queste rappresentazioni, originali ed efficaci, èrappresentato dal fatto che non sempre è immediatamente chiaroquali elementi dei grafici rappresentano i dati. La forma el’espressione del viso, infatti, possono risultare dalla combinazionedei valori corrispondenti a più variabili e l’informazione che se nericava sarà più di tipo qualitativo (somiglianze, dissomiglianze) chequantitativo.
Rappresentazioni di tipo informatico
- ideogrammi o pittogrammi, rappresentazioni grafiche aventicarattere molto divulgativo perché si avvalgono di figure,simboli, generalmente tutti simili tra loro, aventi un’immediataattinenza con il carattere considerato (figure umane, oggettiecc.) e di grandezza o numero variabile per indicare l’entitàdella frequenza o dell’intensità del carattere rappresentato.
Qualsiasi carattere statistico (qualitativo o quantitativo) puòessere rappresentato con questa tipologia di grafici.
E’ da notare, tuttavia, che tali rappresentazioni possono prestarsiad equivoci perché non sempre è agevole leggerli ed essi hannouna scarsa utilità scientifica.
Rappresentazioni di tipo informatico
a) Nuvola dei punti
b) Stereogramma
c) Diagrammi a barre e cartodiagrammi
d) Piramide delle età
Rappresentazioni grafiche di distribuzioni
statistiche doppie
E’ una rappresentazione grafica molto utilizzata nel caso di unadistribuzione statistica doppia in cui entrambi i caratteri sonoquantitativi perché consente di visualizzare la correlazioneesistente fra le variabili.
Lo scatter plot è un diagramma cartesiano in cui sull’asse delleascisse (x) e su quello delle ordinate (y) sono riportati i valoriassunti dalle due variabili (X,Y) e ciascun punto P del pianorappresenta l’unità statistica avente come valore delle duevariabili le coordinate (xi,yi).
La nuvola dei punti consente di vedere la dispersione tra le unitàstatistiche ossia la loro vicinanza o distanza, indicantirispettivamente la loro somiglianza o dissomiglianza rispetto a duecaratteri considerati contemporaneamente.
Importante inoltre è la forma assunta dalla nuvola dei punti, chepuò fornire indicazioni sul tipo di relazione esistente tra duevariabili.
Nuvola dei punti o scatter plot
Ad esempio:
- se la nuvola di punti assume una forma sferica, tra le duevariabili non vi è un legame di tipo lineare
- se i punti tendono invece a disporsi lungo una retta, le duevariabili hanno una relazione di tipo lineare (Y = B0+B1X)
Nuvola dei punti o scatter plot
Anche lo stereogramma è una rappresentazione graficaparticolarmente indicata per tabelle a doppia entrata dicorrelazione.
Esso è costituito da una diagramma cartesiano ortogonale in unospazio a tre dimensioni, in R3, in cui sui tre assi (x, y e z) sonoriportati rispettivamente: i valori della variabile X, i valori dellavariabile Y e le frequenze di associazione Z = f(x,y) delle duevariabili.
Stereogramma
Nella costruzione dello stereogramma, a seconda che le variabilisiano entrambe discrete, una discreta e una continua oppureentrambe continue, occorre distinguere tra:
- Stereogramma a pali, impiegato nel caso di due variabili discreteoppure di variabili divise in classi di valori considerando il valorecentrale di ciascuna classe;
- Stereogramma a curve, utilizzato nel caso in cui entrambe levariabili sono continue oppure una è discreta e l’altra continua.
Stereogramma
Nel caso di distribuzioni statistiche doppie in cui vi sono duemutabili o una variabile e una mutabile (tabelle di contingenza)esistono diverse possibili rappresentazioni grafiche, a secondadella natura dei due caratteri considerati e degli scopi dellarappresentazione grafica.
Tra le rappresentazioni più impiegate vi è quella già vista per lemutabili statistiche semplici, il diagramma a barre, anche se inquesto caso è a tre dimensioni rappresentanti i due caratteri e lefrequenze di associazione delle modalità dei medesimi: Diagrammaa barre verticali per i profili-colonna e Diagramma a barre perimpilamento per i profili-riga.
Diagrammi a barre e cartodiagrammi
I cartodiagrammi non sono altro che dei cartogrammi in cui,anziché delle serie territoriali semplici, vengono rappresentatedelle serie territoriali di due o più caratteri.
Esempio: I nati vivi e i morti per 1.000 abitanti nelle 20 Regioniitaliane nel 1986.
Diagrammi a barre e cartodiagrammi