universita’ degli studi di perugia statistica medica … didattico... · la trasformazione da...

STATISTICA MEDICA

20/11/2014

Prof.ssa Donatella Siepi

[email protected]

tel: 075 5853525

UNIVERSITA’ DEGLI

STUDI DI PERUGIA

mailto:[email protected]

3° LEZIONE

Statistica descrittiva

C

Rilevazione dei dati Rappresentazione dei dati Elaborazione dei dati

STATISTICA DESCRITTIVA

piano tabelle grafici Medie e indici di

variabilitàA

D

E

B

C

A

D

E

B

In seguito

statistica_descrittiva.ppt









Presentazione dei dati

• Un insieme di misure è detto serie

statistica o serie dei dati.

Peso 100 neonati

3,2 3,0 2,9 2,8 3,1 3,1 3,1 3,1 3,1 3,4

2,9 3,4 2,5 3,0 3,5 3,1 3,0 3,2 3,6 3,3

3,1 3,3 3,1 3,4 2,9 3,2 2,8 3,3 3,2 2,8

2,9 2,6 3,0 3,1 3,1 3,0 3,0 2,9 2,9 3,1

2,8 3,1 3,3 3,0 2,8 3,1 3,5 3,2 3,3 2,8

3,0 3,3 3,1 2,7 3,0 3,2 3,6 2,9 2,9 3,4

3,3 3,1 3,1 3,2 2,9 3,0 3,4 2,7 3,2 3,5

3,4 3,2 3,0 2,6 3,3 3,5 3,1 2,8 3,4 3,0

2,7 3,0 3,2 3,2 2,9 3,1 2,7 3,1 3,0 3,3

3,3 3,0 2,9 3,2 3,3 3,2 3,7 3,2 3,1 3,2

Tabelle di frequenza

• Una sua prima ed elementare elaborazione può

essere una distribuzione ordinata di tutti i valori, in

modo crescente o decrescente, detta seriazione.

• Il valore minimo e il valore massimo insieme

permettono di individuare immediatamente il

campo (od intervallo) di variazione.

Tabelle di frequenza

2,5 2,6 2,6 2,7 2,7 2,7 2,7 2,8 2,8 2,8

2,8 2,8 2,8 2,8 2,9 2,9 2,9 2,9 2,9 2,9

2,9 2,9 2,9 2,9 2,9 3,0 3,0 3,0 3,0 3,0

3,0 3,0 3,0 3,0 3,0 3,0 3,0 3,0 3,0 3,0

3,1 3,1 3,1 3,1 3,1 3,1 3,1 3,1 3,1 3,1

3,1 3,1 3,1 3,1 3,1 3,1 3,1 3,1 3,1 3,1

3,2 3,2 3,2 3,2 3,2 3,2 3,2 3,2 3,2 3,2

3,2 3,2 3,2 3,2 3,2 3,3 3,3 3,3 3,3 3,3

3,3 3,3 3,3 3,3 3,3 3,3 3,4 3,4 3,4 3,4

3,4 3,4 3,4 3,5 3,5 3,5 3,5 3,6 3,6 3,7

Presentazioni dei dati

• Tabelle di frequenza

• Aggregazione di classi di frequenza

• Distribuzione e frequenza delle

osservazioni di conteggio

• Successivamente, la serie può essere

raggruppata in classi, contando quanti

valori od unità statistiche appartengono

ad ogni gruppo o categoria.

• Si ottiene una distribuzione di frequenza

o di intensità, detta anche

semplicemente distribuzione.

Peso 100 neonati

2,45-2,54

2,55-2,64

2,65-2,74

2,75-2,84

2,85-2,94

2,95-3,04

3,05-3,14

3,15-3,24

3,25-3,34

3,35-3,44

3,45-3,54

3,55-3,64

3,65-3,74

2,5

2,6

2,7

2,8

2,9

3,0

3,1

3,2

3,3

3,4

3,5

3,6

3,7

I

II

IIII

IIIIIII

IIIIIIIIIII

IIIIIIIIIIIIIII

IIIIIIIIIIIIIIIIIIII

IIIIIIIIIIIIIII

IIIIIIIIIII

IIIIIII

IIII

II

I

1

2

4

7

11

15

20

15

11

7

4

2

1

CLASSE FREQUENZA DI CONTEGGI FEREQUENZA

CLASSE

-la classe è una modalità di espressione (in

questo caso un valore o conteggio);

- la frequenza assoluta della classe è il numero

di volte con la quale compare ogni valore;

- la frequenza relativa della classe è la sua

frequenza assoluta divisa per il numero totale;

- la frequenza cumulata di una classe (che può

essere stimata con quelle assolute e/o con

quelle relative) è la somma di tutte le frequenze

delle classi minori con quella della classe stessa.

La trasformazione da frequenza assoluta a frequenza

relativa risulta utile quando si vogliono confrontare due o più

distribuzioni, che hanno un differente numero complessivo di

osservazioni.

La frequenza cumulata offre informazioni importanti quando

si intende stimare il numero totale di osservazioni inferiore (o

superiore) ad un valore prefissato.

La distribuzione dei dati e la distribuzione delle frequenze

cumulate forniscono informazioni non dissimili, essendo

possibile passare con facilità dall’una all’altra. Sono diverse

nella loro forma, come si vedrà con maggiore evidenza nelle

rappresentazioni grafiche.

La prima ha una forma a campana, la seconda una forma

a S, di tipo asintotico; si prestano ad analisi differenti e la

scelta è fatta sulla base del loro uso statistico.

Tabella semplice

Frequenza assoluta

(peso) di un evento è il

numero totale di volte che

essa si presenta nelle

unità rilevate

Voto

(modalità)

Allievi

(frequenza)

4 3

5 5

6 8

7 5

8 3

Frequenze

• Frequenza relativa, o frequenza di un evento

è il rapporto fra la sua frequenza assoluta e il

numero totale delle unità rilevate, se moltiplicata

per 100 è detta frequenza relativa percentuale

Voti Allievi

(frequenza)

Frequenza

relativa

Frequenza

relativa %

4 2 0.09 9

5 4 0.18 18

6 8 0.36 36

7 5 0.23 23

8 3 0.14 14

Totale 22 1 100

2 / 22 0.09

4 / 22 0.18

….

????????????• Matrice dei dati o

serie di dati

• Tabelle semplici

• Tabelle a doppia

entrata

• Curve di frequenza

• Grafici a dispersione

• Areogrammi

• Cartogrammi

• Istogrammi

• Grafici a barre

• Poligoni

Rappresentazione dei dati

• Rappresentazione dei dati (grafici)perché con l’immagine si riesce a dare un quadro

generale della situazione indagata riuscendo a dare

informazioni facilmente, rapidamente comprensibili.

• hanno però l’inconveniente fondamentale di

mancare di precisione e soprattutto di essere

soggettive, quindi di permettere letture diverse

degli stessi dati.

• Ai fini di una elaborazione mediante i test e di un

confronto dettagliato dei parametri, è sempre preferibile

la tabella, che riporta i dati esatti.

Rappresentazione dei dati

• Rappresentazione dei dati (grafici)

Le rappresentazioni grafiche proposte sono

numerose. Esse debbono essere scelte in

rapporto al tipo di dati e quindi alla scala

utilizzata.

• Quali grafici?Istogrammi, diagrammi a torta, grafici cartesiani,

cartogrammi, ecc.

i motivi che devono spingere il

ricercatore a costruire rappresentazioni

grafiche dei suoi dati:

• - un esame preliminare delle caratteristiche

della distribuzione,

• - un suggerimento per il test da scegliere,

adeguato appunto ai dati raccolti,

• - un aiuto alla comprensione delle

conclusioni,

• - senza per questo essere un test, ma solo

una descrizione visiva.

Tabelle e grafici

Tabelle ?

QUALI?

Grafici?Consumo carni

carni rosse

24%

carni

bianche

18%cacciagion

e

9%

pesce

12%

altro

37%

carni rosse carni bianche cacciagione pesce altroQUANDO????

Le rappresentazioni grafiche hanno l’obiettivo di illustrare, mediante:

-figure,

-linee o segmenti,

-superfici o aree,

-solidi,

-simboli convenzionali

-ecc.

una distribuzione di frequenze o di intensità in funzione delle modalità di uno o più caratteri.

a) Obiettivo

Visualizzazione immediata dell’andamento del fenomeno e della struttura della distribuzione, che consente una efficace e globale descrizione dei dati;

-Sintesi e quindi possibilità, in poco spazio, di confrontare più distribuzioni (curve, spezzate ecc.);

-Potenzialità investigative:

• mette in risalto i casi ‘‘anomali’’ (particolari picchigrafici), imputabili a errori nei dati o a effettivi casi anomali, che vanno ulteriormente approfonditi,

• evidenzia le correlazioni tra caratteri aventi tra loro un legame logico,

• permette di individuare andamenti di fondo (trend)interpolabili con funzioni matematiche (ad es. curva normale, retta ecc.).

Potenzialità della rappresentazione grafica

Per ogni distribuzione statistica semplice o doppia o multipla esiste il tipo di rappresentazione grafica adatta e una stessa distribuzione può essere rappresentata con più tipologie di grafico.

In generale esistono dei vincoli tra tipo di rappresentazione grafica e livello di misurazione dei caratteri da rappresentare che vanno rispettati affinché questa sia corretta, ossia fornisca un’immagine visiva quanto più possibile fedele del fenomeno e della sua distribuzione statistica.

Affinché una rappresentazione grafica sia utile ed efficace dovrebbe contenere con immediatezza e chiarezza tutte le informazioni necessarie alla comprensione dei dati in essa rappresentati.

Diverse possibilità di rappresentazione a

seconda del livello di misurazione dei

caratteri

Le componenti di un grafico• I dati: sono rappresentati in barre, linee, aree o punti.

• Le componenti di supporto: consentono la comprensione deidati:

− Il titolo del grafico

− I titoli degli assi

− Le etichette degli assi

− L’unità di misura dei dati

− La griglia

− La legenda

− Le etichette dei dati

− Le note

− La fonte dei dati.

• Gli elementi decorativi: non sono legati ai dati.

Le componenti di supporto• Il titolo del grafico deve essere breve e coinciso.

Ne esistono di due tipi:

• Il titolo informativo contiene le informazioni necessarieper comprendere i dati. Risponde alle tre domande:“Cosa?”, Dove?” e “Quando?”.

p.e. Tasso di disoccupazione in Italia, anni 2009-2012

• Il titolo descrittivo sintetizza in poche parole il trend oil pattern rappresentato nel grafico.

p.e. L’aumento della disoccupazione in Italia dal 2009al 2012.

• I titoli degli assi identificano le mutabili o le variabilirappresentate dagli assi. Se si possono evincere dal titolo delgrafico non è necessario ripeterli.

• Le etichette degli assi identificano le modalità o i valorirappresentati nel grafico.

Le componenti di supporto

• L’unità di misura dei dati (p.e. “in migliaia” , “%” etc.).

Se l’unità di misura è ovvia, non è necessario specificarla(p.e. “anni” per le serie storiche).

• La griglia può essere aggiunta per agevolare la lettura e ilconfronto dei dati.

• La legenda identifica simboli, tratteggi o colori usati perrappresentare i dati.

• Le etichette dei dati visualizzate sopra o vicino alle barre, allearee o alle linee facilitano la lettura del grafico.

• Le note possono essere aggiunte per fornire definizioni oinformazioni sulla metodologia.

• La fonte di provenienza dei dati.

La rilevanza dei datiPer massimizzare l’efficacia di un grafico l’attenzione deveessere concentrata sui dati.

Pertanto le componenti di supporto:

• Devono essere presenti solo se necessarie: titoli degli assi,legende e etichette in alcuni casi possono essere essenzialiper la comprensione del grafico, ma in altri possono esseredel tutto inutili.

• Devono essere lievi: è preferibile usare linee più leggere pergli assi e per la griglia e linee più marcate per i dati.

Gli effetti decorativi non devono allontanare l’attenzione dellettore dai dati.

La rilevanza dei datiUn grafico confuso

15

25

10

0

10

20

30

A B C

Serie1

Un grafico chiaro

10

15

25

0

10

20

30

A B C

Il grafico a destra è più facileda leggere.Il ricorso a poche componentidi supporto permette diconcentrare l’attenzione suidati.

Nel grafico a sinistra tutte lecomponenti hanno il massimoimpatto.Il risultato è un grafico confuso,difficile da leggere anche sesono presenti solo 3 valori.

a) Grafici a barre

b) Diagrammi circolari

c) Diagrammi in coordinate polari

d) Cartogrammi, mappe tematiche

Rappresentazioni grafiche di

caratteri qualitativi

I grafici a barre (o ortogrammi) sono impiegati per rappresentaregraficamente serie sconnesse o rettilinee e possono essere di duetipi:

-A colonne, se sono costituiti da una successione di colonne,segmenti verticali o rettangoli (a base uguale o arbitraria)equidistanti, in numero pari alle modalità del carattere, e hannoaltezza uguale o proporzionale alla frequenza (assoluta o relativa)o all’intensità della modalità da rappresentare;

-A nastri, se sono costituiti da tanti nastri (segmenti orizzontali,rettangoli) sovrapposti ed equidistanti, in numero pari allemodalità del carattere, e hanno lunghezza uguale o proporzionalealla frequenza (assoluta o relativa) o all’intensità della modalitàda rappresentare.

I grafici a barre sono pertanto caratterizzati dall’avere un soloasse (verticale nel caso a colonne, orizzontale nel caso a nastri)in scala graduata, secondo l’unità di misura che si è scelta perrappresentare le frequenze o intensità. Sull’altro asse, invece,figureranno le modalità (qualitative), per convenzioneequidistanti.

Grafici a barre

Se la rappresentazione grafica riguarda una serie sconnessa, l’ordinein cui saranno poste le modalità è arbitrario; se si tratta invece diuna serie rettilinea (es. titolo di studio), le modalità saranno postenell’ordine naturale che esse presentano nella serie.

Ortogramma a colonne Ortogramma a nastri

Grafici a barre

I diagrammi circolari (o aereogrammi) per la loro forma circolare,sono comunemente noti come ‘‘diagrammi a torta’’.

Sono particolarmente adatti alle serie sconnesse o rettilinee.

Sono efficaci per mettere in evidenza l’importanza relativa dellesingole modalità rispetto al totale.

Ne esistono di vari tipi e principalmente:

-A spicchi o settori variabili, con angoli al centro corrispondentialle frequenze assolute ( o relative) delle singole modalità e raggiofisso;

-A spicchi o settori fissi, con angoli al centro uguali e raggiovariabile corrispondente alle frequenze assolute (o relative) dellesingole modalità.

Diagrammi circolari

In questa rappresentazione grafica sia il punto di partenza

sulla superficie circolare sia l’ordine della modalità (spicchi)

è arbitrario.

Rappresentazione grafica particolarmente idonea nel caso

di caratteri qualitativi ordinati (es. graduatorie), in cui l’ordinamento

è stabilito a priori in funzione delle frequenze assolute.

Diagrammi circolari

Si utilizzano per rappresentare serie cicliche.

Le serie cicliche sono distribuzioni di mutabili che dispongono di unordinamento naturale ma non di una prima e un’ultima modalità.

Esempio. I nati, i matrimoni, le vendite di determinati prodotti,fenomeni astronomici o atmosferici e così via secondo i mesidell’anno, i giorni della settimana ecc.

Se il carattere ciclico puòconsiderarsi continuo (ossiasoggetto a subire variazionicontinue nel tempo) sipossono congiungere gliestremi dei raggi vettori al finedi dare maggiore rilievoall’andamento del fenomeno.

Diagrammi in coordinate polari

I cartogrammi sono grafici utili per rappresentare serie territoriali.

Per costruire un cartogramma occorre disporre di una carta geografica o topografica in cui siano chiaramente delimitate le diverse zone, regioni, circoscrizioni (geografiche, politiche, amministrative) rispetto alle quali viene analizzata l’intensità o la frequenza di uno o più caratteri (es. nati, morti, reddito pro capite, secondo le Regioni, Province, Comuni).

Cartogrammi, mappe tematiche

Le mappe tematiche consentono, anche se molto empiricamente e in prima approssimazione, di tener conto dell’autocorrelazione spaziale, intesa come possibilità che un fenomeno che interessa un certo territorio sia influenzato nelle sue manifestazioni dalla contiguità spaziale esistente tra i luoghi in cui il fenomeno è osservato.

Cartogrammi, mappe tematiche

a) Istogrammi

b) Diagrammi cartesiani a segmenti

c) Poligono e curve di frequenza per variabili continue

d) Rappresentazioni di tipo informatico:

- a ramo e foglia (stem and leaf plot)

- a scatola (boxplot)

- le facce di Chernoff

- ideogrammi o pictogrammi

Rappresentazioni grafiche di

caratteri quantitativi

Gli istogrammi si impiegano per rappresentare graficamentedistribuzioni di frequenza di caratteri quantitativi le cui modalitàsono costituite da classi di valori.

A tal fine occorre distinguere due casi, ovvero:

-Le classi di valori hanno uguale ampiezza. In questo caso avremotanti rettangoli contigui, ciascuno avente base uguale all’ampiezzadella classe e altezza uguale o proporzionale alla frequenza(assoluta o relativa) assunta nell’insieme delle unità della classe;

L’ipotesi di base su cui sifonda la rappresentazioneper istogrammi è che leunità classificate in ciascunaclasse di valori siano in essaequidistribuite.

Istogrammi

Per rendere più evidente l’andamento e la forma delladistribuzione, si possono congiungere con segmenti di retta i punticentrali dei lati superiori dei rettangoli ottenendo una lineaspezzata detta poligono di frequenza, la quale deve essere chiusatoccando l’asse delle ascisse all’esterno delle classi estreme, inmodo che l’area all’interno del poligono di frequenza equivalga aquella dell’istogramma.

- Le classi di valori hanno diversa ampiezza. In quest’altro casoavremo una serie di rettangoli aventi basi diverse ugualiall’ampiezza delle classi e altezze da calcolarsi, in modo che lefrequenze siano proporzionali alle aree dei rispettivi rettangoli.

In ordinata, pertanto, avremole cosiddette densità difrequenza date dal rapportotra la frequenza (assoluta orelativa) di ciascuna classe ela relativa ampiezza.

Istogrammi

POLIGONI• I poligoni sono figure simili

agli istogrammi e sono

utilizzati di norma per la

rappresentazione di valori

relativi o di percentuali, in

quanto è implicito che l’area

totale sottesa sia uguale a 1

o 100%.

• Come nel caso degli

istogrammi, l'asse orizzontale

rappresenta il fenomeno,

mentre l'asse verticale

rappresenta la proporzione o

percentuale di ogni classe.

Le distribuzioni cumulate sono rappresentate sia con istogrammi cumulati sia

con poligoni cumulati.

Sono impiegati per rappresentare graficamente caratteriquantitativi discreti, non divisi in classi, e possono configurarsi asegmenti verticali.

Esempio. Numero dei componenti per famiglia, numero dellestanze delle abitazioni, numero di unità locali delle aziende e cosìvia.

Essi si costruiscono come gli usuali diagrammi cartesiani aventidue assi perpendicolari: l’asse delle ascisse (x) e l’asse delleordinate (y), aventi origine comune in zero. Ogni coppia ordinatadi valori (xi,yi) determinerà un punto nel piano e l’insieme di tuttele coppie (xi = modalità quantitativa i-esima, yi = frequenza dellamodalità i-esima) determinerà l’insieme dei punti nel piano checostituiscono la rappresentazione grafica della distribuzioneconsiderata.

Per rendere maggiormente visibili tali punti, si tracciano deisegmenti verticali congiungenti l’ascissa (xi) con il punto del pianocorrispondente all’ordinata (yi).

Diagrammi cartesiani a segmenti

E’ da notare che in questo caso è scorretto costruire il poligonoo spezzata di frequenza congiungendo tra loro i punti poiché ilcarattere considerato è discreto e quindi, per sua natura, nonpossiede i valori intermedi a quelli indicati dalle modalitàquantitative. Una spezzata di frequenza che unisse tra loro lemodalità, infatti, attribuirebbe anche valori intermedi allemodalità stesse.

Diagrammi cartesiani a segmenti

I diagrammi cartesiani ortogonali sono impiegati anche perrappresentare graficamente i caratteri quantitativi continui (comead esempio età, prezzi) o, nel caso delle serie storiche, per queicaratteri che si suppone si modifichino con continuità nel tempo.

La costruzione di tali diagrammi è del tutto analoga a quella vistaper i diagrammi ad aste o segmenti salvo che, in questo caso, unavolta ottenuti nel piano cartesiano i punti (xi,yi) rappresentanti ladistribuzione considerata, essi vanno uniti mediante una spezzatadetta poligono di frequenza.

Poligono e curve di frequenza per

variabili continue

All’aumentare del numero di unità rilevate il poligono di frequenzasi approssima sempre più a una linea continua detta curva difrequenza, la quale talvolta è esprimibile anche mediante l’ausiliodi funzioni matematiche.

Poligono e curve di frequenza per

variabili continue

Problemi di scala: questi grafici rappresentano la stessadistribuzione ma l’andamento della serie viene percepito inmaniera diversa.

Fonte: UNECE, Making Data Meaningful Part 2: A guide to presenting statistics,United nations, Geneva 2009.

Il grafico a sinistra mostra un trend stabile per circa 10 anni, seguito da una moderata crescita.

Riducendo la scala sull’asse delle ordinate (grafico a destra), risultano più evidenti le variazioni intervenute nei primi dieci anni e sembra più marcata la crescita dell’ultimo periodo.

Poligono e curve di frequenza pervariabili continue

Problemi di scala: quando l’asse delle ordinate non inizia dallozero è opportuno evidenziarlo, in modo da richiamare l’attenzionedel lettore su quest’aspetto.

Poligono e curve di frequenza pervariabili continue

Ne possiamo distinguere quattro tipologie principali:

- a ramo a foglia (stem and leaf).

Si considerino i dati relativi ai voti di maturità di 10 ragazzi:

65 74 79 83 83 86 88 92 97 99

Il primo passaggio è quello di dividere le decine dalle unità come:

Il secondo passaggio è quello di raggrupparei rami posizionando le relative foglie unaaccanto all’altra:

Nella rappresentazione a ramo efoglia si considerano le due cifreiniziali del quoziented’intelligenza come ‘‘rami’’ e laterza cifra come ‘‘foglia’’ottenendo:

Rappresentazioni di tipo informatico

6|5

7|4

7|9

8|3

8|3

8|6

8|8

9|2

9|7

9|9

6|5

7|49

8|3368

9|279

Questa tipologia di rappresentazione grafica poneimmediatamente in evidenza sia quali sono i dati aventi comeprima cifra 6, 7, 8, 9 sia il loro numero.

In tal modo è possibile visualizzare più modalità quantitative chedifferiscono tra di loro, ad esempio, sulle unità.

Le foglie possono anche disporsi in ordine crescente ottenendo:

Giusto per avere un’idea, da questa tavola si legge che un soloragazzo ha un voto di maturità pari a 65, tre superiori a 90.


- a scatola (boxplot), la quale consente di disporre delleprincipali caratteristiche di una distribuzione statisticasemplice.

Nell’esempio di rappresentazione a boxplot riportata di seguito:

figura un rettangolo in cui:

a) I lati inferiore e superiore indicano rispettivamente il 1° quartile(Q1) e il 3° quartile (Q3) della distribuzione considerata

b) La linea tratteggiata all’interno del rettangolo indica la posizionedella mediana (Q2=2° quartile)

c) Il simbolo ‘‘+’’ rappresenta la media aritmetica

d) La linea verticale tratteggiata (whiskers) indica l’estensionedella distribuzione prima di Q1 e dopo Q3.


- le facce di Chernoff, una rappresentazione grafica particolare,introdotta nel 1973 ed eseguibile soltanto tramite computer esoftware apposito, in cui si utilizzano i tratti di un volto (occhi,naso, bocca) per rappresentare le diverse componenti diun’informazione;

Tali rappresentazioni sono adatte sia per distribuzioni statistichesemplici che multiple.

Un limite di queste rappresentazioni, originali ed efficaci, èrappresentato dal fatto che non sempre è immediatamente chiaroquali elementi dei grafici rappresentano i dati. La forma el’espressione del viso, infatti, possono risultare dalla combinazionedei valori corrispondenti a più variabili e l’informazione che se nericava sarà più di tipo qualitativo (somiglianze, dissomiglianze) chequantitativo.


- ideogrammi o pittogrammi, rappresentazioni grafiche aventicarattere molto divulgativo perché si avvalgono di figure,simboli, generalmente tutti simili tra loro, aventi un’immediataattinenza con il carattere considerato (figure umane, oggettiecc.) e di grandezza o numero variabile per indicare l’entitàdella frequenza o dell’intensità del carattere rappresentato.

Qualsiasi carattere statistico (qualitativo o quantitativo) puòessere rappresentato con questa tipologia di grafici.

E’ da notare, tuttavia, che tali rappresentazioni possono prestarsiad equivoci perché non sempre è agevole leggerli ed essi hannouna scarsa utilità scientifica.


a) Nuvola dei punti

b) Stereogramma

c) Diagrammi a barre e cartodiagrammi

d) Piramide delle età

Rappresentazioni grafiche di distribuzioni

statistiche doppie

E’ una rappresentazione grafica molto utilizzata nel caso di unadistribuzione statistica doppia in cui entrambi i caratteri sonoquantitativi perché consente di visualizzare la correlazioneesistente fra le variabili.

Lo scatter plot è un diagramma cartesiano in cui sull’asse delleascisse (x) e su quello delle ordinate (y) sono riportati i valoriassunti dalle due variabili (X,Y) e ciascun punto P del pianorappresenta l’unità statistica avente come valore delle duevariabili le coordinate (xi,yi).

La nuvola dei punti consente di vedere la dispersione tra le unitàstatistiche ossia la loro vicinanza o distanza, indicantirispettivamente la loro somiglianza o dissomiglianza rispetto a duecaratteri considerati contemporaneamente.

Importante inoltre è la forma assunta dalla nuvola dei punti, chepuò fornire indicazioni sul tipo di relazione esistente tra duevariabili.

Nuvola dei punti o scatter plot

Ad esempio:

- se la nuvola di punti assume una forma sferica, tra le duevariabili non vi è un legame di tipo lineare

- se i punti tendono invece a disporsi lungo una retta, le duevariabili hanno una relazione di tipo lineare (Y = B0+B1X)

Nuvola dei punti o scatter plot

Anche lo stereogramma è una rappresentazione graficaparticolarmente indicata per tabelle a doppia entrata dicorrelazione.

Esso è costituito da una diagramma cartesiano ortogonale in unospazio a tre dimensioni, in R3, in cui sui tre assi (x, y e z) sonoriportati rispettivamente: i valori della variabile X, i valori dellavariabile Y e le frequenze di associazione Z = f(x,y) delle duevariabili.

Stereogramma

Nella costruzione dello stereogramma, a seconda che le variabilisiano entrambe discrete, una discreta e una continua oppureentrambe continue, occorre distinguere tra:

- Stereogramma a pali, impiegato nel caso di due variabili discreteoppure di variabili divise in classi di valori considerando il valorecentrale di ciascuna classe;

- Stereogramma a curve, utilizzato nel caso in cui entrambe levariabili sono continue oppure una è discreta e l’altra continua.

Stereogramma

Nel caso di distribuzioni statistiche doppie in cui vi sono duemutabili o una variabile e una mutabile (tabelle di contingenza)esistono diverse possibili rappresentazioni grafiche, a secondadella natura dei due caratteri considerati e degli scopi dellarappresentazione grafica.

Tra le rappresentazioni più impiegate vi è quella già vista per lemutabili statistiche semplici, il diagramma a barre, anche se inquesto caso è a tre dimensioni rappresentanti i due caratteri e lefrequenze di associazione delle modalità dei medesimi: Diagrammaa barre verticali per i profili-colonna e Diagramma a barre perimpilamento per i profili-riga.

Diagrammi a barre e cartodiagrammi

I cartodiagrammi non sono altro che dei cartogrammi in cui,anziché delle serie territoriali semplici, vengono rappresentatedelle serie territoriali di due o più caratteri.

Esempio: I nati vivi e i morti per 1.000 abitanti nelle 20 Regioniitaliane nel 1986.

Diagrammi a barre e cartodiagrammi

universita’ degli studi di perugia statistica medica … didattico... · la trasformazione da...

Documents