analisi univariata metodi quantitativi per economia, finanza e management esercitazione n°3
TRANSCRIPT
![Page 1: Analisi Univariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°3](https://reader035.vdocuments.net/reader035/viewer/2022062300/5542eb4e497959361e8bd6e5/html5/thumbnails/1.jpg)
Analisi UnivariataAnalisi Univariata
Metodi Quantitativi per Economia, Finanza e Management
Esercitazione n°3
![Page 2: Analisi Univariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°3](https://reader035.vdocuments.net/reader035/viewer/2022062300/5542eb4e497959361e8bd6e5/html5/thumbnails/2.jpg)
Forma della Distribuzione
• La forma della distribuzione si dice simmetrica se le osservazioni sono bilanciate, o distribuite in modo approssimativamente regolare attorno al centro.
Distribuzione Simmetrica
0123456789
10
1 2 3 4 5 6 7 8 9F
req
uen
za0
20
40
60
80
100
120
![Page 3: Analisi Univariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°3](https://reader035.vdocuments.net/reader035/viewer/2022062300/5542eb4e497959361e8bd6e5/html5/thumbnails/3.jpg)
• La forma della distribuzione è detta asimmetrica se le osservazioni non sono distribuite in modo simmetrico rispetto al centro.
Distribuzione con Asimmetria Positiva
0
2
4
6
8
10
12
1 2 3 4 5 6 7 8 9
Fre
qu
en
za
Distribuzione con Asimmetria Negativa
0
2
4
6
8
10
12
1 2 3 4 5 6 7 8 9
Fre
qu
en
za
Una distribuzione con asimmetria positiva (obliqua a destra) ha una coda che si estende a destra, nella direzione dei valori positivi.
Una distribuzione con asimmetria negativa (obliqua a sinistra) ha una coda che si estende a sinistra, nella direzione dei valori negativi.
Forma della Distribuzione
![Page 4: Analisi Univariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°3](https://reader035.vdocuments.net/reader035/viewer/2022062300/5542eb4e497959361e8bd6e5/html5/thumbnails/4.jpg)
• Descrive come i dati sono distribuiti
• Misure della forma
– Simmetrica o asimmetrica
Media = Mediana Media < Mediana Mediana < Media
Obliqua a destraObliqua a sinistra Simmetrica
Misure di Forma della Distribuzione
![Page 5: Analisi Univariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°3](https://reader035.vdocuments.net/reader035/viewer/2022062300/5542eb4e497959361e8bd6e5/html5/thumbnails/5.jpg)
Skewness: indice che informa circa il grado di simmetria o asimmetria di una distribuzione. – γ=0 ditribuzione simmetrica;– γ<0 asimmetria negativa (mediana>media);– γ>0 asimmetria positiva (mediana<media).
Kurtosis: indice che permette di verificare se i dati seguono una distribuzione di tipo Normale (simmetrica).– β=3 se la distribuzione è “Normale”;– β<3 se la distribuzione è iponormale (rispetto alla distribuzione
di una Normale ha densità di frequenza minore per valori molto distanti dalla media);
– β>3 se la distribuzione è ipernormale (rispetto alla distribuzione di una Normale ha densità di frequenza maggiore per i valori molto distanti dalla media).
Misure di Forma della Distribuzione
![Page 6: Analisi Univariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°3](https://reader035.vdocuments.net/reader035/viewer/2022062300/5542eb4e497959361e8bd6e5/html5/thumbnails/6.jpg)
EsempioImporto totale accredito stipendio
Skewness>0 asimmetria positiva (mediana<media).
Kurtosis<3 : la distribuzione è iponormale (rispetto alla distribuzione di una Normale ha densità di frequenza minore per valori molto distanti dalla media);
![Page 7: Analisi Univariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°3](https://reader035.vdocuments.net/reader035/viewer/2022062300/5542eb4e497959361e8bd6e5/html5/thumbnails/7.jpg)
Output in HTML
![Page 8: Analisi Univariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°3](https://reader035.vdocuments.net/reader035/viewer/2022062300/5542eb4e497959361e8bd6e5/html5/thumbnails/8.jpg)
PROC FREQ - Descrizione
La PROC FREQ permette di calcolare le distribuzioni di frequenza univariate per variabili qualitative e quantitative discrete
![Page 9: Analisi Univariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°3](https://reader035.vdocuments.net/reader035/viewer/2022062300/5542eb4e497959361e8bd6e5/html5/thumbnails/9.jpg)
PROC FREQ – Sintassi generale 1/2
proc freq data= dataset options;
tables variabile /options;
run;
Distribuzione di frequenza univariata
OPTIONS:• noprint non mostra i risultati nella finestra di output• /missing considera anche i missing nel calcolo delle frequenze
![Page 10: Analisi Univariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°3](https://reader035.vdocuments.net/reader035/viewer/2022062300/5542eb4e497959361e8bd6e5/html5/thumbnails/10.jpg)
PROC FREQ: Esempio 1
proc freq data=corso.telefonia;
table operatore;
run;
Variabile qualitativa: operatore telefonico
![Page 11: Analisi Univariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°3](https://reader035.vdocuments.net/reader035/viewer/2022062300/5542eb4e497959361e8bd6e5/html5/thumbnails/11.jpg)
operatore Frequency Percent Cumulative Cumulative
Frequency Percent
Tim 55 23.31 55 23.31
Tre 12 5.08 67 28.39
Vodafone 154 65.25 221 93.64
Wind 15 6.36 236 100
Frequenza assoluta: consiste nell’associare a ciascuna categoria, o modalità, il numero di volte in cui compare nei dati
Frequenza relativa: rapporto tra la frequenza assoluta ed il numero complessivo delle osservazioni effettuate
Frequenze
cumulate
Output PROC FREQ
![Page 12: Analisi Univariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°3](https://reader035.vdocuments.net/reader035/viewer/2022062300/5542eb4e497959361e8bd6e5/html5/thumbnails/12.jpg)
PROC FREQ: Esempio 2
proc freq data=corso.telefonia;
table fisso_g;
run;
Variabile quantitativa discreta:
numero medio giorni utilizzo alla settimana telefono fisso
![Page 13: Analisi Univariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°3](https://reader035.vdocuments.net/reader035/viewer/2022062300/5542eb4e497959361e8bd6e5/html5/thumbnails/13.jpg)
Output PROC FREQ
fisso_g
fisso_g Frequency Percent CumulativeFrequency
CumulativePercent
0 27 11.44 27 11.44
0.5 9 3.81 36 15.25
1 10 4.24 46 19.49
2 19 8.05 65 27.54
3 21 8.90 86 36.44
4 14 5.93 100 42.37
5 19 8.05 119 50.42
6 9 3.81 128 54.24
7 108 45.76 236 100.00
![Page 14: Analisi Univariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°3](https://reader035.vdocuments.net/reader035/viewer/2022062300/5542eb4e497959361e8bd6e5/html5/thumbnails/14.jpg)
PROC FREQ: Esempio 3
proc freq data=corso.telefonia;
table motivo_utilizzo_2 / missing;
run;
Variabile qualitativa:
secondo motivo di utilizzo mezzi di comunicazione
OPZIONE missing: considera anche i missing nel calcolo delle frequenze
![Page 15: Analisi Univariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°3](https://reader035.vdocuments.net/reader035/viewer/2022062300/5542eb4e497959361e8bd6e5/html5/thumbnails/15.jpg)
Output PROC FREQ
100.002368.4720Studio
91.5321654.24128Piacere/Tempo libero
37.29889.3222Partner
27.976616.9540Famigliari
11.02260.852Altro
10.172410.1724
CumulativePercent
CumulativeFrequency
PercentFrequencymotivo_utilizzo_2
MISSING
![Page 16: Analisi Univariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°3](https://reader035.vdocuments.net/reader035/viewer/2022062300/5542eb4e497959361e8bd6e5/html5/thumbnails/16.jpg)
Output PROC FREQ
motivo_utilizzo_2 Frequency Percent CumulativeFrequency
CumulativePercent
Altro 2 0.94 2 0.94
Famigliari 40 18.87 42 19.81
Partner 22 10.38 64 30.19
Piacere/Tempo libero 128 60.38 192 90.57
Studio 20 9.43 212 100.00
Frequency Missing = 24
![Page 17: Analisi Univariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°3](https://reader035.vdocuments.net/reader035/viewer/2022062300/5542eb4e497959361e8bd6e5/html5/thumbnails/17.jpg)
PROC FREQ – Sintassi generale 2/2
Distribuzione di frequenza univariata con variabile di classificazione
proc freq data= dataset options;
by variabile_1;
tables variabile_2 /options;
run;
![Page 18: Analisi Univariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°3](https://reader035.vdocuments.net/reader035/viewer/2022062300/5542eb4e497959361e8bd6e5/html5/thumbnails/18.jpg)
PROC FREQ: Esempio 4
proc sort data=corso.telefonia;
by sesso;
run;
proc freq data=corso.telefonia;
by sesso;
tables operatore;
run;
Distribuzione di frequenza univariata con variabile di classificazione
PROC SORT: ordinare le osservazioni in base alla variabile di by
![Page 19: Analisi Univariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°3](https://reader035.vdocuments.net/reader035/viewer/2022062300/5542eb4e497959361e8bd6e5/html5/thumbnails/19.jpg)
Output PROC FREQsesso=F
operatore Frequency Percent CumulativeFrequency
CumulativePercent
Tim 27 27.00 27 27.00
Tre 7 7.00 34 34.00
Vodafone 63 63.00 97 97.00
Wind 3 3.00 100 100.00
sesso=M
operatore Frequency Percent CumulativeFrequency
CumulativePercent
Tim 28 20.59 28 20.59
Tre 5 3.68 33 24.26
Vodafone 91 66.91 124 91.18
Wind 12 8.82 136 100.00
![Page 20: Analisi Univariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°3](https://reader035.vdocuments.net/reader035/viewer/2022062300/5542eb4e497959361e8bd6e5/html5/thumbnails/20.jpg)
PROC UNIVARIATE - Descrizione
La PROC UNIVARIATE permette di calcolare
• misure di sintesi di posizione, variabilità, forma per variabili quantitative continue
![Page 21: Analisi Univariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°3](https://reader035.vdocuments.net/reader035/viewer/2022062300/5542eb4e497959361e8bd6e5/html5/thumbnails/21.jpg)
proc univariate data= dataset options;
var variabile;
run;
Distribuzione di frequenza univariata
PROC UNIVARIATE – Sintassi 1/2
OPTIONS:• noprint non mostra i risultati nella finestra di output
![Page 22: Analisi Univariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°3](https://reader035.vdocuments.net/reader035/viewer/2022062300/5542eb4e497959361e8bd6e5/html5/thumbnails/22.jpg)
PROC UNIVARIATE – Esempio 1
Misure di sintesi della variabile quantitativa discreta numero medio sms inviati al giorno
proc univariate data=corso.telefonia;
var num_sms_e;
run;
![Page 23: Analisi Univariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°3](https://reader035.vdocuments.net/reader035/viewer/2022062300/5542eb4e497959361e8bd6e5/html5/thumbnails/23.jpg)
Output PROC UNIVARIATE (1/5)
Basic Statistical Measures
Location Variability
Mean 24.31356 Std Deviation 28.46175
Median 10.00000 Variance 810.07147
Mode 10.00000 Range 100.00000
Interquartile Range 25.00000
Misure di tendenza centrale
• Media aritmetica: somma dei valori diviso il numero di valori
• Mediana: in una lista ordinata, la mediana è il valore “centrale” (50% sopra, 50% sotto)
• Moda: valore che occorre più frequentemente
![Page 24: Analisi Univariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°3](https://reader035.vdocuments.net/reader035/viewer/2022062300/5542eb4e497959361e8bd6e5/html5/thumbnails/24.jpg)
Output PROC UNIVARIATE (2/5) Misure di Variabilità
• Scarto Quadratico Medio [Std Deviation]: mostra la variabilità rispetto alla media
• Varianza [Variance]: media dei quadrati delle differenze fra ciascuna osservazione e la media
• Campo di Variazione [Range]: differenza tra il massimo e il minimo dei valori osservati
• Differenza Interquartile [Interquartile Range]: 3° quartile – 1° quartile
25.00000Interquartile Range
100.00000Range10.00000Mode
810.07147Variance10.00000Median
28.46175Std Deviation24.31356Mean
VariabilityLocation
Basic Statistical Measures
![Page 25: Analisi Univariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°3](https://reader035.vdocuments.net/reader035/viewer/2022062300/5542eb4e497959361e8bd6e5/html5/thumbnails/25.jpg)
Output PROC UNIVARIATE (3/5)
Quantiles (Definition 5)
Quantile Estimate
100% Max 100
99% 100
95% 100
90% 70
75% Q3 30
50% Median 10
25% Q1 5
10% 2
5% 2
1% 1
0% Min 0
• Il primo quartile, Q1, è il valore per il quale il 25% delle osservazioni sono minori di esso e il 75% sono maggiori
• Q2 coincide con la mediana (50% sono minori, 50% sono maggiori)
• Il terzo quartile, Q3, è il valore per il quale il 75% delle osservazioni sono minori di esso e il 25% sono maggiori
I Quartili dividono la sequenza ordinata dei dati in 4 segmenti contenenti lo stesso numero di valori
![Page 26: Analisi Univariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°3](https://reader035.vdocuments.net/reader035/viewer/2022062300/5542eb4e497959361e8bd6e5/html5/thumbnails/26.jpg)
Output PROC UNIVARIATE (4/5) • Coeff di variazione [Coeff Variation]: misura la variabilità relativa
rispetto alla media (%)
1.85270242Std Error Mean117.061242Coeff Variation
190366.797Corrected SS329878Uncorrected SS
1.44200254Kurtosis1.59619131Skewness
810.071475Variance28.4617546Std Deviation
5738Sum Observations24.3135593Mean
236Sum Weights236N
Moments
100%|x|
sCV
![Page 27: Analisi Univariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°3](https://reader035.vdocuments.net/reader035/viewer/2022062300/5542eb4e497959361e8bd6e5/html5/thumbnails/27.jpg)
Output PROC UNIVARIATE (5/5)
1.85270242Std Error Mean117.061242Coeff Variation
190366.797Corrected SS329878Uncorrected SS
1.44200254Kurtosis1.59619131Skewness
810.071475Variance28.4617546Std Deviation
5738Sum Observations24.3135593Mean
236Sum Weights236N
Moments
• Skewness: indice che informa circa il grado di simmetria o asimmetria di una distribuzione
– γ=0 distribuzione simmetrica– γ<0 asimmetria negativa
(mediana>media)– γ>0 asimmetria positiva (mediana<media)
Misure di Forma della Distribuzione
• Kurtosis: indice che permette di verificare se i dati seguono una distribuzione di tipo Normale (simmetrica)
– β=3 se la distribuzione è “Normale”– β<3 se la distribuzione è iponormale– β>3 se la distribuzione è ipernormale
![Page 28: Analisi Univariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°3](https://reader035.vdocuments.net/reader035/viewer/2022062300/5542eb4e497959361e8bd6e5/html5/thumbnails/28.jpg)
PROC UNIVARIATE – Esempio 2
Misure di sintesi della variabile quantitativa continua numero medio ore utilizzo al giorno telefono cellulare
proc univariate data=corso.telefonia;
var cell_h;
run;
![Page 29: Analisi Univariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°3](https://reader035.vdocuments.net/reader035/viewer/2022062300/5542eb4e497959361e8bd6e5/html5/thumbnails/29.jpg)
PROC UNIVARIATE – Sintassi 2/2
Distribuzione di frequenza univariata con variabile di classificazione
proc univariate data= dataset options;class variabile_1 (options);var variabile_2;
run;
OPTIONS:• noprint non mostra i risultati nella finestra di output• (missing) considera anche la categoria “missing” (contenente tutti i
valori mancanti) della variabile di classificazione
![Page 30: Analisi Univariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°3](https://reader035.vdocuments.net/reader035/viewer/2022062300/5542eb4e497959361e8bd6e5/html5/thumbnails/30.jpg)
PROC UNIVARIATE – Esempio 3
Misure di sintesi della variabile numero medio ore utilizzo al giorno telefono cellulare suddivisa per sesso
proc univariate data=corso.telefonia;
class sesso;
var cell_h;
run;
![Page 31: Analisi Univariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°3](https://reader035.vdocuments.net/reader035/viewer/2022062300/5542eb4e497959361e8bd6e5/html5/thumbnails/31.jpg)
PROC UNIVARIATE – Esempio 4
Misure di sintesi della variabile numero medio ore utilizzo al giorno telefono cellulare suddivisa per hobby con opzione “missing”
proc univariate data=corso.telefonia;
class hobby_3(missing);
var cell_h;
run;
![Page 32: Analisi Univariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°3](https://reader035.vdocuments.net/reader035/viewer/2022062300/5542eb4e497959361e8bd6e5/html5/thumbnails/32.jpg)
Mediana(Q2)
XmassimoX
minimo Q1 Q3
25% 25% 25% 25%
Sequenza ordinata di valori assunti da una variabile
Differenza Interquartile
OUTLIERS: Q1 - 1,5 * Differenza interquartileQ3 + 1,5 * Differenza interquartile
BOX PLOT
![Page 33: Analisi Univariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°3](https://reader035.vdocuments.net/reader035/viewer/2022062300/5542eb4e497959361e8bd6e5/html5/thumbnails/33.jpg)
SAS INSIGHT: Box Plot (1/2)
![Page 34: Analisi Univariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°3](https://reader035.vdocuments.net/reader035/viewer/2022062300/5542eb4e497959361e8bd6e5/html5/thumbnails/34.jpg)
SAS INSIGHT: Box Plot (2/2)