laboratorio di fondamenti di informatica e statistica · laboratorio di fondamenti di informatica e...
TRANSCRIPT
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Università degli Studi di BergamoDipartimento di Scienze Umane e SocialiCorso di Laurea in Scienze Psicologiche
Università degli Studi di BergamoDipartimento di Scienze Umane e SocialiCorso di Laurea in Scienze Psicologiche
LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA
Prof. Paolo Cazzaniga
Dott.ssa Roberta Adorni
Dott. Agostino Brugnera
Dott. Nicola Palena
Dott.ssa Cristina Zarbo
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Importare un file datiMenù →Open →Browse →Selezionare il file
dati_originale_999.sav
Oppure richiamare il file creato nella lezione precedente
.omv
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Calcolare una variabile
Data → Compute• Diamo un nome alla nuova
variabile• Inseriamo la formula per il
calcolo della variabile (somma)
• Elenchiamo le variabili su cui applicare la formula
ESEMPIO 1: Vogliamo calcolare il punteggio somma dei punteggi ai singoli item del questionario sulla Soddisfazione di Vita
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Trasformare una variabile
ESEMPIO 2: Vogliamo calcolare il punteggio somma dei punteggi ai singoli item del questionario sull’Ottimismo
In questo caso è necessario ricodificare alcuni item del questionario (item 1, 3, 5), perché• Item 1, 3, 5: un punteggio alto esprime basso ottimismo• Item 2, 4, 6: un punteggio alto esprime alto ottimismoPer calcolare il punteggio somma in modo che rifletta un crescente ottimismo dobbiamo «invertire» il punteggio degli item 1, 3, 5, ricorrendo alla formula
OTTxric = 6 – OTTx
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Trasformare una variabile
Data → Transform• Diamo un nome alla nuova variabile• Definiamo la variabile su cui applicare la trasformazione (source variable)• Definiamo il tipo di trasformazione selezionando create new tranform →
edit, poiché la formula che vogliamo usare non compare fra quelle di default
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Trasformare una variabileNella finestra che si apre• Diamo un nome alla formula• Scriviamo la formula da applicare (usando la dicitura «$source» possiamo
usare la formula anche per altre variabili)
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Trasformare una variabile
Ripetiamo la stessa operazione per gli altri item da ricodificare (OTTI3, OTTI5), richiamando la formula appena creata
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Calcolare una variabileA questo punto possiamo calcolare il punteggio somma del questionario Ottimismo
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Filtrare i datiData → Filters
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Esercizio 1. Filtro: solo maschi
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Aggiungere/Disattivare un Filtro
Se clicchiamo sul +
possiamo aggiungere un secondo
filtro
Possiamo disattivare il primo tramite questo pulsante in modo tale che rimanga salvato se servisse per analisi future
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Esercizio 2. Filtro: maschi, >= 50 anni
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Esercizio 3.
• Filtro: solo femmine che vivono da sole
• Filtro: solo maschi, coniugati, <50 anni
Esercizio 4.
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Trasformare una variabile
ESEMPIO 3: Supponiamo di dover riclassificare la variabile ETA’, in modo da suddividere il campione in 3 o 4 fasce d’età.
• Individuiamo le fasce d’età sulla base dei terzili o dei quartili.
• Nella sezione delle statistiche descrittive (Analyses – Exploration– Descriptives) individuiamo i terziliper suddividere l’età in 3 classi, o i quartili per suddividere l’età in 4 classi
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Trasformare una variabile scala in una variabile di più basso livello → ETA
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Utilizziamo la funzione IF
Per dividere in 4 diversi gruppi la V ETA, secondo i quartili del campione
Attraverso il tasto compute
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Trasformare una variabile scala in una variabile di più basso livello → ETA
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Trasformare una variabile
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Statistiche descrittive
Analyses → Exploration →DescriptivesSi apre il menu delle analisi
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Grafici per DescrittiveAnalyses → Exploration, poi clicchiamo su «Plots»
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Grafici per DescrittivePer creare grafici di qualità migliore è possibile copiare la tabella di interesse in Excel e generare il grafico
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Grafici in Excel1. Riportare i dati
estrapolati dalle descrittive in Jamoviattraverso le Frequencytables (ad esempio per la variabile ST CIV)
2. Selezionare tutte le celle di interesse
3. Cliccare in alto su «inserisci» in modo tale che appaiano le strutture dei grafici che possono essere costruiti
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Grafici in Excel: diagramma a barre
Selezionare il grafico desiderato, ad esempio il diagramma a barre.
Il grafico verrà inserito in modo automatico
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Grafici in Excel: torta
Selezionare il grafico desiderato. In questo caso, il grafico a torta.
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Operazioni possibili: aggiungere etichette
Cliccare con il tasto destro direttamente sul grafico e cliccare su «aggiungi etichette dati»
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Operazioni possibili: aggiungere e modificare etichette
In questo modo ha aggiunto i valori corrispondenti ad ogni livello della variabile ST CIV direttamente nel grafico.
Nel caso si volessero le percentuali al posto dei valori, basta cliccare ancora con il tasto destro sul grafico e richiederlo attraverso il tasto «formato etichette dati»
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Grafici in ExcelINOLTRE
Si può modificare il titolo del grafico inserendo il nome della variabile di
interesse. In questo caso «STATO CIVILE»
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Descrittive: funzione «split by»
NB: solo con variabili misurate su scala nominale!
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Descrittive: funzione «split by»
Se richiedo i grafici con la funzione split by, Jamovi creerà i grafici dividendo i dati per i livelli della variabile nominale selezionata.
In questo caso dividendo per i due livelli della variabile SEX: maschi e femmine.
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Descrittive: grafici con la funzione «split by»
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Ripasso: Statistiche descrittive• Il calcolo delle statistiche descrittive di una variabile
consiste nel misurare quei parametri, come la media e la deviazione standard, che sintetizzano come sono distribuiti nel campione i valori che essa può assumere
• E’ utile per verificare se i valori si distribuiscono secondo un andamento normale oppure se alcuni di essi sbilanciano la distribuzione
• Le statistiche descrittive sono una valutazione preliminare importante per controllare la “normalità”della distribuzione, necessaria per procedere in molte delle elaborazioni statistiche successive
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Curva normale e distribuzione dei dati
• Se rappresentiamo un dato raccolto da un grafico poligonale di frequenza e la curva risultante non simula la curva di distribuzione normale (con tutte le sue caratteristiche), questi dati non sono normalmente distribuiti
• Nello specifico, cosa andiamo a valutare?
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Indici per testare la normalità:Asimmetria e Curtosi
Asimmetria: misura l'asimmetria dei dati• Positiva o destra: coda destra più lunga• Negativa o sinistra: coda sinistra più lunga
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Indici per testare la normalità:Asimmetria e Curtosi
Curtosi: misura il picco di distribuzione dei dati.La curtosi della distribuzione normale è 0.
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Misure di forma della distribuzione
Skewness (asimmetria): indice che informa circa il grado di simmetria o asimmetria di una distribuzione• SK = 0 distribuzione simmetrica• SK < 0 asimmetria negativa (mediana>media)• SK > 0 asimmetria positiva (mediana<media)Kurtosis (curtosi): indice che permette di verificare se i dati seguono una distribuzione di tipo «Normale»• KU = 0 distribuzione Normale• KU < 0 distribuzione platicurtica (rispetto alla distribuzione normale ha
frequenza di densità minore per valori molto distanti dalla media)• KU > 0 distribuzione leptocurtica (rispetto alla distribuzione normale ha
frequenza di densità maggiore per valori molto distanti dalla media)
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Misure di forma della distribuzione
Le distribuzioni delle variabili deviano fortemente dalla distribuzione normale se:
• Criterio stringente → valori di asimmetria e curtosi maggiori di |1| (Barbaranelli, 2007)
• Criterio più tollerante → valori di asimmetria maggiori di |2| e di curtosi maggiori di |7| (West, Finch, & Curran, 1995)
In questi casi è possibile trasformare i dati per «normalizzarli»
UNIVERSITÀ DEGLI STUDI DI BERGAMO
• Asimmetria positiva molto elevata (> 2) = trasformazione nel reciproco (X*=1/X)
• Asimmetria positiva sostanziale (tra 1 e 2) = trasformazione logaritmo (X*=Log10(X)) o trasformazione Radice Quadrata (X*=SQRT(X))
• Asimmetria negativa molto elevata (> -2) = trasformazione nel reciproco (X*=1/(K-X))
• Asimmetria negativa sostanziale (tra -1 e -2) = trasformazione logaritmo (X*=Log10(K-X)) o trasformazione Radice Quadrata (X*=SQRT(K-X))
K è uguale al valore più alto della variabile X, + 1
Strategie per la trasformazione dei dati
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Misure di forma della distribuzione -Jamovi
ESEMPIO 1: consideriamo la variabile «SODVITtot». La distribuzione dei dati è approssimabile a una distribuzione normale?
Seleziono questa variabile in Jamovi e richiamo le statistiche descrittive rilevanti
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Misure di forma della distribuzione -Jamovi
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Misure di forma della distribuzione -Jamovi
ESEMPIO 2: consideriamo la variabile «OTTItot». La distribuzione dei dati è approssimabile a una distribuzione normale?
Seleziono questa variabile in Jamovi e richiamo le statistiche descrittive rilevanti
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Misure di forma della distribuzione -Jamovi
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Misure di forma della distribuzione -Jamovi
ESEMPIO• Importiamo il file dati_2lezione_DNN• Calcoliamo la variabile «SODVIT – somma»Come si distribuisce questa variabile?• Richiamiamo le statistiche descrittive
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Misure di forma della distribuzione -Jamovi
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Misure di forma della distribuzione -JamoviCurtosi= -1.28 → Asimmetria negativa sostanziale (tra -1 e -2)• trasformazione logaritmo (X*=Log10(K-X)), oppure• trasformazione Radice Quadrata (X*=SQRT(K-X))
N.B. K = Xmax + 1nel nostro caso 35+1=36
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Misure di forma della distribuzione -Jamovi
UNIVERSITÀ DEGLI STUDI DI BERGAMO
E’ necessario:
• Standardizzare i punteggi relativi alla variabile da analizzare
• Effettuare una distribuzione delle frequenze della nuova variabile standardizzata
• Individuare i punteggi che corrispondono a un valore “z” maggiore di 3 in valore assoluto e considerarli come possibili valori anormali
Provare a fare le analisi sia senza questi possibili outliers che con i possibili outliers. Se i risultati non cambiano più di tanto si possono comunque tenere anche i punteggi definibili come outliers.
Individuare gli outliers
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Individuare gli outliersTorniamo al filedati_originale_999
Esempio 1: consideriamo la variabile SODVITtot.
Per individuare gli outliers dobbiamo trasformare i punteggi in z, ovvero
Calcolare una nuova variabile ricorrendo alla procedura «compute variable» e scegliendo la funzione «Z»
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Individuare gli outliersOra calcoliamo le statistiche descrittive della nuova variabile e vediamo se ci sono valori z > |3|
In questo caso non ci sono outliers da escludere dalle analisi
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Individuare gli outliersEsempio 2: consideriamo la variabile OTTItot.
Per individuare gli outliers dobbiamo trasformare i punteggi in z, ovvero
Calcolare una nuova variabile ricorrendo alla procedura «compute variable» e scegliendo la funzione «Z»
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Individuare gli outliersOra calcoliamo le statistiche descrittive della nuova variabile e vediamo se ci sono valori z > |3|
In questo caso ci sono valori di z < -3, quindi ci sono outliers da escludere dalle analisi
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Individuare gli outliersL’ultimo passaggio consiste nel filtrare i dati in modo da escludere gli outliers
Attivando o disattivando il filtro, potremo confrontare le statistiche con o senza outliers
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Ringraziamenti
Si ringrazia il Prof. Andrea Greco per il materiale fornito