descrizione dei dati metodi di descrizione dei dati tabelle tabelle di frequenza tabelle con...

Post on 01-May-2015

247 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Descrizione dei dati

Metodi di descrizione dei dati

Tabelle Tabelle di frequenza Tabelle con statistiche descrittive Tabelle con statistiche inferenziali

Grafici Distribuzioni di frequenza (o di probabilità) Grafico di dispersione Grafici lineari Grafici a barre Grafici a serie temporale

Tabella di frequenza

Tabella delle statistiche descrittive

La tabella riporta indici di dispersione (varianza, dev. standard, quartili, percentili,ecc…) e indici di tendenza centrale (media, mediana, moda). Inoltre, può riportare numerosità, valori minimi e massimi, asimmetria e curtosi dei dati.

Tabella delle statistiche inferenziali

La tabella riporta gli indici dei test statistici (t di Student, chi quadro, F) e la loro significatività. In aggiunata possono essere riportati altri indici (errori di misura, somme dei quadrati, gradi di libertà, ecc…)

Tabella per l’analisi di varianza:

Tabella per l’analisi fattoriale:

Tabella delle correlazioni bivariate:

È possibile creare tabelle miste (con statistiche descrittive e inferenziali):

Rappresentazioni grafiche dai dati (grafici).

Le rappresentazioni grafiche dei dati, in generale, vengono riportate su un diagramma cartesiano, composto da due assi, l’ascissa (asse orizz.) e l’ordinata (asse verticale). Sull’ascissa si riportano i livelli o valori della var. indipendente; sull’ordinata si riportano i valori (frequenze, proporzioni, percentuali, grandezze) della var. dipendente.

Distribuzioni di frequenza (o di probabilità)

Sull’ascissa abbiamo i valori della var. indipendente e sull’ordinata le frequenze (o proporzioni o percentuali).

Istogramma:

Poligono delle frequenze:

Distribuzione cumulativa delle frequenze:

Distribuzione normale delle frequenze:

Grafico di dispersione

Il grafico di dispersione riporta la relazione tra due variabili. Sull’ascissa si riportano i valori della prima variabile e sull’ordinata i valori della seconda variabile.

Grafici lineari

I grafici lineari vengono usati per rappresentare le relazione o funzione che lega la var. dipendente alla var. indipendente. Si usano quando sia la var. indipendente, sia la var. dipendente sono misurate su scale quantitative.

Grafico a barre: si usa quando la var. indipendente è qualitativa (categorie o gruppi).

Non si dovrebbe usare una grafico a linee per rappresentare le relazione tra var. dip. e var. indip. quando quest’ultima è qualitativa, poiché non sono ammissibili valori della var. indip. intermedi.

Grafico a linea scorretto:

Grafico a linea corretto:

Grafici a serie temporale

Questi grafici rappresentano le variazioni dei valori della var. dipendente in funzione del tempo.

Variazione del valore dei titolidella borsa di Milano:

Rappresentazione dellavarianza dei dati nei grafici

Grafici con barre di errore

box-and-wisker plot

Struttura di una matrice di datiLa matrice di dati è una tabelle dove per riga abbiamo le singole osservazioni (soggetti) e per colonna le variabili dipendenti e indipendenti. Solitamente, le variabili dip. sono dette “misure” e sono i valori usati per l’analisi statistica, mentre le var. indipendenti sono dette “fattori” e specificano quali livelli della variabile vengono messi a confronto.

misura

fattori

Controllo della matrice dei dati

dati non validi: sono dati errati perché inseriti scorrettamente. Una volta individuati è necessario correggerli

dati mancanti (od omessi): sono dati che mancano perché il soggetto non ha risposto. Se la percentuale di dati mancanti è troppo alta, il soggetto viene escluso dall’analisi.

dati isolati: sono dati anomali improbabili, dovuti a qualche effetto estraneo intervenuto durante il test. Un criterio abbastanza seguito è quello di eliminare i dati che hanno 3 o più deviazioni standard lontano dalla media.

top related