chi lo dice? - liceomeda.it alla... · questionari interviste (anche telefoniche) exit poll ... uso...

Post on 16-Feb-2019

215 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Non lasciamoci ingannare …..CHI LO DICE?

I dati possono anche provenire da una fonte autorevole, ma la conclusione …

Come è stata posta la domanda?…

Come è stato selezionato il campione?…

COME SONO STATI OTTENUTI QUESTI DATI?

Quanto numeroso è il campione?…

MA HA PROPRIO SENSO?

Un po’ di sano buonsenso …

Il caro buon vecchio Trilussa ….

LA STATISTICA

Sai ched‘ è la statistica? È ‘na cosache serve pe’ fà un conto in generalede la gente che nasce, che sta male,che more, che va in carcere e che sposa.

Ma pe’ me la statistica curiosaè dove c'entra la percentuale,pe’ via che lì la media è sempre egualepuro co' la persona bisognosa.

Me spiego: da li conti che se fannosecondo le statistiche d'adessorisulta che te tocca un pollo all'anno:

e, se nun entra nelle spese tue,t'entra ne la statistica lo stessoperchè c'è un antro che ne magna due.

La scienza è fatta di dati come una casa di pietre.Ma un ammasso di dati non è scienza più di quanto

un mucchio di pietre sia una casa.(Jules Henri Poincaré)

Il termine “statistica” venne introdotto nel diciassettesimo secolo col significato di “scienza dello stato”, volta a raccogliere e ordinare informazioni utili all’amministrazione pubblica: entità e composizione della popolazione, movimenti migratori, mutamenti anagrafici, tavole di natalità e mortalità, dati sui commerci, sui raccolti, sulla distribuzione della ricchezza, sull’istruzione e la sanità.

Cos’è la statistica?

� La STATISTICA si occupa di raccogliere ed elaborare informazioni su un fenomeno che si vuole studiare.

� La raccolta e l’elaborazione dei dati costituiscono l’INDAGINE STATISTICAvera e propria.

Indagini statisticheFasi di un’indagine statistica

1. Individuazione dell’obiettivo da raggiungere, definendo con accuratezza i termini del problema a cui bisogna dare risposta, cioè quali variabili statistiche bisogna osservare.

2. Individuazione dei metodi, dei mezzi e dei tempida utilizzare nella raccolta dati. Per quanto riguarda i metodi è fondamentale decidere se l’osservazione viene fatta su tutta la popolazione oppure su un campione.

Indagini statistiche3. Programmazione dell’indagine ed effettiva

rilevazione dei dati. Una raccolta dei dati ben organizzata, risparmia fatica nelle operazioni successive e permette la corretta impostazione del lavoro di analisi.

4. Sistemazione dei dati raccolti in forma di facile lettura (tabelle e grafici). I dati allo stato grezzo sono riferiti alla singola unità statistica

5. Determinazione di valori che descrivono sinteticamente il fenomeno: media, moda, mediana …...

Indagini statistiche

6. Calcolo delle misure di dispersione che indicano quanto le misure di tendenza (per esempio la media) si discostano dai dati raccolti.

7. Determinazione di rapporti statistici o numeri indici: rapporti tra numeri che a volte sono piùsignificativi dai valori assoluti. (es. rapporto tra m2 edificati in una regione e il numero di abitanti della regione)

Indagini statisticheLa statistica descrittiva si occupa di individuare

metodi e tecniche per sintetizzare l’informazione contenuta nei dati.

Gli strumenti di sintesi sono essenzialmente di tre tipi:

• tabelle (vedremo con EXCEL quali sono le possibilità)

• rappresentazioni grafiche (vedi EXCEL)• indici sintetici

Nelle indagini statistiche a campione occorre effettuare delle generalizzazioni di cui si occupa la statistica inferenziale.

Indagini statistiche

IMPORTANTE

Quando sintetizziamo l’informazione contenuta nei dati, ne perdiamo una parte. Gli strumenti di sintesi devono essere scelti in modo tale da:

• preservare , per quanto possibile, l’informazione rilevante per il problema analizzato

• eliminare l’informazione non necessaria

COME RACCOGLIERE I DATI� SCHEDE� QUESTIONARI � INTERVISTE (ANCHE TELEFONICHE)� EXIT POLL

Tipo della rilevazioneTotale : viene effettuata su tutte le unità statistiche della popolazione (censimento) costi elevati e tempi elevati risultati affidabili

Parziale (o campionaria): viene effettuata su una parte (o campione) della popolazione costi contenuti rapidità risultati approssimati

Occasionale: fatta "quando serve“ sondaggi d'opinione

Periodica: fatta regolarmente "ogni tanto tempo“ censimento (10 anni)

EsempioConsideriamo l’indagine condotta su 30 famiglie per stabilire il numero

dei figli

La POPOLAZIONE statistica è l’insieme degli elementi oggetto dell’indagine, cioè le 30 famiglie.

Il CARATTERE dell’indagine statistica è l’aspetto che si vuole studiare, cioè il numero dei figli.

I DATI o le MODALITA’ di un carattere sono le informazioni acquisite all’interno della popolazione, nel nostro caso sono i numeri 0,1,2,3,4.

n.figli 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 300 x x1 x x x x x x x x x x2 x x x x x x x x x3 x x x x x x4 x x x

Un po’ di definizioni ……

La frequenza assoluta ni di un generico dato statistico xi è il numero delle volte in cui il dato si presenta nell’indagine. Ad es. il dato 3 (figli) ha frequenza assoluta 6.

La frequenza totale (N) è la somma delle frequenze assolute, nel nostro caso 30.

La frequenza relativa fi è il rapporto tra la frequenza assoluta e la frequenza totale

cioèN

nf

i

i =

…….

Moltiplicando la frequenza relativa per 100 si ottiene la frequenza percentuale, pi

Dopo aver ordinato i dati quantitativi in ordine crescente si chiama frequenza cumulata Fi di un dato xi la somma della frequenza del dato stesso con le frequenze di tutti i dati che lo precedono

Natura dei caratteri� I caratteri qualitativi vengono indicati mediante

espressioni verbali. Sono caratteri qualitativi lo stato civile (celibe o nubile, coniugato/a, ecc.), il sesso (maschio o femmina), il colore degli occhi (grigi, azzurri, verdi, castani, neri..)

� I caratteri quantitativi sono esprimibili numericamente e si dividono in:

� caratteri discreti, come il numero degli alunni di una classe, o di reti segnate in una partita di calcio, possono assumere solo determinati valori, quasi sempre numeri interi.

� caratteri continui, quali i pesi, le stature e più in generale le grandezze che possono essere misurate, possono assumere qualsiasi valore reale in un dato intervallo (anche se usualmente si impiegano numeri decimali finiti).

Matrice dei dati

Matrice dei dati relativa ad una rilevazione statistica sugli studenti iscritti al corso diLaurea in Economia Aziendale

23marroni17876112

03Neri17478111

11neri18378110

22marroni1807209

12azzurri1848318

01marroni1737407

12neri1787516

13azzurri1808105

01marroni1827504

02neri1807013

21marroni180721 (m)2

11azzurri170650 (f)1

n. fratelli

Anno di corso

Colore occhi

Altezza (cm)

Peso(kg)SessoUnità

COME RAPPRESENTARE I DATI

� SERIAZIONE STATISTICA: Tabella contenente frequenze di intensità di un carattere QUANTITATIVO

� SERIE STATISTICA: Tabella contenente frequenze di modalità di un carattere QUALITATIVO

� SERIE STORICHE: Tabella contenente intensità di un carattere QUANTITATIVO rilevato per modalità TEMPORALI ( p.es. le vendite di automobili negli ultimo 10 anni)

Il modo più semplice ed immediato per rappresentare i dati ècostituito da tabelle.

Esiste una classificazione

2.000laurea

9.000diploma

5.000lic. Media

1.000lic. elementare

N. PERSONE

TITOLO DI STUDIO

507

1006

1505

3.0004

2.0003

5002

3001

n. APPARTAMENTIn. STANZE

Serie statistica

Seriazione statistica

104.200-4.600

403.800-4.200

1343.400-3.800

2543.000-3.400

1202.600-3.000

322.200-2.600

101.800-2.200

N°neonatiPeso (in grammi)

10.0002003

23.0002002

22.0002001

17.0002000

18.0001999

20.0001998

15.0001997

10.0001996

VENDITE AUTOANNO

Seriazione statistica con dati divisi in classi

Si suddividono i dati in classi quando il carattere analizzato ècontinuo

Serie temporale

100%

10%

10 %

20 %

20 %

40 %

Frequenza percentuale

100%

90%

80%

60%

40%

Frequenza cumulata

Carattere Frequenza assoluta

Frequenza relativa

0 20 0,4

5 10 0,2

10 10 0,2

15 5 0,1

20 5 0,1

TOTALE 50 1

f relativa = f assoluta / Totale

Come esempio si riportano i risultati su un’indagine condotta su un gruppo di 50 persone relativa al numero di sigarette fumate ogni giorno:

Talvolta può essere utile calcolare anche la frequenza cumulata (percentuale o relativa)

USO DEI GRAFICI

I dati raccolti in tabelle possono essere rappresentati attraverso grafici che offrono il

vantaggio di una descrizione del fenomeno in forma visiva.

Possono essere utilizzati i seguenti tipi di grafic i:� Diagrammi cartesiani� Istogrammi e ortogrammi� Diagrammi a nastro� Diagrammi circolari� Diagrammi polari� Cartogrammi� Ideogrammi

Diagrammi cartesianisono usati soprattutto per le serie

temporali

0

5

10

15

20

25

0 2 4 6 8 10 12 14 16

IstogrammiSi usano per rappresentare seriazioni continue con i dati raggruppati in classi.In generale, le aree dei rettangoli sono proporzionali alle frequenze.Se le classi hanno tutte la stessa ampiezza, le altezze dei rettangoli sono proporzionali alle frequenze.

Istogramma delle altezze

0

1

2

3

4

5

6

7

8

9

<160 161-165 166-170 171-175 176-180 181-185 186-190 191-195 >195

classi

frequenze assolute

OrtogrammiSono simili agli istogrammi ma usati per serie statistiche (cioè anche per dati qualitativi). Possono anche caratterizzarsi per pipiùù rettangolirettangoliaffiancati

Domanda 2.5 Qual è il modo migliore per ricevere c omunicazioni e informazioni dalla scuola

0

50

100

150

200

250

PROGRAMMATORI GEOMETRI IGEA NON SPECIFICATO TOTALE

cellulare internet posta

diario modulo lib.giust.

telefono

Diagrammi a nastro

5 0 0 0

2 5 0 0 0

1 5 0 0 0

1 0 0 0 0

1 8 0 0 0

5 0 0 0 0

2 0 0 0 0

2 0 0 0 0

0 1 0 0 0 0 2 0 0 0 0 3 0 0 0 0 4 0 0 0 0 5 0 0 0 0 6 0 0 0 0

A

B

C

D

E

F

G

H

Diagrammi circolari o diagrammi a torta3%

1 5%

9%

6%

1 1%3 2%

1 2%

1 2%

A B C D E F G H

Le ampiezze degli angoli al centro dei settori colorati sono direttamenteproporzionali alle frequenze percentuali. Ad esempio, per la zona arancio si ha:X:360°=32:100 cioè x=125,2°

Diagrammi circolari

T o r ta t r id im e n s io n a le

3%1 5%

9%

6%

1 1%3 2%

1 2%

1 2%

A B C D E F G H

Diagrammi polarisono usati per particolari serie storiche con carattere di ciclicità

assenze

01020304050lunedì

martedì

mercoledìgiovedì

venerdì

assenze

Cartogrammi Sono utilizzati per rappresentare serie territoriali

7,3

11

20,1

Ideogrammi Sono rappresentazioni mediante figure stilizzate che rappresentano il fenomeno studiato

anni

Auto vendute

top related