1 esercitazione riepilogo di statistica descrittiva

24
1 ESERCITAZIONE RIEPILOGO di Statistica Descrittiva

Upload: nicostrato-piccinini

Post on 02-May-2015

240 views

Category:

Documents


5 download

TRANSCRIPT

Page 1: 1 ESERCITAZIONE RIEPILOGO di Statistica Descrittiva

1

ESERCITAZIONERIEPILOGO di Statistica

Descrittiva

Page 2: 1 ESERCITAZIONE RIEPILOGO di Statistica Descrittiva

2

ESERCITAZIONEMISURE DI TENDENZA

CENTRALE

Page 3: 1 ESERCITAZIONE RIEPILOGO di Statistica Descrittiva

3

Il Monte dei Paschi di Siena vuole fare una propaganda mirata per emettere più carte di credito ricaricabili. Se la banca dispone delle seguenti informazioni su quale gruppo di individui sicuramente avrà più presa se fa una propaganda mirata?

Livello di istruzione dei titolari attuali

Numero di titolari

Licenza elementare 100

Licenza media 150

Licenza media superiore 250

laurea 400

Il carattere è qualitativo ordinale posso calcolare la mediana

Page 4: 1 ESERCITAZIONE RIEPILOGO di Statistica Descrittiva

4

Livello di istruzione dei titolari attuali

Numero di titolari

Nj Fj

Licenza elementare

100 100 0.11

Licenza media

150 250 0.28

Licenza media superiore

250 500 0.56

laurea 400 900 1.00

Me=licenza media inferiore

Il carattere è qualitativo ordinale la miglior misura di tendenza centrale è la mediana. La banca potrebbe decidere di fare una pubblicità target su coloro che hanno titolo minore o uguale alla Mediana cioè la licenza media superiore.

Page 5: 1 ESERCITAZIONE RIEPILOGO di Statistica Descrittiva

5

Supponiamo di aver letto sui giornali le seguenti informazioni sulla % di pubblicità che viene effettuata Italia e in Germania.

TV 54,8%

Stampa 28,7%

Radio 5,9%

Internet 2,5%

altro 8,1%

TV 31,9%

Stampa 51,9%

Radio 4,8%

Internet 4,5%

altro 6,9%

Con quale misura di tendenza centrale potremmo sintetizzare l’informazione?

Page 6: 1 ESERCITAZIONE RIEPILOGO di Statistica Descrittiva

6

I dati riportati sono le quotazioni di un titolo in borsa rilevati negli ultimi cinque mesi:

2.5, 1.8, 3, 2.6, 4

Se il valore 2.6 fosse erroneamente trascritto come 26 quale sarebbe l'effetto sulle seguenti misure di tendenza centrale e perché?

a) Un incremento della media aritmetica.b) Un incremento della mediana.c) Un incremento della moda.

Page 7: 1 ESERCITAZIONE RIEPILOGO di Statistica Descrittiva

7

Giorni 1° 2° 3° 4° 5° 6° 7° 8° 9° 10° rimorchiatori 4 5 3 2 1 5 3 2 1 3

La seguente tabella riporta il numero di rimorchiatori osservati in 10 giorni nel porto di Napoli.

a)In media nel porto ci sono più rimorchiatori nei primi 5 giorni o nei restanti 5?

Page 8: 1 ESERCITAZIONE RIEPILOGO di Statistica Descrittiva

8

Alla sede centrale delle poste di Firenze si rilevano i tempi di attesa per usufruire del servizio su cinque clienti.

50 30 25 15 10

Entra un nuovo cliente che ha molta fretta e domanda all’impiegato quanto più o meno deve attendere in fila. L’impiegato risponde non più di 10 minuti. Valutare tale risposta sulla base dei dati a disposizione.

Se fosse attendibile l’affermazione dell’impiegato dovrei osservare una media dei tempi di attesa inferiore o al massimo uguale a 10. Uno sguardo ai dati fa capire che tale affermazione è completamente arbitraria, perché?

Page 9: 1 ESERCITAZIONE RIEPILOGO di Statistica Descrittiva

9

Supponiamo che un ricercatore sia interessato a valutare se la distanza tra il valore aggiunto pro-capite delle aziende più ricche e di quelle più povere sia sostanzialmente diverso tra Sicilia e Piemonte sulla base delle seguenti informazioni.

sicilia piemonte25 4832 4381 2050 2849 2643 2364 2948 80

Page 10: 1 ESERCITAZIONE RIEPILOGO di Statistica Descrittiva

10

v.a. Fi

25 0,125

32 0,25

43 0,375

48 0,5

49 0,625

50 0,75

64 0,875

81 1

SICILIA: Q3/Q1=50/32=1,56

v.a. Fi

20 0,125

23 0,25

26 0,375

28 0,5

29 0,625

43 0,75

48 0,875

80 1

PIEMONTE:

Q3/Q1=43/23=1,89C’è più distanza tra i valori aggiunti in Piemonte che in Sicilia

Page 11: 1 ESERCITAZIONE RIEPILOGO di Statistica Descrittiva

11

Esercizi vari

Page 12: 1 ESERCITAZIONE RIEPILOGO di Statistica Descrittiva

12

I valori standardizzati

Se il carattere quantitativo X ha media µ e deviazione standard σ allora è possibile sempre ottenere i suoi valori standardizzati

ii

xy i=1…n

La distribuzione del carattere Y avrà allora media zero e deviazione standard uguale ad 1

Page 13: 1 ESERCITAZIONE RIEPILOGO di Statistica Descrittiva

13

esempio

Supponiamo di aver osservato i seguenti valori

2, 4, 5, 5 , 6, 8, 10, 12, 18, 20

µ=9

σ =5.73

I valori standardizzati saranno dati da:

y1=(2-9)/5,73=-1.22

y2=(4-9)/5,73=-0.35 ecc..

Page 14: 1 ESERCITAZIONE RIEPILOGO di Statistica Descrittiva

14

Caso di studioL’andamento dei

consumi e dei redditi in USA negli anni (1921-1942)

  

Un ricercatore vuole studiare l’andamento dei consumi e dei redditi in USA negli anni 1921-1942. Ha a disposizione la seguente serie storica dei consumi e redditi in USA dal 1921 al 1942.

ANNO CONSUMO REDDI TO 1921 39,20 43,70 1922 41,90 40,60 1923 45,00 49,10 1924 49,20 55,40 1925 50,60 56,40 1926 52,60 58,70 1927 55,10 60,30 1928 56,20 61,30 1929 57,30 64,00 1930 57,80 67,00 1931 55,00 57,70 1932 50,90 50,70 1933 45,60 41,30 1934 46,50 45,30 1935 48,70 48,90 1936 51,30 53,30 1937 57,70 61,80 1938 58,70 65,00 1939 57,50 61,20 1940 61,60 68,40 1941 65,00 74,10 1942 69,70 85,30

Page 15: 1 ESERCITAZIONE RIEPILOGO di Statistica Descrittiva

15

 Sviluppare lo studio del ricercatore. Tenendo presente che le domande a cui vuole rispondere sono le seguenti:

• la media del consumo di quanto è inferiore a quella del reddito?

• la serie dei consumi e dei redditi presentano la stessa variabilità?

• a quanto ammontano le mediane del consumo e del reddito?

Page 16: 1 ESERCITAZIONE RIEPILOGO di Statistica Descrittiva

16

Analisi del caso di studio: SINTESI DEI RISULTATI

La media del consumo è 53.22 dollariQuella del reddito è di 57.66 dollari La deviazione standard è 7.39 e 10.94 La mediana è 52.7 e 57.75  Allora possiamo dire che il reddito medio è in genere

più alto che il consumo medio.La variabilità del reddito rispetto alla media sembra più

alto CV(consumo)=53.22/7.40=0.13CV(reddito)=57.66/10.94=0.18 

In conclusione la variabilità del reddito è più alta di quella del consumo 

Page 17: 1 ESERCITAZIONE RIEPILOGO di Statistica Descrittiva

17

0,00

20,00

40,00

60,00

80,00

100,00

1 4 7

10

13

16

19

22

CONSUMO

REDDITO

I consumi e i redditi hanno un andamento crescente per i primi 10 anni. Intorno agli anni ’30 (recessione) cominciano a decrescere per poi risalire inseguito

Page 18: 1 ESERCITAZIONE RIEPILOGO di Statistica Descrittiva

18

Esercizio 1 Su un gruppo di 10 individui sono state raccolte le seguenti informazioni: X=genere, Y=stipendio medio mensile, Z=giudizio personale sul livello di reddito percepito (I=insufficiente, M=Medio, B=Buono)

Individui X Y Z 1 M 1350 B 2 F 1420 B 3 F 1230 M 4 F 1100 M 5 M 870 I 6 M 1100 I 7 F 1200 B 8 F 1210 B 9 F 1300 M 10 M 1400 B a) per ciascuna variabile si definisca la scala di misura b) quale rappresentazione grafica si potrebbe fare per ognuna delle tre variabili? c) per ciascuna variabile si costruisca la distribuzione di frequenza d) per ciascuna variabile si calcoli l’indice di tendenza centrale più appropriato e) si consideri il carattere Y, e si supponga che in un altro gruppo di individui si sia ottenuta una

media pari a 1100 e una varianza pari a 23000, in quale dei due gruppi si ha la variabilità maggiore?

Giustificare le risposte con la teoria.

Page 19: 1 ESERCITAZIONE RIEPILOGO di Statistica Descrittiva

19

Giudizio Licenziati

Sufficiente 37,1

Buono 26,4

Distinto 19,2

Ottimo 17,3

100,0

Esercizio

Si consideri la distribuzione degli alunni della scuola secondaria di primo grado per giudizio riportato all’esame di Stato nell’Anno scolastico 2006/07 in Italia (dati Istat)

a) Determinare la moda e la mediana.b) Misurare l’eterogeneità della distribuzione

19

Page 20: 1 ESERCITAZIONE RIEPILOGO di Statistica Descrittiva

20

Giudizio Licenziati

Sufficiente 37,1 0,371 0,371

Buono 26,4 0,264 0,635

Distinto 19,2 0,192 0,827

Ottimo 17,3 0,173 1

100,0 1,000

La moda, ossia la modalità più frequente, è sufficiente

Si tratta di una distribuzione percentualeFjfj

Per il calcolo della mediana sulla colonna delle frequenze relative cumulate si individua la prima Fj che è uguale o maggiore di 0,5La mediana è Buono

20

Page 21: 1 ESERCITAZIONE RIEPILOGO di Statistica Descrittiva

21

Giudizio Licenziati

Sufficiente 37,1 0,371 0,1376

Buono 26,4 0,264 0,0697

Distinto 19,2 0,192 0,0369

Ottimo 17,3 0,173 0,0299

100,0 1,000 0,2741

fj f2j

7259,02741,01f1EK

1j

2j1

b) Eterogeneità della distribuzione

75,043

K1K

E0 1

968,075,0

7259,0e1

21

Page 22: 1 ESERCITAZIONE RIEPILOGO di Statistica Descrittiva

22

Si consideri la seguente distribuzione di 100 imprese per classi di fatturato:

Classi di fatturato (migliaia di euro)

N. imprese

(0-20] 30

(20-50] 50

(50-100] 20

Totale 100

a) Rappresentare graficamente la distribuzioneb) Determinare la moda

22

Esercizio

Page 23: 1 ESERCITAZIONE RIEPILOGO di Statistica Descrittiva

23

Classi di fatturato (migliaia di euro)

nj Ampiezza classe

(aj)

Densità di freq (hj)

0-20 30 20 1,5

20-50 50 30 1,67

50-100 20 50 0,4

Totale 100

a) Costruzione dell’istogramma.Le classi hanno diversa ampiezza. E’ necessario calcolare la densità di frequenza

b) La classe modale è quella che ha la densità di frequenza maggiore. Quindi la classe modale è 20-50

23

Page 24: 1 ESERCITAZIONE RIEPILOGO di Statistica Descrittiva

24

0 20

1,5

50

1,7

100

ih

ISTOGRAMMA

24