deskriptivna statistika spss - efos · kolegij: statistička analiza poslovnih podataka on-line...
TRANSCRIPT
Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.
Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 1
Deskriptivna statistika SPSS
PODJELA STATISTIČKIH METODA
• metode deskriptivne (opisne) statistike
• metode inferencijalne statistike
• regresijska i korelacijska analiza
• analiza vremenskih nizova
Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.
Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 2
Deskriptivna statistika
opisuju se statistički podaci koristi brojčane i grafičke metode kako bi
prikupljene podatke prikazala na razumljiv i jasan način
METODE INFERENCIJALNE STATISTIKE
• Inferencijalna statistika donosi zaključke o populaciji na temelju izabranog uzorka koristeći
– procjene
– testiranja hipoteza
– određivanja veza između varijabla
– predviđanja o populaciji
Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.
Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 3
Osnovna podjela inajčešći pokazatelji
Deskriptivnastatistika
Mjeresredišta
Aritmetičkasredina
Mod
Medijan
Kvartili
Mjeredisperzije
Varijanca
Standardnadevijacija
Mjereasimetrije
Skewnesi
Mjerazaobljenosti
Kurtosis
Mjere središnje tendencije
Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.
Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 4
Aritmetička sredina
• početak analize distribucije frekvencija
• opisuju središte (centar) distribucije podataka
• pojašnjavaju odnos između velikog broja promatranih podataka
• najčešće korištena mjera središnje tendencije
Tumačenje
• Prosječna vrijednost promatrane varijableiznosi …..– ili
• U prosjeku promatrana varijabla iznosi...
– Izražava se u vrijednostima varijable
• Npr. ako računamo prosječna primanja
– prosjek se izražava u kunama
Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.
Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 5
Cilj - opisati veliki niz podataka jednim brojem- usporediti dvije ili više DF karakterizirajući svaku distribuciju jednim jedinim brojem (parametrom, pokazateljem)
Oblici distribucija
• 5 svojstava
• važna uloga u razumijevanju:
– aritmetičke sredine
– varijance
Svojstva aritmetičke sredine
Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.
Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 6
• Algebarski zbroj odstupanja originalnih vrijednosti numeričkog obilježja od aritmetičke sredine jednak je nuli.
1. svojstvo
Prosječan broj djeceu obitelji je 3 djece.
• Zbroj kvadrata odstupanja originalnih vrijednosti numeričkog obilježja od aritmetičke sredine jednak je minimumu
2. svojstvo
Prosječan broj djeceu obitelji je 3 djece.
Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.
Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 7
• Aritmetička sredina uvijek se nalazi između najmanje i najveće vrijednosti varijable
3. svojstvo
4. svojstvo
• Ako je vrijednost numeričke varijable xi
jednaka konstanti c, aritmetička sredina te varijable jednaka je konstanti c.
• Aritmetička sredina sklona je izdvojenicama (ekstremima).
5. svojstvo
Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.
Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 8
• izdvojenice utječu na reprezentativnost
• u distribucijama s jednom ili više izdvojenica aritmetička sredina nije najbolji pokazatelj središta
– (preporučuje se korištenje drugih mjera središnje tendencije npr. mod, medijan)
Reprezentativnost aritmetičke sredine
Kod kojih primarnih mjernih ljestvica je dozvoljeno računati prosjek?
Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.
Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 9
Kvartili
• dijele niz na q jednakih dijelova
Medijan
– Medijan je numerička vrijednost koja niz dijeli na DVA jednaka dijela (q=2)
Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.
Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 10
Tumačenje
• 50% jedinica niza ima vrijednost medijana i manje od te vrijednosti, a 50% jedinica niza ima vrijednost medijana i više od te vrijednosti
– Izražava se u vrijednostima varijable
Kod kojih primarnih mjernih ljestvica je dozvoljeno računati kvantile?
Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.
Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 11
Mod
• vrijednost numeričkog obilježja koja je obzirom na svoje susjedne vrijednosti najčešća
• dijeli distribuciju frekvencija na rastuću i padajuću stranu
• analiza mjernih ljestvica – SVE ljestvice
Distribucije s obzirom na postojanje moda
• Jednomodalne
• Dvomodalne
• Višemodalne
Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.
Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 12
Kod kojih primarnih mjernih ljestvica je dozvoljeno računati mod?
Mjere disperzije
Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.
Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 13
Što znači disperzija?
• Svaka varijabla ima svoje podatke
– ti podatci međusobno?
• VARIRAJU!!!
• Varijable opisujemo parametrima• npr. prosjek, mod, …
– ako podaci jedne varijable jako variraju, je li prosjek reprezentativan?
Mjere diperzije
• Raspršenost podataka varijabli oko središta distribucije
– npr. prosjeka
Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.
Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 14
Vrste mjera disperzije
Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.
Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 15
• Varijanca
• Standardna devijacija
Spomenut ćemo najznačajnije
Varijanca
• Prosječno kvadratno odstupanje od prosjeka
• Izražava se u vrijednostima varijable
k
ii
k
iii
f
xf
1
2
12
)(
1
2
12
n
xxf
s
k
iii )(
Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.
Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 16
T (s2(A)): Plaće zaposlenika poduzeća A prosječno kvadratno odstupaju od
prosječne plaće za 61.140 kuna.Ukoliko se uspoređuju poduzeća A, B i C te njihova disperzija na temelju varijance vidljivo je iz tablice 3.40 kako je najveća disperzija zabilježena je u poduzeću A(61.140 kuna), a najmanja u poduzeću B (23.710 kuna).
Standardna devijacija
• Standardno odstupanje od prosjeka
• Izražava se u vrijednostima varijable
s = s 2s = s2
Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.
Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 17
T (s(A)): Plaće zaposlenika poduzeća A standardno odstupaju od prosjeka za 7.820 kuna. Uspoređujući poduzeće A, B i C zamjetno je najmanja standardna devijacija u poduzeću B (4,87) te najveća u poduzeću A (7,82).
• ???
• vrijednosti varijable
– ____%
– ____godina
– ____5-stupnjevana Likertova ljestvica
– ____Da/Ne
Usporedivost podataka
Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.
Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 18
• Pravokutni dijagram (B-P dijagram, Box-plot dijagram)
• koristi pet karakterističnih vrijednosti niza:
– medijan
– prvi kvartil
– treći kvartil
– najmanja i
– najveća vrijednost niza
Specifična vrsta grafikona
Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.
Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 19
DESKRIPTIVNA STATISTIKA
Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.
Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 20
Prijedlog
• Voditi bilješke u Wordu
Analyze / Descriptive statisticsZBF_2015.sav
Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.
Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 21
ZBF 2015
• Upitnik
• Variable View
– Koliko datoteka sadrži varijabla?
• Data View
– Koliko datoteka sadrži ispitanika?
Ponovimo…
• U outputu prikažite sljedeće rezultate:
– tablicu distribucija frekvencija za varijablu v12
– histogram za varijablu v12
Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.
Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 22
Pitanje
• Varijable v5a-v5k
• Ukoliko promotrimo zadovoljstvo aktivnostimaZBF-a 2015 odgovorite:
– S kojom aktivnosti su posjetitelji u prosjekunajzadovoljniji, a s kojom najmanje zadovoljni?
Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.
Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 23
Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.
Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 24
Preglednost rezultata
Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.
Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 25
Koja aktivnost je bila najposjećenija?
Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.
Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 26
• U svakom pitanju modalitet
– 0 (nula)
• Obavezan odgovor na pitanju
• Vrijednost uključena u izračun prosjeka?
Ponovljena analiza
Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.
Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 27
Gdje su nule?
Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.
Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 28
TUMAČENJE
Zadatak 1
U Word odgovorite na sljedeća pitanja (odgovorepotkrijepiti tablicama ili grafikonima)
1. Koliko su ispitanici u prosjeku zadovoljni Zagreb Book Festivalom?
2. Koliki postotak nije zadovoljan Zagreb Book Festivalom?
3. Koliki postotak ispitanika planira doći sljedeći dan ZBF-a?
4. Koliki postotak ispitanika su muškarci?
5. Protumačite prosječnu ocjenu za stupanj izobrazbe.
Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.
Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 29
NE POMAŽEMO
• Snimiti datoteku
– Vjezba_ZBF
OPREZ
• Prosjek
–SAMO SCALE VARIJABLE
Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.
Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 30
Zadatak
• Koristeći naredbu Frequencies ispišiterezultate za varijablu v12 (odaberite sveponuđene parametre u opciji Statistics)
Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.
Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 31
TUMAČENJE – ZNAČENJE PARAMETRA SKEWNES I KURTOSIS?
Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.
Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 32
Mjere asimetrije i zaobljenosti
Mjere asimetrije mjere:
• načini rasporeda članova statističkoga niza prema osisimetrije
• odstupanja vrijednosti podataka varijable od mjera središnje tendencije (aritmetičke sredine, medijana, moda itd.)
• upotpunjena slika o rasporedu podataka
Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.
Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 33
Mogući ishodi
• Simetrična distribucija
– rezultat 0 (nula)
Mogući ishodi
• Pozitivno asimetrična distribucija
– rezultat veći od nule
• Negativno asimetrična distribucija
– rezultat manji od nule
Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.
Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 34
SPSS tumačenje
• statističari donose više ili manje stroge graniceza tumačenje asimetrije distribucije
– rezultati koji su veći od 1, a manji od -1 smatrajuse neprihvatljiivma u tumačenju normalnostidistribucije
– rezultati u intervalu +/-1 su prihvatljivi, ali irezultati u intervalu +/-2 mogu se smatratiprihvatljivima
SPSS tumačenje
• Pravilo• omjer skewnesa i njegove standardne pogreške
– rezultati u intervalu +/-1,96 smatraju se prihvatljivimau tumačenju normalnosti distribucije s obzirom nasimetriju
» o intervalu 1,96 uskoro detaljnije
Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.
Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 35
Mjera zaobljenosti
• zakrivljenost distribucije frekvencija
Normalne distribucije?
Tumačenja rezultata
• Vrijednosti blizu 0 (nuli)
– Normalna distribucija
• Pozitivne vrijednosti
– Izdužena distribucija
• Negativne vrijednosti
– Spljoštena distribucija
Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.
Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 36
SPSS tumačenje
• Vidjeti skewnes
• Pravilo• omjer kurtosisa i njegove standardne pogreške
– rezultati u intervalu +/-1,96 smatraju se prihvatljivimau tumačenju normalnosti distribucije s obzirom nazaobljenost vrha distribucije
» o intervalu 1,96 - uskoro detaljnije
Vratimo se na naše rezultate
Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.
Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 37
TUMAČENJE
Indiciraju li visoke vrijednosti skewnes i kurtosis narušenu pretpostavku o normalnosti
distribucije?
• Veliki uzorak?
– Standardne pogreške distribucija ovise o veličiniuzorka
Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.
Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 38
• Profesor na policijskoj akademiji kaže:
- Vi ništa ne znate, vas 80% neće proći ispit- Nema nas toliko - začuje se iz klupa..
Analyze / ExploreZBF_2015.sav
Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.
Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 39
Odabir procedure Explore
• mogućnost analiziranja ispitanika premaskupinama
• analiza izdvojenica grafičkim prikazima:
– dijagram stabla i lista (S-L dijagram)
– pravokutni dijagram (BOX-PLOT)
Usporedba ukupnog zadovoljstva iroda posjetitelja
Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.
Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 40
Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.
Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 41
• 5% Trimmed Mean
– Prosjek izračunat izostavljanjem krajnjih 5% ispitanika (i na donju i na gornju granicu)
Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.
Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 42
Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.
Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 43
Kako identificirati izdvojenice(ekstreme)
• Pokrenimo naredbu Explore
– Zavsina varijabla
• ukupno zadovoljstvo aktivnostima ZBF-a
– Factor list
• d2– status u zaposlenju
Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.
Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 44
3 ekstremne vrijednosti na gornjugranicu (vrijednosti veće od 39)
SPSS ID ispitanika
Zašto u ovoj distribuciji ova vrijednostnije označena kao ekstremna?
Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.
Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 45
Analizirajući prethodni grafikon
• Koja skupina ispitanika ima najveće ukupnozadovoljstvo festivalom? Koja najmanje?
Analizirajući prethodni grafikon
– Ali to je samo zbroj ocjena, odnosno što suposjetili više aktivnosti njihovo ukupnozadovoljstvo može biti veće.
• Prosječno zadovoljstvo?
Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.
Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 46
Zadatak
• Otvorite Word dokument
– Predaja na Loomenu
• Izračunajte prosječnu ocjenu zadovoljstvom aktivnostima ZBF-a
• Usporedite prosječne ocjene s obzirom na varijable rod i status u zaposlenju.
– Prokomentirajte zaključke
• Snimiti datoteku
– Procedura_Explore_ZBF