poslovna statistika i

8
POSLOVNA STATISTIKA I I PARCIJALA Statistika – je nauka koja proučava varijacije obilježja masovnih pojava primjenom kvantitativnih metoda. Osnovni elementi koji predstavljaju predmet i sadržaj statistike su: masovna pojava (statistički skup, populacija), obilježje, varijacije obilježja i kvantitativne metode. Deskriptivna (opisna) statistika obuhvata postupke uređivanja podataka, mjere centralne tendencije, mjere disperzije i asimetrije, mjere zaobljenosti i grafičko prikazivanje. Inferencijalna statistička metoda – temelj joj je metoda istraživanja na bazi uzorka, što vodi do upoznavanja obilježja populacije iz koje je uzorak izabran. Statistički skup – čine jedinice (jedinice posmatranja, događaji,...) koje imaju neke zajedničke osobine koje želimo istražiti. Pravilno definisanje osnovnog skupa podrazumijeva poznavanje zahtjeva statističkog istraživanja, koji treba da obezbijede validnost i pouzdanost zaključaka o osnovnom skupu. Statistički skup treba da bude homogen u pogledu konstitutivnih osobina, cjelovit i izdifereneciran u pogledu posmatranih karakteristika. Statistički skup se sastoji od istovrsnih elemenata, međusobno izdiferenciranih prema modalitetima zajedničkog obilježja. Da bi se znalo koji elementi pripadaju statističkom skupu, neophodno je precizno definisati elemente pojmovno (sadržajno), prostorno i vremenski. Statistička obilježja – dijelimo na primarna i sekundarna. Prema sadržini na: numerička, atributivna, stalna, promjenljiva i faktorijalna. Vrijednosti obilježja pojedinačnih jedinica nazivamo modalitetima. Mjerne skale – Numerički podaci o pojavi koja je predmet istraživanja dobijaju se brojanjem i mjerenjem. Pod mjerenjem podrazumijevamo pridruživanje brojeva ili simbola statističkim jedinicama u skladu sa logičkim pravilima. Pravila pridruživanja data su mjernim skalama. Razlikujemo: nominalnu, ordinalnu, intervalnu i omjernu skalu. 1

Upload: nadiral90

Post on 07-May-2017

218 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Poslovna Statistika i

POSLOVNA STATISTIKA I

I PARCIJALA

Statistika – je nauka koja proučava varijacije obilježja masovnih pojava primjenom kvantitativnih metoda. Osnovni elementi koji predstavljaju predmet i sadržaj statistike su: masovna pojava (statistički skup, populacija), obilježje, varijacije obilježja i kvantitativne metode.Deskriptivna (opisna) statistika obuhvata postupke uređivanja podataka, mjere centralne tendencije, mjere disperzije i asimetrije, mjere zaobljenosti i grafičko prikazivanje.Inferencijalna statistička metoda – temelj joj je metoda istraživanja na bazi uzorka, što vodi do upoznavanja obilježja populacije iz koje je uzorak izabran.

Statistički skup – čine jedinice (jedinice posmatranja, događaji,...) koje imaju neke zajedničke osobine koje želimo istražiti. Pravilno definisanje osnovnog skupa podrazumijeva poznavanje zahtjeva statističkog istraživanja, koji treba da obezbijede validnost i pouzdanost zaključaka o osnovnom skupu. Statistički skup treba da bude homogen u pogledu konstitutivnih osobina, cjelovit i izdifereneciran u pogledu posmatranih karakteristika. Statistički skup se sastoji od istovrsnih elemenata, međusobno izdiferenciranih prema modalitetima zajedničkog obilježja. Da bi se znalo koji elementi pripadaju statističkom skupu, neophodno je precizno definisati elemente pojmovno (sadržajno), prostorno i vremenski.

Statistička obilježja – dijelimo na primarna i sekundarna. Prema sadržini na: numerička, atributivna, stalna, promjenljiva i faktorijalna. Vrijednosti obilježja pojedinačnih jedinica nazivamo modalitetima.

Mjerne skale – Numerički podaci o pojavi koja je predmet istraživanja dobijaju se brojanjem i mjerenjem. Pod mjerenjem podrazumijevamo pridruživanje brojeva ili simbola statističkim jedinicama u skladu sa logičkim pravilima. Pravila pridruživanja data su mjernim skalama. Razlikujemo: nominalnu, ordinalnu, intervalnu i omjernu skalu.Nominalna skala – je najnepreciznija i služi samo za klasifikaciju. Nominalna obilježja se dijele na atributivna i geografska.Ordinalna skala (skala ranga) – svodi mjerenje modaliteta na njihovo rangiranje, tako što pridružuje brojeve ili simbole elementima skupa prema intenzitetu nekog svojstva.Intervalna skala – kod nje je poznat ne samo redoslijed modaliteta nego i mjera njihovog razlikovanja, pri čemu jednake razlike brojeva na skali predstavljaju jednake razlike mjernog svojstva.Omjerna skala – omogućava najviše u pogledu mjerenja i poređenja, tako da brojčano možemo da identifikujemo i rangiramo obilježja, i vršimo apsolutna obilježja.

Etape statističkog istraživanja – možemo svesti u četiri etape: - statističko promatranje i prikupljanje podataka, uređivanje i grupisanje podataka, obrada i analiza podataka i sastavljanje izvještaja i interpretacija rezultata.Ove etape treba posmatrati kao opšti pristup provođenju istraživanja a ne kao kruti skup pravila koja bi trebalo slijediti u svakom projektu. U planiranju istraživačkih projekata treba razmišljati kako svaku od navedenih etapa najbolje prilagoditi postojećem problemu. Predstavljene aktivnosti u etapama statističkog istraživanja odnose se na sadržajne elemente plana statističkog istraživanja. Pored ovih elemenata plan statističkog istraživanja

1

Page 2: Poslovna Statistika i

obuhvata tehničke (oprema, statistički programi, finansijska sredstva) i organizacione elemente (obuka kadrova, organizacija poslova na terenu).

Prikupljanje podataka – najvažnije aktivnosti u prikupljanju podataka su: određivanje vrste istraživanja, izvora podataka, određivanje načina i metoda prikupljanja podataka, primjenu odgovarajućih upitnika i obrazaca, izbor vrste i veličine uzorka i terensko prikupljanje podataka. S obzirom na vrstu istraživanja razlikujemo: izviđajno, deskriptivno i analitičko.

Izvori podataka – se dijele na primarne i sekundarne. Počinje se prikupljanjem sekundarnih podataka, jer su oni već dostupni u javnim i privatnim izvještajima ili ih je samo preduzeće prikupilo i pohranilo. Sekundarni podaci, kao gotovi podaci, sadržani su u preduzećima (računovodstva i druge službe, platne liste, cjenovnici) ili izvan preduzeća (statistički zavodi, internet, časopisi). Primarni podataci se prikupljaju neposredno od ispitanika za potrebe konkretnog istraživačkog projekta, prikupljaju se po prvi put od strane istraživača i isključivo su vlasništvo preduzeća koje organizuje istraživanje. Osnovne metode prikupljanja primarnih podataka su ispitivanje, posmatranje i eksperiment.

Računarski podržano kodiranje – Prije unosa i razvrstavanja podataka u tabele, varijable koje su unesene u upitnik moraju biti kodirane i razvrstane u različite kategorije. Pod kodiranjem podrazumijevamo postupak pridruživanja numeričkih ili drugih oznaka modalitetima varijabli. Kodiranje se može provoditi ručno, pomoću računara i automatski pomoću računara. Faze računarski podržanog kodiranja: unos podataka, editiranje podataka, analiza podataka, prezentacija i distribucija podataka, baza podataka i baza znanja.

Validnost i pouzdanost istraživanja – Pouzdanost se definiše kao razlika između rezultata uzoraka i rezultata osnovnog skupa pod istim uslovima. Pouzdanost može biti ocijenjena pomoću mjera konzistentnosti (ekvivalentnosti) i pomoću mjera stabilnosti.Validnost funkcioniše na drugačiji način u odnosu na pouzdanost, jer je moguće imati potpuno pouzdana, ali nevalidna mjerenja. Razlikujemo teorijsku i praktičnu validnost. Pomoću teorijske validnosti utvrđuje se koliko je istraživački postupak logično izveden iz teorije. Teorijska validnost se utvrđuje pomoću logičke, empirijske i faktorske validnosti. Praktična validnost podrazumijeva korelaciju određenog indikatora sa kriterijskom varijablom i izražava se koeficijentom kriterijske validnosti.

Uzoračke greške – se javljaju zbog toga što se umjesto istraživanja cijele populacije ono provodi samo na uzorku njenih jedinica. Uzoračka greška se može kontrolisati ukoliko istraživači pravilno dizajniraju postupak izbora i izaberu dovoljno velik broj jedinica u uzorak. Imamo uzorak baziran na vjerovatnoći i uzorak koji nije baziran na vjerovatnoći.

Neuzoračke greške – često iznenađuju svojom pojavom, oblicima i uticajem u svim fazama istraživanja. Pristrasnost koju ove greške uzrokuju nepredvidive je veličine i smjera, teško se prepoznaje i još teže uklanja. Vrste se mogu sistematizovati prema njihovim izvorima: nepotpuni podaci, greške mjerenja i odgovora, greške anketara i neinformisanost ispitanika, i greške obrade.

Statistička tabela – nastaje ukrštanjem horizontalnih i vertikalnih linija u koje se po određenom pravilu unose podaci. Svaka tabela treba da sadrži tekstualni i numerički dio. Tekstualni dio tabele sadrži: naslov, zaglavlje, pretkolonu, jedinice mjere, izvor podataka i

2

Page 3: Poslovna Statistika i

po potrebi objašnjenja i napomene. Numerički dio obuhvata brojčane podatke koji se unose u tabelu, te zbirni (marginalni) red i kolonu koji se obično nalaze na krajevima tabele. Prema sadržaju statističke tabele se dijele na jednostavne, grupne i kombinovane. Prema cilju mogu biti izvještajne i analitičke.

Dijagrami – pružaju raznovrsne mogućnosti za jednostavnije prikazivanje i poređenje rezultata, a njihov izbor zavisi od vrste podataka. Dijelimo ih u četiri grupe: - stigmogrami – predstavljaju grafičke prikaze pomoću tačaka i najčešće se upotrebljavaju kod dijagramskih karti. - linijski – imaju jednu dimenziju, a za prikazivanje koriste prave i krive linije. Služe za prikazivanje modaliteta jednog obilježja, a najčešće se koriste za prikazivanje vremenskih nizova kod pojava koje imaju svoj tok, dinamiku i razvoj.- površinski (histogrami) – imaju dvije dimenzije, a koriste se za prikazivanje obima i strukture jedne ili više pojava. Kod ovih dijagrama frekvencije niza su predstavljene površinama geometrijskih oblika (pravougaonik, kvadrat, krug,...)- prostorni (stereogrami) – omogućavaju prikazivanje u tri dimenzije. Sastoje se od tri koordinatne ose (apscisa, ordinata i aplikata).

Kartogrami – predstavljaju posebnu vrstu grafikona koji za osnovu koriste posebne vrste geografskih karata. Razlikujemo dijagramske karte i statističke karte.

Piktogrami – su posebna vrsta grafičkog prikaza kod kojih se podaci predstavljaju slikama ili simboličnim figurama. Srednje vrijednosti – srednja vrijednost je ona vrijednost obilježja oko koje se najviše koncentrišu podaci, zbog koje se još naziva i mjerom centralne tendencije. S obzirom na to da li prilikom njihovog izračunavanja učestvuju svi podaci ili ne, razlikujemo potpune i položajne srednje vrijednosti.

Potpune srednje vrijednosti :Aritmetička sredina (prosjek/prosječna sredina) – je najvažnija i najčešće korištena srednja vrijednost. Uslov za pravilnu primjenu je da vrijednosti numeričkog niza ne smiju biti značajno varijabilne. Ona izravnava apsolutne razlike između podataka. Aritmetička sredina se računa tako što se zbir vrijednosti numeričke varijable podijeli sa njihovim brojem.

Osobine aritmetičke sredine – aritmetička sredina ima osobine koje nema ni jedan drugi broj statističkog niza, različit od aritmetičke sredine. Najvažnije su:- nalazi se između najveće i najmanje vrijednosti obilježja.- proizvod zbira frekvencija i aritmetičke sredine jednak je totalu skupa.- zbir odstupanja originalnih vrijednosti numeričkog obilježja od aritmetičke sredine jednak je nuli.- zbir kvadrata odstupanja originalnih vrijednosti numeričkog obilježja od aritmetičke sredine je minimalan, odnosno manji je od zbira kvadrata odstupanja podataka od bilo kojeg drugog broja a.- ako su sve vrijednosti numeričkog obilježja međusobno jednake, odnosno jednake konstanti c, onda je aritmetička sredina jednaka toj konstanti.

Harmonijska sredina – se koristi kada su vrijednosti obilježja za koje računamo prosjek izražene recipročnim odnosima. Harmonijska sredina se računa kao recipročna vrijednost

3

Page 4: Poslovna Statistika i

aritmetičke sredine recipročnih vrijednosti numeričkog obilježja. Harmonijsku sredinu računamo samo za ona obilježja čije su vrijednosti različite od nule.

Geometrijska sredina – predstavlja prosjek iz proizvoda numeričkog obilježja. Ona izravnava proporcionalne promjene (odnose) između podataka statističkog niza. Računa se iz proizvoda podataka, s tim što se uzima korjen čiji je izložitelj jednak njihovom broju. Njeno izračunavanje ima smisla samo za vrijednosti obilježja koje su veće od nule. Geometrijsku sredinu računamo za pojave kod kojih je izražena geometrijska progresija, odnosno koristi se za računanje prosjeka niza relativnih pokazatelja.

Položajne srednje vrijednosti:Modus – (lat. način, mjera) je vrijednost kvantitativnog ili kvalitativnog obilježja sa najvećom frekvencijom. Modus je najtipičnija vrijednost u nizu i naziva se još i dominantna vrijednost ili mod. Kod izračunavanja modusa treba imati u vidu da na negovu veličinu utiče način grupisanja podataka. Prednost modusa je u tome što na njegovo izračunavanje ne utiču otvoreni razredi i ekstremne vrijednosti obilježja.

Medijan – je srednja vrijednost koja se određuje na osnovu položaja koji zauzima u nizu podataka. On uređen niz podataka dijeli na dva jednaka dijela, tako da se u prvom dijelu nalaze elementi koji imaju vrijednost obilježja jednaku ili manju od medijana, a u drugom dijelu se nalaze elementi koji imaju vrijednost obilježja jednaku ili veću od medijana. Medijan se nalazi u sredini statističkog niza i još se naziva i centralna vrijednost. Određivanje medijana ovisi od broja članova u nizu, a ne od njihove veličine.

Mjere disperzije – su pokazatelji varijacije (disperzije ili raspršenosti) podataka. Ove mjere omogućavaju posmatranje varijabiliteta podataka u odnosu na reprezentativnu srednju vrijednost, koja izražava centralnu tendenciju pojave.

Apsolutne mjere disperzije – u njih ubrajamo: raspon varijacije, interkvartil, srednje apsolutno odstupanje, varijansu i iz nje izvedenu standardnu devijaciju. Najjednostavnija mjera disperzije je raspon varijacije, računa se kao razlika između najveće i najmanje vrijednosti obilježja. Koristi se kao prvi pokazatelj disperzije, koji grubo informiše o raspršenosti numeričkog obilježja.Interkvartil - predstavlja nepotpunu mjeru disperzije jer se računa samo na temelju dvije veličine (donjeg i gornjeg kvartila). Srednje apsolutno odstupanje – za računanje disperzije upotrebljavaju se apsolutna odstupanja vrijednosti obilježja od aritmetičke sredine. Prosjek tih odstupanja predstavlja mjeru disperzije koju zovemo srednje apsolutno odstupanje. Varijansa i iz nje izvedena standardna devijacija - predstavlja prosječno kvadratno odstupanje vrijednosti numeričkog obilježja od njihove aritmetičke sredine. Standardna devijacija - je prosječno odstupanje vrijednosti numeričkog obilježja od njihove aritmetičke sredine.

B-P dijagram (Box-Plot) – služi za grafičko prikazivanje raspona varijacije i interkvartila, te za otkrivanje netipičnih vrijednosti varijable. Radi se o veoma korisnom dijagramu, jer omogućava poređenje (centralne vrijednosti, raspršenosti i asimetrije) nekoliko skupova podataka. Za konstrukciju ovog dijagrama potrebno je izračunati kvartile, čije vrijednosti determinišu konstrukciju pravougaonika, tj kutije (box).

4

Page 5: Poslovna Statistika i

Relativne mjere disperzije – u najznačajnije relativne mjere disperzije ubrajamo koeficijent varijacije, koeficijent kvartilne devijacije i standardizovano odstupanje. Koeficijent varijacije - označava se sa V i predstavlja omjer standardne devijacije i aritmetičke sredine pomnožen sa 100. Izražava se u procentima i pogodan je za komparativnu analizu.Koeficijent kvartilne devijacije - predstavlja omjer razlike i zbira kvartila. Izražava disperziju u odnosu na medijan i može poprimiti vrijednost od 0 do 1, odnosno od 0 do 100 %.Standardizovano odstupanje – računanje istog služi za utvrđivanje relativnog položaja podataka u statističkom nizu. Pomoću ovoga odstupanja određujemo za koliko standardnih devijacija je neki modalitet udaljen od prosjeka.

Mjere asimetrije – U nekim slučajevima raspored podataka prema aritmetičkoj sredini je simetričan. Kod simetričkog rasporeda svakom negativnom odstupanju vrijednosti numeričkog obilježja od aritmetičke sredine odgovara ista veličina pozitivnog odstupanja. Kod pozitivno asimetričkog rasporeda zbir pozitivnih odstupanja je veći od zbira negativnih odstupanja, i obratno. Za određivanje načina i oblika rasporeda u statističkoj analizi koriste se odstupanja numeričke vrijednosti obilježja od aritmetičke sredine na određenu potenciju, tzv. momenti oko sredine (centralni momenti rasporeda).- Koeficijent asimetrije L3 je potpuna mjera asimetrije, jer uzima u obzir sva odstupanja varijable od aritmetičke sredine. Vrijednost koeficijenta jednaka je 0 za simetrične rasporede. Kod pozitivne asimetrije vrijednost je veća od 0, a kod negativne manja od 0. Stepen asimetričnosti je umjeren ako se kreće u intervalu ±2. - Pearsonovi koeficijenti asimetrije predstavljaju nepotpune mjere asimetrije jer se temelje na pozicionim srednjim vrijednostima. Za simetrične rasporede vrijednost ovih koeficijenata jednaka je 0, kod pozitivne asimetrije vrijednost je veća od 0, a kod negativne manja od 0. za unimodalne i zvonolike rasporede njegova vrijednost se obično kreće u intervalu ±3.- Bowleyeva mjera asimetrije je nepotpuna mjera asimetrije i polazi od odnosa kvartila. I za ovaj koeficijent važi pravilo da je kod simetričnih rasporeda jednak 0. Koeficijent poprima vrijednost u intervalu ±1.

Koeficijent zaobljenosti – Druga značajna mjera oblika rasporeda je stepen njegove zaobljenosti ili izbočenosti (grč. Kurtosis). Za razliku od koeficijenta asimetrije L3, gdje predznak određuje oblik asimetričnosti, ovdje nam je značajna njegova apsolutna vrijednost, koja pokazuje dužinu ordinate najviše tačke posmatranog niza. Zaobljenost normalnog rasporeda mjerena ovim koeficijentom iznosi 3 (mezokurtičnost), pa nam ta veličina služi za mjerenje stepena zaobljenosti empirijskog statističkog niza. Ako je koeficijent zaobljenosti veći od 3, onda taj raspored ima izdužen oblik (leptokurtičnost), a ako je njegova vrijednost manja od 3, onda raspored ima spljošten oblik (platokurtičnost).

Mjere koncentracije (Ginijev koeficijent koncentracije, Lorencova kriva) – Ovim mjerama se utvrđuje način rasporeda totala ili druge prikladne agregatne veličine na njegove članove ili modalitete statističkih varijabli. Mjerenje koncentracije se provodi različitim pokazateljima, među kojima su: koncentracijski omjer, Herfindahlov index i Ginijev koeficijent koncentracije. Prva dva predstavljaju apsolutne mjere koncentracije, a treći najčešće korištenu relativnu mjeru koncentracije.U analizi relativne mjere koncentracije polazi se od specifičnog grafičkog prikaza koji se naziva Lorencova kriva. Ova kriva se konstruiše u prvom kvadrantu koordinatnog sistema i izražava stepen koncentracije pojedinih članova ili grupa u odnosu na ukupnu koncentraciju statističkog niza.

5