deskriptivna statistika qm1

111
OBRADA I PRIKAZ PODATAKA dr. Antun Benčić 1

Upload: marinko99

Post on 10-Dec-2014

154 views

Category:

Documents


6 download

DESCRIPTION

Descriptive statistics

TRANSCRIPT

Page 1: Deskriptivna statistika QM1

OBRADA I PRIKAZ PODATAKA

dr. Antun Benčić

1

Page 2: Deskriptivna statistika QM1

QSM 2: OBRADA I PRIKAZ PODATAKA

Sadržaj

Podaci i statistička obrada podatakaPrikupljanje podatakaSelekcija podatakaObrada podatakaPrikazivanje podataka

Opisna statistikaMjere centralne tendencijeMjere varijabilnosti

Regresijska analizaVremenski nizovi

2

Page 3: Deskriptivna statistika QM1

DONOŠENJE ODLUKA U NEIZVJESNOM OKRUŽJU

Svakodnevne se odluke temelje na necjelovitim informacijama.

Razmotrimo:

• Cijena HT dionica za šest mjeseci bit će veće nego sadašnje.

• Ako budžetski deficit bude tako visok kako se predviđa, kamate će ostati visoke i do kraja godine.

3

Page 4: Deskriptivna statistika QM1

DONOŠENJE ODLUKA U NEIZVJESNOM OKRUŽJU

Zbog neizvjesnosti, izjave se trebaju modificirati:

•Cijena HT dionica vjerojatno će za šest mjeseci biti veće nego što su danas.

•Ako je budžetski deficit visok prema predviđanju, kamate će vjerojatno ostati visoke do kraja godine.

(nastavak)

4

Page 5: Deskriptivna statistika QM1

OSNOVNE DEFINICIJE

• Populacija je cjelovit skup objekata (vrijednosti) koji zanimaju istraživača

• N predstavlja veličinu populacije• Uzorak je promatrani podskup jedinki (vrijednosti)

populacije• n predstavlja veličinu uzorka

• Parametar je specifično obilježje populacije• (Statističko) obilježje je specifično obilježje uzorka (mnogi

autori koriste termin statistika uzorka)

5

Page 6: Deskriptivna statistika QM1

POPULACIJA NASUPROT UZORAK

a b c d

e f g h i j k l m n

o p q r s t u v w

x y z

Populacija Uzorak

b c

g i n

o r u

y

Vrijednosti izračunate primjenom podataka iz populacije nazivaju se parametri.

Vrijednosti izračunate primjenom podataka iz uzorka nazivaju se statistike

6

Page 7: Deskriptivna statistika QM1

PRIMJERI POPULACIJA

• Popis registriranih birača u Hrvatskoj

• Prihodi svih porodica koje žive u Vukovaru

• Dionice s kojima se trguje na Zagrebačkoj burzi

• Prosječne ocjene svih studenata na određenom fakultetu

• Sva stečena potraživanja tvrtke

• Svi računi hotela

7

Page 8: Deskriptivna statistika QM1

SLUČAJNO UZORKOVANJE

Jednostavno slučajno uzorkovanje je postupak u kojem:•svaki član populacije bira se na posve slučajan način•svaki član populacije ima jednaku vjerojatnost da bude izabran, i•svaki mogući uzorak veličine n objekata ima jednaku vjerojatnost da bude izabran

Rezultat uzorkovanja naziva se slučajni uzorak

8

Page 9: Deskriptivna statistika QM1

DESKRIPTIVNA I INFERENCIJALNA STATISTIKA

Dvije grane statistike:• Deskriptivna statistika

– Skupljanje, sažimanje i obrada podataka u cilju pretvaranja podataka u informacije.

• Inferencijalna statistika– Osigurava temelje za predviđanja, prognoziranja

i procjenjivanja koja se koriste u pretvorbi informacija u znanje.

9

Page 10: Deskriptivna statistika QM1

DESKRIPTIVNA STATISTIKA

• Prikupljanje podataka– npr., anketiranje

• Prikazivanje podataka– npr., tablice i grafovi

• Sažimanje podataka

– npr., sredina uzorka = iX

n

10

Page 11: Deskriptivna statistika QM1

INFERENCIJALNA STATISTIKA• Procjenjivanje

– npr., procjena srednje mase (težine) populacije korištenjem srednje mase (težine) uzorka.

• Testiranje hipoteze– npr., testiranje tvrdnje da je

srednja masa (težina) populacije jednaka 75 kg.

Inferencijalna statistika je postupak izvođenja zaključaka ili donošenja odluka o populaciji na temelju rezultata

dobivenih iz uzorka

11

Page 12: Deskriptivna statistika QM1

PROCES DONOŠENJA ODLUKE

Počinje ovdje:

Identifikacija problema

Podaci

Informacija

Znanje

Odluka

Deskriptivna statistika,vjerojatnost, računala

Iskustvo, teorija,literatura,inferencijalna

statistika, računala

12

Page 13: Deskriptivna statistika QM1

DESKRIPTIVNA (OPISNA) STATISTIKA

13

Page 14: Deskriptivna statistika QM1

VRSTE PODATAKA

Podatak

Opisni Brojčani

Diskretni KontinuiraniPrimjeri:

Bračni status Jeste li registrirani

birač? Boja očiju (definira kategorije ili

grupe)

Primjeri:

Broj djece Broj grešaka po satu (brojive jedinke)

Primjeri:

Masa (kg) Napon (V) (mjerljiva karakteristika)

14

Page 15: Deskriptivna statistika QM1

MJERNE SKALE

Intervalna skala

Ordinalna skala

Nominalna skala

Kvantitativni podaci

Kvalitativni podaci

Kategorije (ne redosljed ili smjer)

Redoslijed kategorija (rangovi, redoslijed ili ljestvica)

Razlika mjerenja bez prave ništice

Omjerna skalaRazlika mjerenja, postoji prava ništica

15

Page 16: Deskriptivna statistika QM1

GRAFIČKI PRIKAZ PODATAKA

• Podatke u obliku niza teško je primijeniti u postupku donošenja odluke

• Potreban je određeni tip organizacije podataka

• tablica• graf

• Vrsta grafa ovisi o varijabli koja se sažima

16

Page 17: Deskriptivna statistika QM1

GRAFIČKI PRIKAZ PODATAKA• Pregled tehnika primijenjenih u ovom poglavlju:

(nastavak)

Opisnevarijable

Brojčanevarijable

• razdioba frekvencija• stupčani dijagram• strukturni krug (torta)• Pareto dijagram

• linijski dijagram• razdioba frekvencija• kumulativni dijagram• histogram • dijagram stabla• raspršni dijagram

17

Page 18: Deskriptivna statistika QM1

TABLICE I GRAFOVI ZA OPISNE PODATKE

Opisni podaci

Grafički podaci

Strukturni krug Pareto dijagram

Stupčani dijagram

Tablica razdiobe frekvencija

Tablični podaci

18

Page 19: Deskriptivna statistika QM1

TABLICA RAZDIOBE FREKVENCIJA

Primjer: Godišnji broj pacijenata po odjelima

Sažimanje podataka po kategorijama

Odjel Broj pacijenata

Kardiologija 1052 Hitna 2248Intenzivna njega 340Ginekologija 552Kirurgija 3630

(Varijable su opisne)

19

Page 20: Deskriptivna statistika QM1

STUPČANI DIJAGRAM I STRUKTURNI KRUG

• Stupčani dijagrami i strukturni krugovi (torte) često se primjenjuju za kvalitativne (opisne) podatke.

• Visina stupca ili udio kruga (torte) pokazuje frekvenciju ili postotak svake kategorije.

20

Page 21: Deskriptivna statistika QM1

PRIMJER STUPČANOG DIJAGRAMA

Bolnički Broj odjel pacijenata

Kardiologija 1052Hitni prijam 2245Intenzivna njega 340Ginekologija 552Kirurgija 4630

21

Page 22: Deskriptivna statistika QM1

CRTANJE STUPČANOG DIJAGRAMA U EXCELU

1 Unesi podatke

2 Klikni na grafički čarobnjak, izaberi opciju Column i ponuđeni tip grafa, klikni na Next

3 Unesi podatke za Y, klikni Next

4 Klikom otvori prozor Series

22

Page 23: Deskriptivna statistika QM1

(nastavak)

5 Unesi podatke za X, Klikni Next

6 Upiši naslov dijagrama, naziv za X i naziv za Y

7 Klikni Finish, rezultat je histogram

CRTANJE STUPČANOG DIJAGRAMA U EXCELU

23

Page 24: Deskriptivna statistika QM1

PRIMJER STRUKTURNOG KRUGA

(Postotci su zaokruženi na najbližu vrijednost

Bolnički Broj Ukupno odjel pacijenata %

Kirurgija 1052 11,93Hitni prijam 2245 25,46Intenzivna njega 340 3,86Ginekologija 552 6,26Kirurgija 4630 52,50

24

Page 25: Deskriptivna statistika QM1

CRTANJE STRUKTURNOG KRUGA U EXCELU

1 Unesi podatke, izračunaj postotak

2 Klikni na grafički čarobnjak, izaberi Opciju Pie, Klikni na Next

3 Unesi podatke o postocima, klikni na Series

25

Page 26: Deskriptivna statistika QM1

CRTANJE STRUKTURNOG KRUGA U EXCELU4 Unesi podatke za X, klikni na Next5 U prozoru Titles upiši naziv dijagrama, u prozoru Legend isključi opciju Show Legend6 U prozoru Data Labels aktiviraj opcije Category Name, Value i Show leader lines, klikni na Finish7 Rezultat je strukturni dijagram

(nastavak)

6

7

26

Page 27: Deskriptivna statistika QM1

PARETO DIJAGRAM

• Primjenjuje se za prikaz opisnih podataka

• Stupčani dijagram, gdje su kategorije prikazane u padajućem nizu frekvencija

• Na istom se grafu često prikazuje i kumulativna (relativna) frekvencija

• Primjenjuje se u izdvajanju “nekoliko bitnih” od “mnogo trivijalnih” kategorija.

27

Page 28: Deskriptivna statistika QM1

1. korak: sortiraj izvore neispravnosti u padajući niz2. korak: odredi % u svakoj kategoriji

Izvor tvorničke greške

Broj grešaka

Ukupni % grešaka

Slabo podešavanje 223 55,75

Bojanje 78 19,50

Slabo varenje 34 8,50

Nedostajući dio 25 6,25

Oštećeno kućište 21 5,25

Električni kratki spoj 19 4,75

Ukupno 400 100%

PRIMJER PARETOVOG DIJAGRAMA(nastavak)

28

Page 29: Deskriptivna statistika QM1

PRIMJER PARETOVOG DIJAGRamaKum

ulativni % (linijski

dijagram)

% g

reša

ka u

sva

koj k

ateg

oriji

(s

tupč

ani d

ijagr

am)

3. korak: grafički prikaži rezultate(nastavak)

29

Page 30: Deskriptivna statistika QM1

Primjer: Ispitan je uzrok za 400 neispravnih dijelova:

Izvor tvorničke greške Broj grešaka

Slabo zavarivanje 34

Slabo podešavanje 223

Nedostajući dio 25

Bojanje 78

Električni kratki spoj 19

Oštećeno kućište 21

Ukupno 400

CRTANJE PARETO DIJAGRAMA U EXCELU

30

Page 31: Deskriptivna statistika QM1

CRTANJE PARETO DIJAGRAMA U EXCELU

1 Unesi sortirane podatke u padajućem nizu, izračunaj postotak i kumulativni postotak

2 Klikni na grafički čarobnjak, izaberi opciju Column, klikni na Next3 Unesi podatke za učestalost greške i kumulativni postotak, klikni

Next (između podataka upiši znak ; i razmak)

(nastavak)

31

Page 32: Deskriptivna statistika QM1

CRTANJE PARETO DIJAGRAMA U EXCELU(nastavak)

4 Otvori prozor Series, unesi podatke o izvorima grešaka, 5 u polju Series klkni na Series1 i upiši njen naziv, 6 Klikni na Add, unesi podatke za kumulativni postotak7 Klikni na Series2 i upiši naslov8 Klikni na Finish

32

Page 33: Deskriptivna statistika QM1

CRTANJE PARETO DIJAGRAMA U EXCELU9 Dođi mišem na jedan od stupaca Series2 , desni klik10 Izaberi Chart Type11 Klikni na Lines i na prvu opciju u drugom redu12 Klikni na Ok

(nastavak)

33

Page 34: Deskriptivna statistika QM1

CRTANJE PARETO DIJAGRAMA U EXCELU(nastavak)

13 Desni klik na jednu od točaka linijskog dijagrama, izaberi Format Data Series

14 Izaberi prozor Axis i izaberi opciju Secondary Axis

15 Klikni na Ok, rezultat je Pareto dijagram

34

Page 35: Deskriptivna statistika QM1

GRAFOVI VREMENSKIH SERIJA

• Linijski dijagram (prikaz vremenske serije) primjenjuje se za prikaz vrijednosti varijable u vremenu

• Vrijeme se prikazuje na horizontalnoj osi

• Varijabla od interesa prikazuje se na vertikalnoj osi

35

Page 36: Deskriptivna statistika QM1

PRIMJER LINIJSKOG DIJAGRAMA

36

Page 37: Deskriptivna statistika QM1

CRTANJE LINIJSKOG DIJAGRAMA U EXCELU

1 Unesi podatke, klikni na jednu slobodnu ćeliju, klikni na grafičkog čarobnjaka

2 Unesi podatke za Y, klikni na Series3 Unesi podatke za X, upiši naziv serije4 Klikni na Next

37

Page 38: Deskriptivna statistika QM1

CRTANJE LINIJSKOG DIJAGRAMA U EXCELU(nastavak)

4 U prozoru Titles upiši naslov dijagrama, naziv X osi i naziv Y osi, klikni Finish

5 Rezultat je linijski dijagram

38

Page 39: Deskriptivna statistika QM1

Brojčani podaci

Dijagram stabla

Histogram Kumulativni dijagram

Razdioba frekvencija ikumulativne razdiobe

GRAFOVI ZA OPIS BROJČANIH VARIJABLI

39

Page 40: Deskriptivna statistika QM1

Što je razdioba frekvencija?

• Razdioba frekvencija je popis ili tablica …

• sadržava grupirane klase (kategorije ili raspone u koje upada podatak) ...

• i odgovarajuće frekvencije s kojima podatak upada u svaku klasu ili kategoriju.

RAZDIOBE FREKVENCija

40

Page 41: Deskriptivna statistika QM1

ZAŠTO SE KORISTE RAZDIOBE FREKVENCIJA?

• Razdioba frekvencija je način sažimanja podataka

• Razdioba kondenzira niz podataka u korisniji oblik...

• …i omogućava brzu vizualnu interpretaciju podataka.

41

Page 42: Deskriptivna statistika QM1

INTERVALI RAZREDA I GRANICE RAZREDA (BIN)

• Svaki grupirani razred ima jednaku širinu• Odredite širinu svakog razreda prema

Koristi najmanje 5, ali ne više od 15-20 intervala Intervale nikada preklapati Zaokruži na gore širinu intervala kako bi se uključile

krajnje intervalne točke

intervala željenihbrojbrojnajmanjibroj i najveć

intervalaširinaw

42

Page 43: Deskriptivna statistika QM1

Primjer: Prodavač je slučajnim izborom izabrao 20 dana i zabilježio dnevnu posjetu kupaca

24, 35, 17, 21, 24, 37, 26, 46, 58, 30, 32, 13, 12, 38, 41, 43, 44, 27, 53, 27

PRIMJER RAZDIOBE FREKVENCIJA

43

Page 44: Deskriptivna statistika QM1

• Sortiraj podatke u rastućem nizu:12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58

• Izračunaj raspon: 58 - 12 = 46

• Odaberi broj razreda: 5 (obično između 5 i 15)

• Izračunaj širinu razreda: 10 (46/5 zatim zaokruži)

• Odredi granice razreda: 10 ali manje od 20, 20 ali manje od 30, . . . , 60 ali manje od 70

• Prebroji opažanja, pridruži ih razredima

PRIMJER RAZDIOBE FREKVENCIJA(nastavak)

44

Page 45: Deskriptivna statistika QM1

PRIMJER RAZDIOBE FREKVENCIJA

Interval Frekvencija

10 ali manje od 20 3 0,15 1520 ali manje od 30 6 0,30 3030 ali manje od 40 5 0,25 25 40 ali manje od 50 4 0,20 2050 ali manje od 60 2 0,10 10 Ukupno 20 1,00 100

Relativna frekvencija

Postotak

Sortirani podaci:

12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58

(nastavak)

45

Page 46: Deskriptivna statistika QM1

HISTOGRAM

• Grafički prikaz razdiobe frekvencija naziva se histogram

• Krajnje točke razreda prikazane su na horizontalnoj osi

• Verikalna os prikazuje frekvenciju, relativnu frekvenciju ili postotak

• Stupci odgovarajuće visine koriste se za prikaz broja opažanja svakog razreda

46

Page 47: Deskriptivna statistika QM1

Broj kupaca

PRIMJER HISTOGRAMA

(Nema razmaka

među stupcima)

Interval

10 ali manje od 20 320 ali manje od 30 630 ali manje od 40 540 ali manje od 50 450 ali manje od 60 2

Frekvencija

47

Page 48: Deskriptivna statistika QM1

HISTOGRAMI U EXCELU

2

Unesi podatke

48

IzaberiTools/Data Analysis

Page 49: Deskriptivna statistika QM1

Izaberi Histogram

3

4

Ulazni podaci i granice razreda (bin range je ćelija raspona koja sadrži gornju krajnju točku svakog razreda)

Izaberi Chart Output i klikni na “OK”

HISTOGRAMI U EXCELU(nastavak)

(

49

Page 50: Deskriptivna statistika QM1

RAZDIOBA KUMULATIVNIH FREKVENCIJA

Razred

10 ali manje od 20 3 15 3 15

20 ali manje od 30 6 30 9 45

30 ali manje od 40 5 25 14 70

40 ali manje od 50 4 20 18 90

50 ali manje od 60 2 10 20 100 Ukupno 20 100

Postotak Kumulativni postotak

Sortirani podaci:

12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58

Frekvencija Kumulativna frekvencija

50

Page 51: Deskriptivna statistika QM1

PRIKAZ KRIVULJE KUMULATIVNIH FREKVENCIJA

Manje od 10 10 010 ali manje od 20 20 1520 ali manje od 30 30 4530 ali manje od 40 40 7040 ali manje od 50 50 9050 ali manje od 60 60 100

Gornja granica intervala

Interval Kumulativni postotak

Gornja granica

intervala

51

Page 52: Deskriptivna statistika QM1

OBLIK RAZDIOBE

• Kaže se da je oblik razdiobe simetričan ako su opažanja izjednačena ili simetrično distribuirana oko sredine.

52

Page 53: Deskriptivna statistika QM1

OBLIK RAZDIOBE – KOEFICIJENT SIMETRIČNOSTI

• Kaže se da je razdioba nesimetrična ako opažanja nisu simetrično distribuirana oko centra.

(nastavak)

Pozitivno nesimetrična razdioba (produžena u desno) ima rep koji se proteže u desno prema većim vrijednostima (SKEW > 0).

Ako je histogram sličan normalnoj razdiobi, koeficijent simetričnosti SKEW = 0

Negativno nesimetrična razdioba (produžena u lijevo) ima rep koji se proteže u lijevo prema manjim vrijednostima (SKEW < 0).

53

Page 54: Deskriptivna statistika QM1

OBLIK RAZDIOBE – KOEFICIJENT SPLOŠTENOSTI

• Odstupanje od normalne razdiobe vidi se i po obliku zaobljenosti vrha krivulje

(nastavak)

Pozitivna zaobljenost razdioba ima oštriji vrh u odnosu na normalnu razdiobu (KURT > 0)

Ako je histogram sličan normalnoj razdiobi, koeficijent zaobljenosti KURT = 0. Napomena: Važi samo u EXCELu)

Negativna zaobljenost razdioba ima tuplji vrh u odnosu na normalnu razdiobu (KURT < 0).

0

2

4

6

8

10

12

1 2 3 4 5 6 7 8 9

0

1

2

3

4

5

6

7

8

1 2 3 4 5 6 7 8 9

54

Page 55: Deskriptivna statistika QM1

RAČUNANJE KOEFICIJENTA SIMETRIČNOSTI U EXCELU

1 Unesi podatke i izaberi prazno polje gdje će se ispisati rezultat

2 Klikni na ikonu Funkcija

3 Odaberi funkciju SKEW / Ok

4 Označi podatke u polju Number 1 / Ok

(nastavak)

SKEW

55

Page 56: Deskriptivna statistika QM1

RAČUNANJE KOEFICIJENTA SPLOŠTENOSTI U EXCELU

1 Unesi podatke i izaberi prazno polje gdje će se ispisati rezultat

2 Klikni na ikonu Funkcija

3 Odaberi funkciju KURT / Ok

4 Označi podatke u polju Number 1 / Ok

KURT

56

Page 57: Deskriptivna statistika QM1

ODNOSI MEĐU VARIJABLAMA

• Grafički prikazi do sada su obrađivali samo jednu varijablu

• Kad postoje dvije varijable primjenjuju se ove tehnike:

Opisne(kvalitativne)

varijable

Brojčane(kvantitativne)

varijable

Unakrsne tablice Raspršni dijagram

57

Page 58: Deskriptivna statistika QM1

• Raspršni dijagrami koriste se za parove promatranja uzetih za dvije brojčane varijable

• Raspršni dijagram:– Jedna se varijabla prikazuje na vertikalnoj

osi, a druga na horizontalnoj osi

RASPRŠNI DIJAGRAMI

58

Page 59: Deskriptivna statistika QM1

PRIMJER RASPRŠNOG DIJAGRAMA

Dnevni obujam

Dnevni trošak

23 125

26 140

29 146

33 160

38 167

42 170

50 188

55 195

60 200

59

Page 60: Deskriptivna statistika QM1

RASPRŠNI DIJAGRAM U EXCELU

Odaberi grafički čarobnjak

1

2

Odaberi opciju XY (Scatter) zatim klikni “Next”

60

Page 61: Deskriptivna statistika QM1

RASPRŠNI DIJAGRAM U EXCELU

3 Unesi podatke za Y, aktiviraj prozor Series

4 Unesi podatke za X / Next

(nastavak)

61

Page 62: Deskriptivna statistika QM1

RASPRŠNI DIJAGRAM U EXCELU5 U određena polja upiši

Naziv dijagramaNaziv X osiNaziv Y osi Klikni na Finish

6 Rezultat je raspršni dijagram

(nastavak)

62

Page 63: Deskriptivna statistika QM1

UNAKRSNE TABLICE

• Unakrsna tablica (ili tablica kontigencije) je lista brojnih opažanja za svaku kombinaciju vrijednosti za dvije opisne ili brojčane varijable

• Ako postoji r kategorija za prvu varijablu (retci) i c kategorija za drugu varijablu (stupci), tablica se naziva r x c unakrsna tablica

63

Page 64: Deskriptivna statistika QM1

PRIMJER UNAKRSNE TABLICE

• 4 x 3 unakrsna tablica za mogućnosti investiranja investitora (vrijednosti u 000)

Kategorija Investitor A Investitor B Investitor C Ukupnoinvesticija

Dionice 46,5 55 27,5 129

Obveznice 32,0 44 19,0 95CD 15,5 20 13,5 49

Štednja 16,0 28 7,0 51

Ukupno 110,0 147 67,0 324

64

Legenda: CD – potvrda o depozitu

Page 65: Deskriptivna statistika QM1

• Usporedni stupčani dijagram(nastavak)

GRAFIČKI PRIKAZ VIŠEVARIJANTNIH OPISNIH PODATAKA

65

Page 66: Deskriptivna statistika QM1

PRIMJER USPOREDNOG STUPČASTOG DIJAGRAMA

• Kvartalna prodaja za tri prodajne lokacije:1. kvart. 2. kvart. 3. kvart. 4. kvart.

Istok 20.4 27.4 59 20.4Zapad 30.6 38.6 34.6 31.6Sjever 45.9 46.9 45 43.9

66

Page 67: Deskriptivna statistika QM1

Sažimanje podataka računanjem

Svaka analiza i/ili interpretacija statističkog niza svodi se na računanje mjera centralne tendencije, rasipanja podataka i oblika krivulje distribucije.

Mjere centralne tendencije (sredine) su

- aritmetička sredina

- harmonijska sredina

- geometrijska sredina

- medijan

- mod.

67

1 2 na

x x ... xx

n

1 2

1 1 1H

n

nx

...x x x

1 2n

G nx x x x

H G Ax x x

Page 68: Deskriptivna statistika QM1

Sažimanje podataka računanjem

Mjere rasipanja su:- raspon varijacije- percentil- varijanca- standardno odstupanje- koeficijent varijacije.

x-

68

Page 69: Deskriptivna statistika QM1

Mjere centralne tendencije

Aritmetička sredina

Aritmetička sredina je najvažniji pokazatelj numeričkih pokazateljaskupa. Kao tipična (dominantna) vrijednost može “zamijeniti” skup.Pokazuje opću tendenciju pojave koja je pod utjecajem različitih čimbenika.

Računa se zbrajanjem svih vrijednosti statističkog niza i dijeli s brojem elemenata u statističkom nizu.

Ako je statistički niz X = {x1, x2, x3, ….., xn}, aritmetička se sredina označava kao , a računa prema izrazu

Primjer: Ako je dan statistički niz X = {3, 2, 5, 3, 4}, onda je aritmetička sredina:

n

x

n

xxxxx

n

ii

n

1321

4,35

17

5

)43523

x

x

69

Page 70: Deskriptivna statistika QM1

Mjere centralne tendencije

Aritmetička sredina

Aritmetička sredina u statistici ima značenje kao i težište tijela u mehanici. To je srednja vrijednost svih vrijednosti statističkog niza.

Kada se primjenjuje aritmetička sredina?

Budući se za njeno računanje uzimaju u obzir sve vrijednosti statističkog niza, njegova vrijednost je osjetljiva na ekstremne vrijednosti. Zato aritmetička sredina nije pogodna za opisivanje statističkog niza koji sadrži ekstremne vrijednosti.

Primjer: Statistički niz je X = { 34, 32, 35, 10, 33}. Suma svih vrijednosti je xi = 144. Aritmetička sredina je = xi /n = 144/5 = 28,8.Ako zanemarimo četvrti element niza (10) dobijemo da je aritmetička sredina = xi / n= 134/4 = 33,5. Razlika je velika. Očito, četvrti je element niza neka ekstremna vrijednost i treba provesti dodatna istraživanja kako se je uopće mogao pojaviti.

x

x

x

70

Page 71: Deskriptivna statistika QM1

Mjere centralne tendencije

Aritmetička sredina

U EXCEL-u programu funkcija AVERAGE računa aritmetičku sredinu podataka koji su pridruženi funkciji.

Postupak1. Unesi podatke u radni list EXCEL-a 2. Odaberi slobodno polje gdje će se ispisati rezultat. Na traci alata klikni na ikonu funkcija (1)3. U dijalog prozoru u polju select a category odaberi Statistical, a u polju Select a function odaberi AVERAGE (2). Klikni na Ok4. U dijalog prozoru u polju Number1 unesi podatke iz radnog lista (3). Klikni na Ok.5. U odabranom polju program ispiše vrijednost aritmetičke sredine za unesene podatke.

Napomena: Ako u nekom polju nedostaju podaci, primjenjuje se funkcija AVERAGEA koja ignorira prazno polje.

(1)

(2)

(3)

71

Page 72: Deskriptivna statistika QM1

Mjere centralne tendencije

Harmonijska sredina

Harmonijska sredina je srednja vrijednost recipročnih vrijednosti statističkog niza.

Kada se primjenjuje harmonijsaka sredina?

Budući se za njeno računanje uzimaju u obzir sve recipročne vrijednosti statističkog niza, njena je vrijednost manje osjetljiva na ekstremne vrijednosti. Obično se primjenjuje u financijskim izvješćima.

Primjer: Statistički niz je X = { 34, 32, 35, 100, 33}. AVERAGE = 47HARMEAN = 39

HARMEAN1

72

Page 73: Deskriptivna statistika QM1

Mjere centralne tendencije

Računanje harmonijske sredine u EXCEL-u

1Unesi podatke, odaberi slobodnu ćeliju gdje će se upisati rezultat, klikni na ikonu Funkcija2.Izaberi Statistica i funkciju HARMEAN, klikni na Ok

3. Unesi podatke i klikni na Ok. Rezultat se ispiše u željenoj ćeliji.

73

Page 74: Deskriptivna statistika QM1

Mjere centralne tendencije

Medijan

Medijan je vrijednost srednje elementa u sortiranom statističkom nizu. Ako vrijednosti nisu iste, pola elemenata statističkog niza ima manju vrijednost od medijana, a pola veću. Medijan nije osjetljiv na ekstremne vrijednosti podataka. Zato, ako su prisutne ekstremne vrijednosti bolje je rabiti medijan nego aritmetičku sredinu.

Da bi dobili medijan statistički niz moramo sortirati po rastućim veličinama. Medijan je vrijednost srednjeg elementa. Ako niz ima neparni broj, tj. ako je n = 2k+1, medijan je Me = xk+1

Ako niz ima parni broj elemenata, tj. n = 2k, medijan je Me = (xk + xk+1) / 2Primjer: 1. Ako je sortirani statistički niz X = {5, 6, 6, 7, 8}, medijan

je Me = 6. 2. Ako je sortirani statistički niz X = {5, 6, 6, 7, 8, 8, 9, 10}, medijan je Me = (7+8) / 2 = 7,5.

Medijan

Medijan = ( + )/2

74

Page 75: Deskriptivna statistika QM1

Mjere centralne tendencije

Median

U EXCEL-u programu funkcija MEDIAN računa medijan podataka koji su pridruženi funkciji.

Postupak1. Unesi podatke u radni list EXCEL-a 2. Odaberi slobodno polje gdje će se ispisati rezultat. Na traci alata klikni na ikonu funkcija (1)3. U dijalog prozoru u polju select a category odaberi Statistical, a u polju Select a function odaberi MEDIAN (2). Klikni na Ok4. U dijalog prozoru u polju Number1 unesi podatke iz radnog lista (3). Klikni na Ok.5. U odabranom polju program ispiše vrijednost medijan unesenih podataka.

(1)

(2)

(3)

75

Page 76: Deskriptivna statistika QM1

Mjere centralne tendencije (5/5)

Mod

Mod je vrijednost elementa statističkog niza koji se najviše puta pojavljuje (vrijednost elementa s najvećom učestalošću). Mod nije osjetljiv na ekstremne vrijednosti.

Ako je statistički niz X = {3, 4, 4, 5, 5, 6, 6, 7, 7, 8, 8, 8, 9,9,10,10,11}.

Vrijednost 8 se najviše puta ponavlja i to 3 puta. Zato je Mo = 8.

Niz može imati jednu, dvije ili više dominantnih vrijednosti.

Neki nizovi uopće nemaju dominantnu vrijednosti.

Mod

3 4 5 6 7 8 9 10 11 12

76

Page 77: Deskriptivna statistika QM1

Mjere centralne tendencije

Mod

U EXCEL-u programu funkcija MODE računa mod podataka koji su pridruženi funkciji.

Postupak1. Unesi podatke u radni list EXCEL-a 2. Odaberi slobodno polje gdje će se ispisati rezultat. Na traci alata klikni na ikonu funkcija (1)3. U dijalog prozoru u polju select a category odaberi Statistical, a u polju Select a function odaberi MODE (2). Klikni na Ok4. U dijalog prozoru u polju Number1 unesi podatke iz radnog lista (3). Klikni na Ok.5. U odabranom polju program ispiše vrijednost moda unesenih podataka.

(1)

(3)

(2)

77

Page 78: Deskriptivna statistika QM1

Mjere rasipanja

Rasipanje je odstupanje vrijednosti mjerene veličine od njene srednje vrijednosti.

Mjere rasipanja i srednje vrijednosti daju karakterizaciju distribucijeučestalosti.

x x

78

Page 79: Deskriptivna statistika QM1

Mjere rasipanja

Raspon

Raspon je razlika najveće i najmanje vrijednosti u numeričkom statističkom nizu.

R = xmax – xmin

Primjer: Ako je statistički niz X = {9,3,4,5,6,4,5,7,8,4,3}

Treba pronaći najmanju i najveću vrijednost u nizu. xmin = 3, xmax = 9 R = 9 – 3 = 6.

tR

79

Page 80: Deskriptivna statistika QM1

Mjere rasipanja

RasponU EXCEL-u postoje funkcije za računanje MAX i MIN.

Postupak

1. Upiši podatke u radni list2. klikni na slobodno polje gdje želiš upisati MAX. Na alatnoj traci klikni na ikonu funkcija (1)3. u dijalog prozoru u polju select a category

odaberi Statistical, a u polju Select a function odaberi MAX (2). Klikni na Ok

4. U dijalog prozoru u polju Number1 unesi podatke iz radnog lista (3)

4. ponovi točke 2, 3 i 4, a u polju Select a function odaberi MIN.

5. Raspon R jednak je razlici MAX – MIN.

(1)

(2)

(3)

80

Page 81: Deskriptivna statistika QM1

Mjere rasipanja

PercentilMjerni rezultat ispod kojeg se nakazi k-ti udio svih rezultata.Primjer: 90-ti Percentil = 95,2 kgObjašnjenje: 90% svih izmjerenih vrijednosti je manje ili jednako 95,2 kg, odnosno 10% svih izmjerenih vrijednosti je veće od 95,2 kgPostupak:1. Upiši podatke u EXCEL radni list. Klikni na slobodnu ćeliju gdje će biti upisan rezultat računanja. Na traci alata klikni na ikonu funkcija (1)2. U dijalog prozoru u polju select a category

odaberi Statistical, a u polju Select a functionodaberi PERCENTILE. Klikni na Ok (2).

3. U dijalog prozoru u polju Array unesi podatke iz radnog lista, a u polju K upiši udio ispod granice, (npr. 0,9) (3). Klikni na Ok.4. U odabranom polju program ispiše vrijednost zahtijevanog percentila unesenih podataka.

(1)

(2)

(3)

81

Page 82: Deskriptivna statistika QM1

Mjere rasipanja

Varijanca

Varijanca je mjera rasipanja vrijednosti statističkog skupa oko srednje vrijednosti. Označavat ćemo je sa 2. Definirana je kao srednja vrijednost kvadrata odstupanja od srednje vrijednosti.

gdje je: xi – vrijednost i-tog elementa (opažanja) skupa – aritmetička sredina svih vrijednosti opažanja N – broj elemenata (opažanja) u skupu.

Kad se računa rasipanje podataka dobivenih ispitivanjem uzorka uzetog iz populacije, onda se varijanca računa prema formuli:

.

N

iixN 1

22 1)(

n

ii xx

ns

1

22

1

1)(

82

Page 83: Deskriptivna statistika QM1

Mjere rasipanja

Varijanca

Varijanca je ustvari srednja vrijednost kvadrata odstupanja vrijednostiuzorka od aritmetičke sredine.

Napomena: 1. Srednja vrijednost odstupanja vrijednosti uzorka od aritmetičke sredine jednaka je ništici. Zbroj pozitivnih razlika jednak je zbroju negativnih. Zato se za računanje varijance uzima kvadrat razlika od aritmetičke sredine.2. Mjerna jedinica varijance jednaka je kvadratu mjerne jedinice varijable koja se analizira.

.

83

Page 84: Deskriptivna statistika QM1

Mjere rasipanjaVarijanca

U EXCEL-u funkcija VAR računa varijancu pridruženih podataka uzorka.

Postupak1. Unesi podatke u radni list EXCEL programa2. Odaberi praznu ćeliju u koju će se upisati vrijednost varijance. Na traci alata klikni na ikonu funkcija (1)3. U dijalog prozoru u polju select a category odaberi Statistical, a u polju Select a function odaberi VAR (2). Klikni na Ok4. U dijalog prozoru u polju Number1 upiši sve podatke iz radnog lista (3). Klikni na Ok.5. U odabranu ćeliju program ispiše vrijednost varijance.

Napomena: Funkcija VARA računa varijancu iz podatakau kojima ima i praznih ćelija. Funkcija VARP računavarijancu populacije, a VARPA varijancu populacije kad su neke ćelije prazne.

(1)

(2)

(3)

84

Page 85: Deskriptivna statistika QM1

Mjere rasipanja

Standardno odstupanje

Standardno odstupanje je najčešće primjenjivana mjera rasipanja.Označavat ćemo je sa kad se radi o populaciji (velikom skupu)i sa s kad se radi o uzorku uzetom iz populacije.Definirana je kao pozitivna vrijednost drugog korijena od varijance. Ako aritmetičku sredinu populacije označimo sa , a uzorka sa , onda se standardno odstupanje računa za populaciju za uzorak

gdje je:xi – vrijednost i-tog elementa (opažanja) populacije ili uzorka – aritmetička sredina opažanja u populaciji

- aritmetička sredina opažanja u uzorkuN – broj elemenata (opažanja) u populacijin - broj elemenata (opažanja) u uzorku

N

iixN 1

22 1

n

ii xx

ns

1

22

1

1

x

x

85

Page 86: Deskriptivna statistika QM1

Mjere rasipanjaStandardno odstupanje

U EXCEL-u funkcija STDEV računa standardno odstupanje pridruženih podataka uzorka (dijeli s n-1).

Postupak1. Unesi podatke u radni list EXCEL programa2. Odaberi praznu ćeliju u koju će se upisati vrijednost standardnog odstupanja. Na traci alata klikni na ikonu funkcija (1)3. U dijalog prozoru u polju select a category odaberi Statistical, a u polju Select a function odaberi STDEV (2). Klikni na Ok4. U dijalog prozoru u polju Number1 upiši sve podatke iz radnog lista (3). Klikni na Ok.5. U odabranu ćeliju program ispiše vrijednost standardnog odstupanja.

Napomena: Funkcija STDEVA računa standardno odstupanja iz podataka u kojima ima i praznih ćelija. Funkcija STDEVP računa standardno odstupanje populacije (dijeli s N), a STDEVPA standardno odstupanje populacije kad su neke ćelije prazne.

(1)

(2)

(3)

86

Page 87: Deskriptivna statistika QM1

Mjere rasipanja

Standardno odstupanje

Zbog djelovanja slučajnih veličina svaki proces daje izlaze koji variraju oko neke srednje vrijednosti (ciljne vrijednosti). U analizi varijabilnosti procesa standardno odstupanje ima ogromni značaj.

Kad slučajni proces slijedi normalnu raspodjelu, vjerojatnost da se vrijednost obilježja procesa nađe u granicama jednaka je:

P(x – s ≤ ≤ x + s) = 68,27%P(x – 2s ≤ ≤ x + 2s) = 95,45%P(x – 3s ≤ ≤ x + 3s) = 99,73%

Napomena: Mjerena jedinica standardnog odstupanja jednaka je mjernoj jedinici varijable koja se analizira.

87

Page 88: Deskriptivna statistika QM1

Mjere rasipanja

P(x – s ≤ ≤ x + s) = 68,27%P(x – 2s ≤ ≤ x + 2s) = 95,45%P(x – 3s ≤ ≤ x + 3s) = 99,73%

Kontrolna karta

60

65

70

75

80

85

90

95

100

105

0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38

Redni broj uzorka

Mas

a u

kg 68,27%

95,45%

99,73%

Normalna raspodjela

0

0,01

0,02

0,03

0,04

0,05

0,06

0,07

0,08

0,09

65 67 69 71 73 75 77 79 81 83 85 87 89 91 93 95 97 99 101

103

105

Gustoća vjerojatnosti

Mas

a u

kg

68,27%

95,45%

99,73%

Kontrolna karta

60

65

70

75

80

85

90

95

100

105

0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38

Redni broj uzorka

Mas

a u

kg 68,27%

95,45%

99,73%

88

Page 89: Deskriptivna statistika QM1

DESKRIPTIVNA STATISTIKA

Postupak• unesi podatke u radni list EXCEL-a• aktiviraj praznu ćeliju• klikni mišem na Tools, odaberi Data Analysis i Descriptive statistics• u polje Input Range unesi sve podatke iz radnog lista EXCEL-a• aktiviraj opciju Output Range, u polje unesi praznu ćeliju gdje će program početi ispisivati rezultate• aktiviraj opciju Summary Statistics• klikni na Ok.

Summary

89

Page 90: Deskriptivna statistika QM1

REGRESIJSKA ANALIZA – STATISTIČKI ODNOSI MEĐU POJAVAMA

90

Page 91: Deskriptivna statistika QM1

Regresijska analiza - statistički odnosi među pojavama

Odnos među pojavama možemo promatrati funkcionalno ili statistički.

Kod funkcionalnog odnosa jednoj vrijednosti nezavisne varijableodgovara jedna vrijednost zavisne varijable. Npr. površina kvadrata – duljina stranice.

Kod statističkog odnosa jednoj vrijednosti nezavisne varijable odgovara više vrijednosti zavisne varijable. Npr. visina i težina ljudi.

Regresijska analiza - statistički odnosi među pojavama

Odnos među pojavama možemo promatrati funkcionalno ili statistički.

Kod funkcionalnog odnosa jednoj vrijednosti nezavisne varijableodgovara jedna vrijednost zavisne varijable. Npr. površina kvadrata – duljina stranice.

Kod statističkog odnosa jednoj vrijednosti nezavisne varijable odgovara više vrijednosti zavisne varijable. Npr. visina i težina ljudi.

91

Page 92: Deskriptivna statistika QM1

Statistički odnosi među pojavama

Proučavanje odnosa između dvije ili više varijabli spada u regresijsku analizu.

Koraci u regresijskoj analizi su:1. Definiranja cilja ispitivanja i ovisnih varijabli2. Skupljanje vrijednosti parova podataka3. Izrada dijagrama rasipanja4. Izračunavanje regresijske jednadžbe5. Proučavanje jednadžbe da bi se vidjelo koliko se dobro uklapaju podaci6. Utvrđivanje jačine povezanosti varijabli.

Statistički odnosi među pojavama

Proučavanje odnosa između dvije ili više varijabli spada u regresijsku analizu.

Koraci u regresijskoj analizi su:1. Definiranja cilja ispitivanja i ovisnih varijabli2. Skupljanje vrijednosti parova podataka3. Izrada dijagrama rasipanja4. Izračunavanje regresijske jednadžbe5. Proučavanje jednadžbe da bi se vidjelo koliko se dobro uklapaju podaci6. Utvrđivanje jačine povezanosti varijabli.

92

Page 93: Deskriptivna statistika QM1

Dijagram rasipanja

Dijagram rasipanja je grafički prikaz parova vrijednosti dobivenih mjerenjem,Dijagram se sastoji od osi koje predstavljaju obilježja. U dijagram se unose točke s koordinatama parova obilježja, npr. visina i težina učesnika seminara.

Ako imamo n mjerenja vrijednosti nezavisnih varijabli x i vrijednosti zavisnih varijabli y, parovi jesu (x1, y1), (x2, y2), ……(xn, yn).

Ako se između parova vrijednosti može naći neka veza (povezanost) kažemoda među parovima postoji korelacija.

Korelacija (povezanost) može biti linearnog ili nelinearnog oblika, ovisno da li parovi predstavljeni točkom u dijagramu rasipanja leže na pravcu ili u njegovoj neposrednoj blizini, odnosno na nekoj drugoj poznatoj nelinearnoj krivulji.

Korelacija linearnog oblika može imati pozitivan ili negativan smjer, ovisno o koeficijentu smjera pravca kojim se opisuje povezanost parova.

Kad se ne može utvrditi povezanost među parovima kažemo da su ne korelirani.

Dijagram rasipanja

Dijagram rasipanja je grafički prikaz parova vrijednosti dobivenih mjerenjem,Dijagram se sastoji od osi koje predstavljaju obilježja. U dijagram se unose točke s koordinatama parova obilježja, npr. visina i težina učesnika seminara.

Ako imamo n mjerenja vrijednosti nezavisnih varijabli x i vrijednosti zavisnih varijabli y, parovi jesu (x1, y1), (x2, y2), ……(xn, yn).

Ako se između parova vrijednosti može naći neka veza (povezanost) kažemoda među parovima postoji korelacija.

Korelacija (povezanost) može biti linearnog ili nelinearnog oblika, ovisno da li parovi predstavljeni točkom u dijagramu rasipanja leže na pravcu ili u njegovoj neposrednoj blizini, odnosno na nekoj drugoj poznatoj nelinearnoj krivulji.

Korelacija linearnog oblika može imati pozitivan ili negativan smjer, ovisno o koeficijentu smjera pravca kojim se opisuje povezanost parova.

Kad se ne može utvrditi povezanost među parovima kažemo da su ne korelirani.

93

Page 94: Deskriptivna statistika QM1

Dijagram rasipanja

Primjeri dijagrama rasipanja i korelacija događaja

Dijagram rasipanja

Primjeri dijagrama rasipanja i korelacija događaja

Linearna i pozitiv na korelacij a

0

20

40

60

80

100

120

140

165 170 175 180 185 190 195 200 205

Visina [cm}

Tež

ina

[kg

]

Linearna - negativna korelacija

0

0,2

0,4

0,6

0,8

1

1,2

1,4

0 1 2 3 4 5 6 7 8 9

Napon [V]

Str

uja

[m

A]

Nelinearna korelacija

1,5

1,7

1,9

2,1

2,3

2,5

2,7

2,9

3,1

3,3

3,5

0 2 4 6 8 10 12

napon [V]

dB

Nelinearna korelacija

1,5

2,5

3,5

4,5

5,5

6,5

7,5

8,5

0 2 4 6 8 10 12

napon [V]

dB

94

Page 95: Deskriptivna statistika QM1

Crtanje dijagrama rasipanjaPrimjer: Istražuje se postoje li statistička veza između cijene stanova i njihove površine. Podatke treba prikazati u raspšnom dijagramu.Postupak1. U EXCEL- upisati podatke.2. Klikni na ikonu grafički prikazi . Otvori se prozor Chart wizard. U polju Chart Type izaberi tip

XY (Scater), a u polju Chart Sub-type izaberi najgornji dijagram (1). Klikni na Next.

3. Otvori se prozor Source Data. U polju Data range unesi polja podataka y varijable tako da ih mišem označiš. Klikni Series (2).

Otvori se novi prozor (3)

Površina m2

Cijena

[eura]

35 95500

47 108100

55 115500

69 138000

85 178500

120 240000

(1)

(2)

95

Page 96: Deskriptivna statistika QM1

4. U polju X-values unesi podatke za x (označiti mišem) Klikni Next, otvori se novi prozor. Otvori list Titles. U odgovarajuća polja upiši naslov dijagrama, naziv x varijable i naziv y varijable (4). Po potrebi aktiviraj list Legend i deaktiviraj opciju Show legend. Klikni Finish.5. Program nacrta raspršni dijagram (5).

Napomena: Iz dijagrama se može zaključitida između površine stana i cijene postoji približnolinearni odnos (može se između točaka povući pravac. Osim togase vidi da stanovi smanjom površinomnisu baš na zamišljenom pravcu.

(3)

(4)Odnos površine i cijene stana

0

50000

100000

150000

200000

250000

300000

0 20 40 60 80 100 120 140

Površina [m2]

Cij

ena

stan

a [e

uro

]

(5)

96

Page 97: Deskriptivna statistika QM1

Računanje regresijskog pravca i koeficijenta korelacijePostupak1. Na jednu točku raspršnog dijagrama klikni

desnim mišem. Otvori se prozor u kojem treba izabrati Add Trendline (5).

2. Otvori se prozor Add Trendline gdje se izabere linearni dijagram kao na (6). Otvori stranicu Option.3. Otvori se prozor (7) gdje se aktiviraju opcije Display equation on chart i Display R-squared value on chart. Klikni Ok. Rješenje je slika (8).

Odnos površine i cijene stana

0

50000

100000

150000

200000

250000

300000

0 20 40 60 80 100 120 140

Površina [m2]

Cij

ena

stan

a [e

uro

]

(5)

(6) (7)

(8)

97

Page 98: Deskriptivna statistika QM1

Koeficijent linearne korelacije

Koeficijent linearne korelacije (Pearsonov koeficijent) je mjera smjera i stupnja statističke povezanosti.

Koeficijent linearne povezanosti označava se sa r = SQRT(R2)

Smjer korelacije. Koeficijent r ima isti predznak kao i koeficijent smjera a.Ako je r > 0, između parova obilježja postoji pozitivna korelacija,ako je r < 0, postoji negativna korelacijaako je r = 0, parovi obilježja nisu u korelacijiza r = 1, parovi obilježja leže na pravcu.

Stupanj statističke povezanosti:Ako je 0 < | r | < 0,25, postoji slaba korelacija,ako je 0,25 < | r | < 0,64, postoji srednja korelacijaako je 0,64 < | r | <1, postoji čvrsta linearna korelacija. Karl Pearsonako je r = 1 postoji determinirana povezanost

Koeficijent linearne korelacije

Koeficijent linearne korelacije (Pearsonov koeficijent) je mjera smjera i stupnja statističke povezanosti.

Koeficijent linearne povezanosti označava se sa r = SQRT(R2)

Smjer korelacije. Koeficijent r ima isti predznak kao i koeficijent smjera a.Ako je r > 0, između parova obilježja postoji pozitivna korelacija,ako je r < 0, postoji negativna korelacijaako je r = 0, parovi obilježja nisu u korelacijiza r = 1, parovi obilježja leže na pravcu.

Stupanj statističke povezanosti:Ako je 0 < | r | < 0,25, postoji slaba korelacija,ako je 0,25 < | r | < 0,64, postoji srednja korelacijaako je 0,64 < | r | <1, postoji čvrsta linearna korelacija. Karl Pearsonako je r = 1 postoji determinirana povezanost

98

Page 99: Deskriptivna statistika QM1

Korelacija ranga

Korelacija ranga (Spearmanov koeficijent) primjenjuje se za redosljedna obilježja.

gdje je: di – razlika rangova xi i y, n – broja parova rangova.

Ako je rs = 1, postoji savršena pozitivna korelacija ranga,ako je rs = -1, postoji savršena negativna korelacija ranga,ako je rs > 0, postoji pozitivna korelacija ranga,ako je rs < 0, postoji negativna korelacija ranga.

Engleski psiholog Charles Spearman

1863 - 1945

Korelacija ranga

Korelacija ranga (Spearmanov koeficijent) primjenjuje se za redosljedna obilježja.

gdje je: di – razlika rangova xi i y, n – broja parova rangova.

Ako je rs = 1, postoji savršena pozitivna korelacija ranga,ako je rs = -1, postoji savršena negativna korelacija ranga,ako je rs > 0, postoji pozitivna korelacija ranga,ako je rs < 0, postoji negativna korelacija ranga.

Engleski psiholog Charles Spearman

1863 - 1945

)( 161

21

2

nn

dr

n

ii

s

99

Page 100: Deskriptivna statistika QM1

Spearmanova korelacija ranga

Zadatak: 7 ocjenjivača rangirala su dva proizvoda. Podaci su dani u tablici 6Potrebno je utvrditi postoji li među rangovima statistička veza.

Postupak: 1) izračunati razlike rangova di (stupac 4), 2) izračunati kvadrat razlike rangova di

2 (stupac 5), 3) zbrojiti kvadrate razlike rangova di2

(stupac 6), 4) izračunati Spearman-ovu korelaciju ranga prema formuliTablica 6

Zaključak : Budući je rs = 0,82 između rangova postoji jaka korelacija. Ocjenitelji imaju približno ujednačen kriterij.

Spearmanova korelacija ranga

Zadatak: 7 ocjenjivača rangirala su dva proizvoda. Podaci su dani u tablici 6Potrebno je utvrditi postoji li među rangovima statistička veza.

Postupak: 1) izračunati razlike rangova di (stupac 4), 2) izračunati kvadrat razlike rangova di

2 (stupac 5), 3) zbrojiti kvadrate razlike rangova di2

(stupac 6), 4) izračunati Spearman-ovu korelaciju ranga prema formuliTablica 6

Zaključak : Budući je rs = 0,82 između rangova postoji jaka korelacija. Ocjenitelji imaju približno ujednačen kriterij. 10

4257A7

1-176A6

1-165A5

1134A4

1-143A3

1112A2

1-121A1

di2diOcjenjit. 2Ocjenjit. 1Predmet

2

12

66 10

1 11 7 49 1

601 1 0 1786 0 82

336

n

ii

s

dr

N (N ) ( )

, ,

100

Page 101: Deskriptivna statistika QM1

VREMENSKI NIZOVI

101

Page 102: Deskriptivna statistika QM1

Vremenski niz

Vremenski niz je skup kronološki uređenih vrijednosti varijable koja predočuje neku pojavu ili statistički proces u vremenu.

Podjela vremenskih nizova

S obzirom na obilježja vremenski se nizovi dijele na:- redoslijedne vremenske nizove- numeričke vremenske nizove.

S obzirom na nastanak imamo- intervalne – nastaje zbrajanjem vrijednosti pojave po intervalima

vremena i ima svojstvo kumulativnosti- trenutačni – sastoji se od kronološki uređenih vrijednosti koji su

u svezi s odabranim vremenskim točkama.

S obzirom na vremenski parametar niz može biti- kontinuiran (poprima vrijednost iz nekog intervala)- diskretan (poprima konačan broj vrijednosti).

Vremenski niz

Vremenski niz je skup kronološki uređenih vrijednosti varijable koja predočuje neku pojavu ili statistički proces u vremenu.

Podjela vremenskih nizova

S obzirom na obilježja vremenski se nizovi dijele na:- redoslijedne vremenske nizove- numeričke vremenske nizove.

S obzirom na nastanak imamo- intervalne – nastaje zbrajanjem vrijednosti pojave po intervalima

vremena i ima svojstvo kumulativnosti- trenutačni – sastoji se od kronološki uređenih vrijednosti koji su

u svezi s odabranim vremenskim točkama.

S obzirom na vremenski parametar niz može biti- kontinuiran (poprima vrijednost iz nekog intervala)- diskretan (poprima konačan broj vrijednosti).

102

Page 103: Deskriptivna statistika QM1

Grafički prikaz vremenskih nizova

Intervalni vremenski niz se prikazuje površinski (histogramom) ili linijskim dijagramom.

Različiti vremenski intervali se crtaju korigiranim frekvencijama fi =f∙rb/ri, , gdje je f izračunata učestalost razreda, rb – raspon temeljnih razreda, rj – raspon j-tog razreda.

Trenutačni vremenski niz se prikazuje linijskim dijagramom.

Grafički prikaz vremenskih nizova

Intervalni vremenski niz se prikazuje površinski (histogramom) ili linijskim dijagramom.

Različiti vremenski intervali se crtaju korigiranim frekvencijama fi =f∙rb/ri, , gdje je f izračunata učestalost razreda, rb – raspon temeljnih razreda, rj – raspon j-tog razreda.

Trenutačni vremenski niz se prikazuje linijskim dijagramom.Proizvodnja pšenice

300000

350000

400000

450000

500000

550000

600000

2000 2001 2002 2003 2004

godina

mas

a u

000

tona

Proizvodnja pšenice

0

100000

200000

300000

400000

500000

600000

2000 2001 2002 2003 2004

Godina

Ko

ličin

a u

00

0 t

on

a

103

Page 104: Deskriptivna statistika QM1

Trend vremenskih nizova

Trend pokazuje osnovni tijek vremenskog niza. Modelima trenda statistički se opisuje dugoročna kovarijanca pojave s vremenom.

U praksi je relativno česta uporaba linearnog trenda, eksponencijalnog trenda te nekih drugih asimptotskih modela. Njihova statistička analiza provodi se metodama regresijske analize.

Trend vremenskih nizova

Trend pokazuje osnovni tijek vremenskog niza. Modelima trenda statistički se opisuje dugoročna kovarijanca pojave s vremenom.

U praksi je relativno česta uporaba linearnog trenda, eksponencijalnog trenda te nekih drugih asimptotskih modela. Njihova statistička analiza provodi se metodama regresijske analize. Potrošnja vode po stanovniku

600

650

700

750

800

850

900

950

2000 2002 2003 2004 2005

Godina

Ob

uja

m u

m3

104

Page 105: Deskriptivna statistika QM1

Trend vremenskih nizovaU svim aktivnostima praćenja izvršenja planskih veličina primjenjuju se trendovi vremenskih nizova.Primjer:Za službena putovanja organizacija je planirala iznos od 1680000 kuna. Troškovi služenih putovanja u prvom Kvartalu dani su u tablici. Hoće li predviđena sredstva biti dovoljna?Postupak1. Izračunaj kumulativni trošak za prvi kvartal2. Nacrtaj raspršni dijagram za kumulativne troškove i

mjesece. Dodaj dijagramu trend pravac (Add Trendline)3. U prozoru Option aktiviraj opcije Display equation on

chart i Display R-squard value on chart, a u prozoruForward dodaj broj mjeseci do kraja godine. U našemprimjeru je to 8 mjeseci. Klikni OK (2).

4. Klikni mišem 2x na os x, otvori se polje Format Axis.Na stranici Axis u prozoru Minimum upiši 0, u Maximumupiši 12, a za Major unit upiši 1..

5. Klikni mišem 2x na os y, otvorit će se Format Axis.Na stranici Axis u prozor Minimum upiši 0, u Maximumvrijednost 1680000. Klikni Ok.

Trend vremenskih nizovaU svim aktivnostima praćenja izvršenja planskih veličina primjenjuju se trendovi vremenskih nizova.Primjer:Za službena putovanja organizacija je planirala iznos od 1680000 kuna. Troškovi služenih putovanja u prvom Kvartalu dani su u tablici. Hoće li predviđena sredstva biti dovoljna?Postupak1. Izračunaj kumulativni trošak za prvi kvartal2. Nacrtaj raspršni dijagram za kumulativne troškove i

mjesece. Dodaj dijagramu trend pravac (Add Trendline)3. U prozoru Option aktiviraj opcije Display equation on

chart i Display R-squard value on chart, a u prozoruForward dodaj broj mjeseci do kraja godine. U našemprimjeru je to 8 mjeseci. Klikni OK (2).

4. Klikni mišem 2x na os x, otvori se polje Format Axis.Na stranici Axis u prozoru Minimum upiši 0, u Maximumupiši 12, a za Major unit upiši 1..

5. Klikni mišem 2x na os y, otvorit će se Format Axis.Na stranici Axis u prozor Minimum upiši 0, u Maximumvrijednost 1680000. Klikni Ok.

Mjesec Trošak Kumul.Siječanj 142850 142850Veljača 167840 310690Ožujak 126210 436900Travanj 182370 619270

(1)

(2)

105

Page 106: Deskriptivna statistika QM1

Trend vremenskih nizova

Rezultat je dijagram na slici (3). Iz dijagrama se vidi da trend linija presijeca vrijednost 1680000 prije 12.tog mjeseca. Već u 11. tom mjesecu bit će potrošena planirana sredstva ako se budu trošila dosadašnjom dinamikom.

Potrebno je uvesti štednju ili se pripremiti za rebalans budžeta.

Trend vremenskih nizova

Rezultat je dijagram na slici (3). Iz dijagrama se vidi da trend linija presijeca vrijednost 1680000 prije 12.tog mjeseca. Već u 11. tom mjesecu bit će potrošena planirana sredstva ako se budu trošila dosadašnjom dinamikom.

Potrebno je uvesti štednju ili se pripremiti za rebalans budžeta.

Službena putovanja y = 155547x - 11440

R2 = 0,9956

0

200000

400000

600000

800000

1000000

1200000

1400000

1600000

0 1 2 3 4 5 6 7 8 9 10 11 12

Mjesec

Ku

mu

lati

vni

izn

os

106

Page 107: Deskriptivna statistika QM1

RASPRŠNI DIJAGRAM U EXCELU1. Unesi podatke2. Klikni na čarobnjak Dijagrami3. Izaberi XY (Scater) i ponuđenu opciju / Next4. Unesi podatke za Y5. Aktiviraj prozor Series i unesi podatke za X /

Next

107

Page 108: Deskriptivna statistika QM1

RASPRŠNI DIJAGRAM U EXCELU

6 Upiši :naslov dijagrama, naziv X osi naziv Y osi / klikni na Finish

7 Rezultat je raspršni dijagram

(nastavak)

108

Page 109: Deskriptivna statistika QM1

ODREĐIVANJE JEDNADŽBE TRENDA U EXCELU(nastavak)

8 Postavi strelicu miša na jednu točku raspršnog dijagram, desni klik9 Izaberi Add Trendline10 Izaberi linearni trend / otvori prozor Options

109

Page 110: Deskriptivna statistika QM1

ODREĐIVANJE JEDNADŽBE TRENDA U EXCELU(nastavak)

11 Upiši željeni broj jedinica X za koji se traži prognoza

12 Aktiviraj opciju Display equation on chart / Ok

13 Rezultat: raspršni dijagram, trend linija i jednadžba, prognoza

110

Page 111: Deskriptivna statistika QM1

Literatura:

Paul Newman, William L. Carslson, Betty Thorne: Statistika za poslovanje i ekonomiju, MATE, Zagreb, 2010.

Ivo Pavlić: Statistička teorija i primjena, Tehnička knjiga, Zagreb, 1970-

J.M. Juran, Frank M. Gryna: Planiranje i analiza kvalitete, MATE, Zagreb, 1999.

Ivan Šošić: Primijenjena statistika, Školska knjiga, Zagreb, 2004

111