6. ranŽirna vrsta, rang, kvantilni rang in...

52
S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-1 RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILI 6. RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILI 6.1. RANŽIRNA VRSTA, RANG IN KVANTILNI RANG RANŽIRNA VRSTA so po vrednosti številske spremenljivke velikosti (od najmanjše do največje) urejeni podatki proučevane populacije. RANG R enote pove mesto (zaporedno številko glede na urejenost), ki pripada enoti v okviru celotne populacije. Rang pokaže mesto enote v populaciji šele, če ga primerjamo z obsegom populacije N. Rang je lastnost enote – spremenljivka. PRIMER: Če smučar v smuku doseže tretji čas med tremi tekmovalci, je na zadnjem mestu, če pa doseže tretji čas med tridesetimi tekmovalci, je njegov čas v primerjavi z ostalimi tekmovalci zelo dober, saj ga uvrsti v prvo desetino tekmovalcev. Kadar ima več enot isto vrednost spremenljivke, uporabimo namesto ranga vezani (povprečni) rang R , s čimer se izognemo problemu vrstnega reda zapisa enot enake velikosti in stopničasti sliki rang grafikona.

Upload: vuongquynh

Post on 21-Jan-2019

261 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 6. RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILIphysics.fe.uni-lj.si/members/blaz/StatMet6-7.pdf · S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-1 RANŽIRNA VRSTA, RANG,

S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-1 RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILI

6. RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILI

6.1. RANŽIRNA VRSTA, RANG IN KVANTILNI RANG RANŽIRNA VRSTA so po vrednosti številske spremenljivke velikosti (od najmanjše do največje) urejeni podatki proučevane populacije. RANG R enote pove mesto (zaporedno številko glede na urejenost), ki pripada enoti v okviru celotne populacije. Rang pokaže mesto enote v populaciji šele, če ga primerjamo z obsegom populacije N. Rang je lastnost enote – spremenljivka. PRIMER: Če smučar v smuku doseže tretji čas med tremi tekmovalci, je na zadnjem mestu, če pa doseže tretji čas med tridesetimi tekmovalci, je njegov čas v primerjavi z ostalimi tekmovalci zelo dober, saj ga uvrsti v prvo desetino tekmovalcev. Kadar ima več enot isto vrednost spremenljivke, uporabimo namesto ranga vezani (povprečni) rang R , s čimer se izognemo problemu vrstnega reda zapisa enot enake velikosti in stopničasti sliki rang grafikona.

Page 2: 6. RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILIphysics.fe.uni-lj.si/members/blaz/StatMet6-7.pdf · S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-1 RANŽIRNA VRSTA, RANG,

S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-2 RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILI PRIMER: Imamo danih devet vrednosti neke številske spremenljivke 2, 2.5, 3, 3, 5.5, 6, 6, 6, 7.1. Razvrstimo jih v ranžirno vrsto in jim določimo rang in vezani rang.

y R R 2 1 1

2,5 2 2 3 3 5,3

243 =+

3 4 5,32

43 =+ 5,5 5 5

6 6 73876 =++

6 7 73876 =++

6 8 73876 =++

7,1 9 9

Page 3: 6. RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILIphysics.fe.uni-lj.si/members/blaz/StatMet6-7.pdf · S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-1 RANŽIRNA VRSTA, RANG,

S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-3 RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILI Vpliv velikosti populacije izločimo iz izračuna ranga tako, da namesto ranga R računamo KVANTILNI RANG P. Kvantilni rang pove, na katerem delu celotnega ranžirnega razmika leži določena enota oziroma koliki del celote ima manjše, kvečjemu enake vrednosti kakor je dana vrednost. Pri izračunavanju rangov spremenimo diskretni (celoštevilski) rang R v zveznega, ki ga označimo z RP, tako, da celoštevilski vrednosti pripišemo enotin razmik. Najmanjša vrednost ranga RP je tako 0,5, največja pa N+0,5. Vrednost kvantilnega ranga je pri najmanjši vrednosti ranga (0,5) enaka 0, pri največji vrednosti ranga (N+0,5) pa 1. ZAČETNA (NAJNIŽJA)

VREDNOST KONČNA (NAJVIŠJA)

VREDNOST RANG R (diskretna številska spremenljivka)

1

N

RANG RP (zvezna številska spremenljivka)

0,5

N + 0,5

KVANTILNI RANG P (zvezna številska spremenljivka)

0

1

Povezava med rangom in kvantilnim rangom:

5,0PNRP +⋅= in N

5,0RP P −=

Prednost kvantilnega ranga pred rangom je, da že sam zase (ne da bi navajali obseg populacije) prikaže mesto določene enote v populaciji.

Page 4: 6. RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILIphysics.fe.uni-lj.si/members/blaz/StatMet6-7.pdf · S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-1 RANŽIRNA VRSTA, RANG,

S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-4 RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILI PRIMER: Ranžirna vrsta desetih evropskih držav po številu študentov na 10 000 prebivalcev v letu 1997 (vir: Slovenija v številkah 1999, str. 68-71, podatki nekoliko prirejeni): DRŽAVA

ŠT. ŠTUDENTOV NA 10 000 PREB.

RANG RP

KVANTILNI RANG P

0,5 0 Hrvaška 192 1 0,05 Madžarska 193 2 0,15 Slovenija 231 3 0,25 Nemčija 263 4 0,35 Švedska 297 5 0,45 Italija 314 Velika Britanija 314 7 0,65 Grčija 314 Irska 362 9 0,85 Španija 402 10 0,95 10,5 1

105,0R

N5,0RP PP −

=−

=

Page 5: 6. RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILIphysics.fe.uni-lj.si/members/blaz/StatMet6-7.pdf · S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-1 RANŽIRNA VRSTA, RANG,

S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-5 RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILI 6.1.1. GRAFIČNO PRIKAZOVANJE RANŽIRNIH VRST Ranžirno vrsto prikažemo s prirejenim linijskim grafikonom, ki ga imenujemo RANG GRAFIKON: na abscisno os nanesemo vrednosti spremenljivke, za ordinato pa uporabimo dve merski lestvici, eno za vrednosti ranga, drugo pa za vrednosti kvantilnega ranga (začetek = 0 skale kvantilnega ranga je pri vrednosti ranga 0,5, konec = 1 pa pri vrednosti ranga N+0,5). Možna odčitavanja iz rang grafikona:

• Katera po rangu oziroma kolikšen del enot populacije ima vrednost spremenljivke manjšo, kvečjemu enako neki dani vrednosti. (Za dani y iščemo Py)

• Na podlagi skale za vrednosti kvantilnih rangov lahko

razberemo, katera je tista vrednost (označimo to vrednost z yP ) spremenljivke, od katere ima določeni delež populacije (označimo ta delež s P, npr. polovica enot) manjšo, kvečjemu enako vrednost spremenljivke od vrednosti yP. (Za dani P iščemo yP)

V obeh primerih predpostavimo linearno spreminjanje vrednosti in zveznega ranga med danimi zaporednimi točkami (ki jih dobimo iz ranžirne vrste).

Page 6: 6. RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILIphysics.fe.uni-lj.si/members/blaz/StatMet6-7.pdf · S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-1 RANŽIRNA VRSTA, RANG,

S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-6 RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILI

6.1.2. IZRAČUNAVANJE KVANTILOV IN KVANTILNIH RANGOV IZ POSAMEZNIH PODATKOV

A. Podan je y, iščemo njemu ustrezen rang Ry in kvantilni rang Py Dano imamo vrednost spremenljivke y (med najmanjšo in največjo vrednostjo med vrednostmi v ranžirni vrsti) in iščemo njej ustrezno vrednost ranga Ry in kvantilnega ranga Py . Rang in kvantilni rang torej odražata značilnost posamezne enote, zato sta statistični spremenljivki.

Zopet predpostavimo linearno spreminjanje vrednosti ranga med danimi zaporednimi točkami. Glede na dano vrednost y poiščemo v rang grafikonu dve zaporedni točki, med katerima leži iskana vrednost ranga in ju označimo s T-1(y-1,R-1) in T0(y0,R0). Iskano vrednost dobimo iz enačbe premice skozi ti dve točki

)RR(yy

)yy(RR 1010

11y −

−− −⋅

−−

+=

Kadar imajo vse enote različne vrednosti, upoštevamo, da je razlika med zaporednima rangoma 1 in zato se nam obrazec nekoliko poenostavi v

10

11y yy

yyRR−

−− −

−+=

Navadno izračunamo tudi kvantilni rang

N5,0R

P yy

−=

Page 7: 6. RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILIphysics.fe.uni-lj.si/members/blaz/StatMet6-7.pdf · S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-1 RANŽIRNA VRSTA, RANG,

S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-7 RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILI

PRIMER: Izračunajmo na osnovi podatkov o številu študentov na 10 000 prebivalcev v 10 evropskih državah na katero mesto bi se uvrstila Portugalska, če je v letu 1997 imela 306 študentov na 10 000 prebivalcev. Postopek računanja: 1. V ranžirni vrsti poiščemo, med kateri vrednosti bi

padla Portugalska: 01 yyy ≤<−

med Švedsko: y-1 = 297 in Italijo: y0 = 314 2. Poiščemo državama ustrezna ranga:

R-1 = 5 in R0 = 7 3. Izračunamo rang za Portugalsko iz obrazca, ki smo ga

dobili z linearno interpolacijo: Ry = R-1 + (R0 - R-1 ) ∗ (y - y-1 )/(y0 - y-1 ) = 5 + (7 – 5) ∗ (306 – 297) / (314 – 297) = 6,06

4. Iz ranga izračunamo še ustrezni kvantilni rang: Py = (Ry – 0,5) / N = (6,06 – 0,5) / 10 = 0,556. Iz kvantilnega ranga Py vidimo, da ima 55,6 % izbranih držav manjše, kvečjemu enako število študentov na 10 000 prebivalcev kot Portugalska.

Ker je rang vrednosti za Portugalsko enak 6,06 , ima 6,06 držav v populaciji manjše, kvečjemu enake vrednosti kot Portugalska in N+1- RP = 11-6,06 = 4,94 držav ima vrednosti večje kot Portugalska.

Page 8: 6. RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILIphysics.fe.uni-lj.si/members/blaz/StatMet6-7.pdf · S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-1 RANŽIRNA VRSTA, RANG,

S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-8 RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILI

B. Kvantilni rang P je podan, iščemo njemu ustrezno vrednost yPDano imamo vrednost kvantilnega ranga P, iščemo pa vrednost spremenljivke, ki mu ustreza, torej yP. Vrednost spremenljivke, ki ustreza danemu kvantilnemu rangu, imenujemo KVANTIL. Ker kvantil odraža značilnost celotne populacije (npr. vrednost y0,5 je tista vrednost, od katere je polovica enot v populaciji manjša, polovica pa večja – to vrednost imenujemo mediana), predstavlja statistični parameter. Predpostavimo linearno spreminjanje vrednosti spremenljivke med danimi zaporednimi točkami. Glede na dano vrednost P izračunamo njemu ustrezen rang RP in poiščemo v rang grafikonu dve zaporedni točki, med katerima leži iskana vrednost spremenljivke, torej

Označimo ju s T-1(y-1,R-1) in T0(y0,R0). 0P1 RRR ≤<−

Iskano vrednost dobimo iz enačbe premice skozi ti dve točki

)yy(RR

)RR(yy 1010

1P1P −

−− −⋅

−−

+=

Kadar imamo podan rang RP (pri vezanih rangih to ne velja!), upoštevamo, da je razlika med zaporednima rangoma vedno 1 in zato se nam obrazec nekoliko poenostavi v

)RR()yy(yy 1P101P −−− −⋅−+=

Page 9: 6. RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILIphysics.fe.uni-lj.si/members/blaz/StatMet6-7.pdf · S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-1 RANŽIRNA VRSTA, RANG,

S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-9 RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILI

Vsak kvantil yP nam razdeli populacijo na dva dela: v prvem je delež enot populacije enak P, v drugem pa je preostali delež enot populacije, ki je enak 1-P. (Ker predpostavljamo zveznost spremenljivke y, je vseeno, v kateri del štejemo enote s temi vrednostmi.) Nekateri kvantili imajo celo posebna imena. Med njimi so najpomembnejši: • MEDIANA – Me ali SREDIŠČNICA ali

RAZPOLOVIŠČNICA je kvantil, ki ustreza kvantilnemu rangu P = 0,5. Mediana je torej tista vrednost spremenljivke, ki razdeli populacijo glede na število enot na dva enaka dela.

• KVARTILI – Q so kvantili, ki razdelijo populacijo glede

na število enot na štiri enake dele:

Q1 = yP=0,25 , Q2 = yP=0,5 in Q3 = yP=0,75 • DECILI – D so kvantili, ki razdelijo populacijo glede na število enot na deset enakih delov:

D1 = yP=0,1 , D2 = yP=0,2 , ... , D9 = yP=0,9 • CENTILI – C so kvantili, ki razdelijo populacijo glede

na število enot na sto enakih delov:

C1 = yP=0,01 , C2 = yP=0,02 , ... , C99 = yP=0,99 Veljajo enakosti: Me = Q2 = D5 = C50

Page 10: 6. RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILIphysics.fe.uni-lj.si/members/blaz/StatMet6-7.pdf · S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-1 RANŽIRNA VRSTA, RANG,

S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-10 RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILI

PRIMER: Izračunajmo kvantil, ki pripada kvantilnemu rangu 0,5 (mediano) za podatke o številu študentov na 10 000 prebivalcev iz prejšnjega primera. Postopek računanja: 1. Podatke uredimo v ranžirno vrsto. 2. Ker imamo v ranžirni vrsti podane range, izračunamo

kvantilnemu rangu 0,5 (kateremu ustreza mediana) ustrezen rang: R = N ∗ P + 0,5 = 10 ∗ 0,5 + 0,5 = 5,5

3. Poiščemo, med katerima rangoma v ranžirni vrsti leži izračunani rang R:

01 RRR ≤<− R-1 = 5 in R0 = 7

4. Poiščemo v ranžirni vrsti rangoma ustrezni vrednosti: y-1 = 297 (Švedska) in y0 = 314 (Italija, Velika Britanija in Grčija)

5. Izračunamo mediano iz obrazca, ki smo ga dobili z linearno interpolacijo:

Me = y0,5 = y-1 + (y0 – y-1) ∗ (R – R-1) /( R0 – R-1) = = 297 + (314 – 297) ∗ (5,5 – 5)/(7 – 5) = 301,25

Polovica izbranih držav ima torej število študentov na 10 000 prebivalcev manjše od 301,25, preostala polovica držav pa ima večje število študentov na 10 000 prebivalcev.

Page 11: 6. RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILIphysics.fe.uni-lj.si/members/blaz/StatMet6-7.pdf · S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-1 RANŽIRNA VRSTA, RANG,

S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-11 RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILI OPOMBA: Če gledamo na podatke kot na diskretna števila, pa izračunamo iz posameznih podatkov mediano glede na sodost ali lihost velikosti populacije: če je N sodo število, vzamemo za mediano aritmetično sredino med podatkoma na mestu N/2 in (N/2) + 1; če pa je N liho število, pa vzamemo za mediano srednji podatek glede na urejenost. V našem primeru bi bila mediana aritmetična sredina med podatkoma 297 in 314, torej 305,5. Po istem postopku bi lahko izračunali vrednosti vseh treh kvartilov

231)3RR(yyQ 0025,01 ===== Q2 = Me = 301,25

338)8R(yyQ 075,03 ==== , devetih decilov (N=10): P y-1 Y0 D10*P= yP0,1 192 193 192,5 0,2 193 231 212 0,3 231 263 247 0,4 263 297 280 0,5 297 314 301,25 0,6 297 314 309,75 0,7 314 362 326 0,8 314 362 350 0,9 362 402 382

in sploh katerikoli kvantil.

Page 12: 6. RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILIphysics.fe.uni-lj.si/members/blaz/StatMet6-7.pdf · S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-1 RANŽIRNA VRSTA, RANG,

S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-12 RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILI

6.2. IZRAČUNAVANJE KVANTILOV IN KVANTILNIH RANGOV IZ FREKVENČNIH PORAZDELITEV Ranžirne vrste so primerne za prikaz majhnih populacij. Za velike populacije pa je urejanje prezamudno in v takih primerih uporabimo za prikaz podatkov frekvenčne porazdelitve. Tudi v frekvenčni porazdelitvi so vrednosti urejene po velikosti, le da je ranžiranje izvedeno med razredi, ne pa znotraj njih. Bistvena razlika med ranžirno vrsto in frekvenčno porazdelitvijo je, da pri frekvenčni porazdelitvi ne poznamo dejanskih vrednosti, zato predpostavljamo, da so vrednosti znotraj vsakega razreda enakomerno porazdeljene. Ker ne poznamo dejanskih vrednosti, so vse iz porazdelitve izračunane vrednosti le približki. Povezava med rangom enote in kumulativno frekvenco

(poznamo rang zgornje meje k-tega razreda):

z,kyk RF = Kvantilni rang izračunamo po obrazcu

ookk

kyy F

N5,0F

N5,0F

N

5,0RP z,k

z,k≈−=

−=

−=

Pri veliki populaciji (N velik), je zadnji člen zanemarljivo majhen in zato ne igra pomembne vloge v rezultatu.

Page 13: 6. RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILIphysics.fe.uni-lj.si/members/blaz/StatMet6-7.pdf · S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-1 RANŽIRNA VRSTA, RANG,

S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-13 RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILI

A. Podan je y, iščemo njemu ustrezen rang Ry in kvantilni rang Py Poznamo vrednost spremenljivke y in iščemo njej ustrezen rang Ry in kvantilni rang Py. Denimo, da leži iskana vrednost med zaporednima točkama T0(y0,R0) in T1(y1,R1). Upoštevamo • y0 = y-1,z = y0,s , y1 = y0,z in y0,s - y0,z = i0 • R0 = F-1 , R1 = F0 in R1 – R0 = F0 – F-1 = f0

Razred s frekvenco f0 imenujemo kvantilni razred. 0P1 FRF ≤<−

Rang in kvantilni rang izračunamo po obrazcih

)yy(ifFR s,0

0

01y −⋅+= −

in

N5,0R

P yy

−=

Pogosto izražamo kvantilni rang v odstotkih in v tem primeru nam Py pove odstotek enot, ki imajo manjše, kvečjemu enake vrednosti od izbrane vrednosti y.

Page 14: 6. RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILIphysics.fe.uni-lj.si/members/blaz/StatMet6-7.pdf · S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-1 RANŽIRNA VRSTA, RANG,

S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-14 RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILI

. Kvantilni rang P je podan, iščemo njemu ustrezno

a dano vrednost kvantilnega ranga P iščemo kvantil, t.j.

enot

sti.

enimo, da leži iskana vrednost med zaporednima točkama

y0,s , y1 = y0,z in y0,s - y0,z = i0 f0

0 imenujemo kvantilni razred.

in dobimo obrazec za izračun kvantila

Bvrednost yP Zustrezno vrednost spremenljivke yP. Kot pri frekvenčnih porazdelitveh predpostavljamo enakomerno porazdelitev znotraj razredov, tudi pri iskanju ustreznih vrednosti in kvantilov predpostavljamo linearno spreminjanje vredno

DT0(y0,R0) in T1(y1,R1). Upoštevamo • y0 = y-1,z = • R0 = F-1 , R1 = F0 in R1 – R0 = F0 – F-1 =

0P1 FRF ≤<−

Razred s frekvenco f

)FR(yy 1P0

0s,0P −−⋅+=

if

Page 15: 6. RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILIphysics.fe.uni-lj.si/members/blaz/StatMet6-7.pdf · S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-1 RANŽIRNA VRSTA, RANG,

S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-15 RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILI

Statistika 1 Ranžirna vrsta, rang© Lovrenc Pfajfar kvantilni rang, kvantili

Stran 30

UNIVERZA V LJUBLJANI EKONOMSKA FAKULTETA

KAZALO KONČAJNAZAJ

Vsak kvantil vedno razdeli populacijo glede naštevilo enot na dva dela.

1 - PP

yPy

go

Manj ali kvečjemutoliko;Največ toliko;Ne več kot toliko ;

Več kot toliko ;

Manj kot toliko ;Toliko ali več ;Vsaj toliko ;Najmanj toliko ;

Page 16: 6. RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILIphysics.fe.uni-lj.si/members/blaz/StatMet6-7.pdf · S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-1 RANŽIRNA VRSTA, RANG,

S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-16 RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILI PRIMER 1: Porazdelitev zaposlenih v RS in zaposlenih v izobraževanju v RS po višini bruto plače (BP) septembra 2001 (vir: Statistične informacije št. 22, 28. 2. 2002)

VSI ZAPOSLENI V RS

ZAPOSLENI V IZOBRAŽEVANJU V

RS BP

v 1000 SIT k fk Fk Fk

% fk Fk Fk %

nad 60 do 110 1 88 510 88 510 14,0 1 729 1 729 3,2 nad 110 do 170 2 210 528 299 038 47,3 9 834 11 563 21,4 nad 170 do 260 3 183 975 483 013 76,4 15 831 27 394 50,7 nad 260 do 400 4 101 787 584 800 92,5 22 153 49 547 91,7 nad 400 do 650 5 33 507 618 307 97,8 3 674 53 221 98,5 nad 650 do 1000 6 13 908 632 215 100 810 54 031 100

K = 6 632 215 54 031

a) Kolikšen del vseh zaposlenih v RS je imalo septembra

2001 BP kvečjemu 100 000 SIT? b) Kolikšen del vseh zaposlenih in zaposlenih v

izobraževanju v RS je imelo septembra 2001 BP višjo od 650 000 SIT?

c) Izračunajte in razložite mediano BP vseh zaposlenih in

zaposlenih v izobraževanju v RS septembra 2001! d) Vsaj kolikšno BP je imalo septembra 2001 tri četrtine

vseh zaposlenih v RS?

Page 17: 6. RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILIphysics.fe.uni-lj.si/members/blaz/StatMet6-7.pdf · S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-1 RANŽIRNA VRSTA, RANG,

S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-17 RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILI

Poligon zaposlenih in zap. v izobraževanju v RS po BP sept. 2001

0

50000

100000

150000

200000

250000

35 85 140 215 330 525 825 1375

BP v tisoč SIT

Frek

venc

e

Vsi zaposleniZap. V izobraževanju

Poligon zaposlenih in zap. v izobraževanju v RS po BP sept. 2001

0

100

200

300

400

500

600

35 85 140 215 330 525 825 1375

BP v tisoč SIT

Rel

at. g

osto

te

Vsi zaposleniZap. V izobraževanju

Page 18: 6. RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILIphysics.fe.uni-lj.si/members/blaz/StatMet6-7.pdf · S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-1 RANŽIRNA VRSTA, RANG,

S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-18 RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILI

Ogiva zaposlenih in zap. v izobraževanju v RS po BP sept. 2001

0

20

40

60

80

100

120

60 110 170 260 400 650 1000

BP v tisoč SIT

Kum

ulat

ive

rela

tivni

h fr

ekve

nc

Vsi zaposleniZap. V izobraževanju

Page 19: 6. RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILIphysics.fe.uni-lj.si/members/blaz/StatMet6-7.pdf · S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-1 RANŽIRNA VRSTA, RANG,

S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 7-1 SREDNJE VREDNOSTI

7. SREDNJE VREDNOSTI Vrednosti spremenljivke homogene populacije se v splošnem goste okrog nekega središča – srednje vrednosti (mere centralne tendence), ki jo zaradi tega opredelimo kot značilnost populacije (statistični parameter). Na gibanje posameznih vrednosti spremenljivke okoli takega središča vplivajo posamezni vplivi, ki niso bili vključeni med opredeljujoče pogoje populacije. Ogledali si bomo naslednje srednje vrednosti: 1. SREDINSKI VREDNOSTI (določeni z lego vrednosti v

populaciji)

• MEDIANA Me ali SREDIŠČNICA • MODUS Mo ali GOSTIŠČNICA

2. POVPREČJA (izračunana iz vrednosti številskih

spremenljivk)

• ARITMETIČNA SREDINA Y ali POVPREČJE

• HARMONIČNA SREDINA yH(uporaba: izračunavanje povprečij relativnih števil)

• GEOMETRIJSKA SREDINA yG

(uporaba: izračunavanje povprečnih vrednosti kazalcev dinamike pojavov)

Page 20: 6. RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILIphysics.fe.uni-lj.si/members/blaz/StatMet6-7.pdf · S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-1 RANŽIRNA VRSTA, RANG,

S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 7-2 SREDNJE VREDNOSTI

7.1. MEDIANA Me ali SREDIŠČNICA ali RAZPOLOVIŠČNICA Mediana je vrednost (kvantil), ki ustreza kvantilnemu rangu P = 0,5:

5,0PyMe == Mediana je tista vrednost spremenljivke, od katere ima polovica enot v populaciji manjše vrednosti in polovica večje. DISKRETNE VREDNOSTI Na osnovi ranžirne vrste izračunamo mediano po obrazcih (predpostavimo, da imamo vrednosti označene po velikostnem redu, torej ): N21 yyy ≤≤≤ K

i2N ⋅= 1i2N +⋅=

2yyMe 1ii ++

=

1iyMe +=

ZVEZNE VREDNOSTI Ker pa navadno tudi diskretne spremenljivke za potrebe računanja spremenimo v zvezne, pogosteje računamo mediano kot kvantil, ki pripada kvantilnemu rangu 0,5.

Page 21: 6. RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILIphysics.fe.uni-lj.si/members/blaz/StatMet6-7.pdf · S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-1 RANŽIRNA VRSTA, RANG,

S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 7-3 SREDNJE VREDNOSTI

PRIMERI: Izračunaj mediano iz dane ranžirne vrste: a) 31 36 53 55 67

(VREDNOSTI SO UREJENE PO VELIKOSTI !) N = 5 => i = 2 => Me = 53 (2 enoti imata manjše vrednosti od mediane, 2 enoti pa imata večje vrednosti od mediane)

b) 31 53 53 55 67 N = 5 => i = 2 => Me = 53 (2 enoti imata manjše ali enake vrednosti od mediane, 2 enoti pa imata večje vrednosti od mediane)

c) 31 36 53 53 67

N = 5 => i = 2 => Me = 53 (2 enoti imata manjše vrednosti od mediane, 2 enoti pa imata večje ali enake vrednosti od mediane)

d) 31 36 45 53 55 67

N = 6 => i = 3 => 492

5345Me =+

=

(3 enote imajo manjše in 3 večje vrednosti kot mediana) e) 31 36 53 53 55 67

N = 6 => i = 3 => 532

5353Me =+

=

(3 enote imajo manjše ali enake in 3 večje ali enake vrednosti kot mediana – mediana razdeli populacijo glede na število enot in ne glede na vrednosti!)

Page 22: 6. RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILIphysics.fe.uni-lj.si/members/blaz/StatMet6-7.pdf · S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-1 RANŽIRNA VRSTA, RANG,

S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 7-4 SREDNJE VREDNOSTI

PREDNOSTI MEDIANE: - lahko razumljiva srednja vrednost - za določanje mediane ni potrebno poznati vseh vrednosti

(posebej ugodno, če sta prvi in zadnji razred odprta), pač pa zadošča poznati vrednosti za tiste enote, ki ležijo okoli sredine v ranžirni vrsti

- mincyN

1ii =−∑

= pri Mec =

POMANJKLJIVOSTI: - preveč neobčutljiva za spremembe vrednosti (vrednost

mediane se spremeni le, če so spremembe vrednosti spremenljivk take, da vrednosti preidejo iz ene polovice v drugo)

- za asimetrične ali polimodalne porazdelitve je mediana

vrednost, ki je različna od večine vrednosti v populaciji

Page 23: 6. RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILIphysics.fe.uni-lj.si/members/blaz/StatMet6-7.pdf · S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-1 RANŽIRNA VRSTA, RANG,

S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 7-5 SREDNJE VREDNOSTI

7.2. MODUS Mo ali GOSTIŠČNICA Modus je najpogostejša vrednost spremenljivke y oziroma vrednost, okrog katere se goste vrednosti spremenljivke. Smiselno jo je ugotavljati le, če se določena vrednost pojavi pogosto ali pa za obsežne populacije. Obsežne populacije predstavimo s frekvenčnimi porazdelitvami in opazimo lahko, da modus leži v modusnem razredu. PREDNOSTI MODUSA: - modus lahko določamo za številske in imenske

spremenljivke - modus dobimo iz osnovnih podatkov s preštevanjem

(računanje ni potrebno) - je neobčutljiv za spremembe vrednosti posameznih enot vse

dokler gostitev na nekem drugem mestu ne prekorači stopnje gostitve v modusu (ni odvisen od vrednosti, ki za populacijo niso tipične)

POMANJKLJIVOSTI: - premalo občutljiv za spreminjanje posameznih vrednosti

(neobčutljivost na spremninjanje vrednosti je torej dobra, lahko pa tudi slaba lastnost modusa)

- pri bimodalnih in polimodalnih populacijah imamo več lokalnih modusov in v tem primeru ni vedno najbolj primerno vzeti največjega med njimi za (edino) mero gostitve populacije. Določanje modusa je lahko vprašljivo tudi pri zaokroževanju vrednosti.

Page 24: 6. RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILIphysics.fe.uni-lj.si/members/blaz/StatMet6-7.pdf · S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-1 RANŽIRNA VRSTA, RANG,

S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 7-6 SREDNJE VREDNOSTI

DOLOČANJE MODUSA NA PODLAGI FREKVENČNIH PORAZDELITEV Frekvenčne porazdelitve navadno prikazujemo s histogrami. Iz histograma dobimo oceno za modus tako, da pri izračunu upoštevamo frekvenco f0 v modusnem razredu in tudi frekvenci v sosednjih razdredih f-1 in f+1. Pri tem morajo imeti razredi enako širino, da frekvenčna porazdelitev izraža zakonitost gostitve pojava. Pri izračunu predpostavimo, da ima frekvenčna krivulja v okolici modusa obliko parabole druge stopnje, ki doseže svojo največjo točko prav v modusu. Parabola, ki gre skozi točke T-1(y-1 , f-1), T0(y0 , f0) in T1(y+1 , f+1), ima maksimum v točki z absciso

110

100s,0 fff2

ffiyMo

+−

−−−

⋅+=

Z i0 smo označili širino modusnega razreda in z y0,s njegovo spodnjo mejo. Grafično dobimo absciso s presečiščem daljic med točkama T(y0,s , f-1) in T(y0,z , f0) ter točkama T(y0,s , f0) in T(y0,z , f+1). Kadar širine razredov niso enake, zamenjamo v obrazcu frekvence z gostotami:

110

100s,0 ggg2

ggiyMo

+−

−−−

⋅+=

Page 25: 6. RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILIphysics.fe.uni-lj.si/members/blaz/StatMet6-7.pdf · S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-1 RANŽIRNA VRSTA, RANG,

S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 7-7 SREDNJE VREDNOSTI

PRIMER: V nekem košarkaškem klubu so dobili naslednjo frekvenčno porazdelitev višin njihovih igralcev:

Višina v cm fk

od 190 do pod 195 3 od 195 do pod 200 13 od 200 do pod 205 20 od 205 do pod 210 2

Na podlagi te porazdelitve izračunajte modus! Modusni razred je 3. razred, zato je:

y0,s = 200 y0,z = 205 f-1 = 13 f0 = 20 f+1 = 2

4,2014,1200213202

13205200fff2

ffiyMo110

100s,0

=+=

=−−⋅

−⋅+=

−−−

⋅+=+−

Page 26: 6. RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILIphysics.fe.uni-lj.si/members/blaz/StatMet6-7.pdf · S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-1 RANŽIRNA VRSTA, RANG,

S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 7-8 SREDNJE VREDNOSTI

POLIGON FREKVENČNE PORAZDELITVE VIŠIN KOŠARKAŠEV

05

10152025

190 192,5 197,2 202,5 207,5 210

Višina v cm

Frek

venc

a

Iz poligona bi lahko dobili prvi približek za modus – sredino modusnega razreda. Ta vrednost pa je modus le, če je porazdelitev simetrična. Ker je v našem primeru porazdelitev asimetrična v levo, sklepamo, da se enote gostijo nekoliko bolj levo od sredine. To vrednost pa izračunamo na osnovi histograma.

Page 27: 6. RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILIphysics.fe.uni-lj.si/members/blaz/StatMet6-7.pdf · S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-1 RANŽIRNA VRSTA, RANG,

S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 7-9 SREDNJE VREDNOSTI

7.3. ARITMETIČNA SREDINA Je najpogosteje uporabljena srednja vrednost, ki pa jo lahko izračunamo samo za številske spremenljivke. Aritmetična sredina ali povprečje Y (označena tudi z M ali µ) pove, kakšno vrednost bi imela posamezna enota, če bi vsoto vrednosti enot Y enakomerno razdelili po enotah v populaciji. 7.3.1. LASTNOSTI ARITMETIČNE SREDINE 1. Vrednost spremenljivke pri posamezni enoti yi lahko razdelimo na dva dela: na vrednost Y (pojasnjena sestavina), ki je enaka pri vseh enotah in je rezultat splošnih vplivov, ki izhajajo iz opredeljujočih pogojev populacije, in na del

(nepojasnjena sestavina), ki je rezultat posameznih vplivov na enoto.

ii Yy ε+=

V splošnem je lahko vsota posameznih vplivov pozitivna, negativna ali 0, pri določitvi povprečne vrednosti pa postavimo zahtevo, da je ta vsota enaka 0.

0N

1ii =ε∑

=

Pri tej predpostavki je torej

N

yY

N

1ii∑

== .

Page 28: 6. RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILIphysics.fe.uni-lj.si/members/blaz/StatMet6-7.pdf · S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-1 RANŽIRNA VRSTA, RANG,

S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 7-10 SREDNJE VREDNOSTI

2. Vsota odklonov za spremenljivko y od aritmetične sredine je enaka nič.

.0)Yy(N

1ii =−∑

=

3. Aritmetična sredina za linearno kombinacijo številskih spremenljivk yj s konstantami a0 in aj , j = 1,...p, je enaka linearni kombinaciji njihovih aritmetičnih sredin.

∑=

⋅+=p

1jjj0 yaay

∑=

⋅+=p

1jjj0 YaaY

4. Vsota kvadriranih odklonov vrednosti za spremenljivko y od konstante A je najmanjša, če je konstanta enaka aritmetični sredini.

Yc je če min)cy( 2N

1ii ==−∑

=

Ta lastnost je zelo pomembna, saj je iz kvadratov odklonov od aritmetične sredine izpeljan poseben parameter – VARIANCA.

Page 29: 6. RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILIphysics.fe.uni-lj.si/members/blaz/StatMet6-7.pdf · S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-1 RANŽIRNA VRSTA, RANG,

S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 7-11 SREDNJE VREDNOSTI

7.3.2. IZRAČUNAVANJE ARITMETIČNE SREDINE 7.3.2.1. Aritmetična sredina iz posamičnih podatkov

N

yY

N

1ii∑

==

7.3.2.2. Aritmetična sredina iz podatkov, urejenih v neštevilske statistične vrste (skupine so narejene za poljubno spremenljivko, imamo pa podano informacijo za številsko spremenljivko, za katero računamo aritmetično sredino) 2.a) Poleg števila enot imamo pri vsaki skupini podano tudi vsoto vrednosti številske spremenljivke, katere povprečje računamo: Skupina Število enot –

fk

Total skupine za številsko sprem. - Yk

1 f1 Y12 f2 Y2... ... ... K fK YK

N Y

=

== K

1kk

K

1kk

f

YY

Page 30: 6. RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILIphysics.fe.uni-lj.si/members/blaz/StatMet6-7.pdf · S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-1 RANŽIRNA VRSTA, RANG,

S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 7-12 SREDNJE VREDNOSTI

2.b) Poleg števila enot imamo pri vsaki skupini podano tudi povprečno vrednost (glede na enote v vsaki posamezni skupini) številske spremenljivke, katere povprečje računamo: Skupina Število enot –

fk

Povprečje skupine za številsko sprem. - kY

1 f1 1Y 2 f2 2Y ... ... ... K fK KY

Sumarno ali skupno aritmetično sredino izračunamo po obrazcu

=

=⋅

= K

1kk

K

1kkk

f

YfY

Ker smo povprečjem skupin dodali določene uteži ali ponderje, imenujemo tako dobljeno aritmetično sredino tudi TEHTANA ali URAVNOTEŽENA ali PONDERIRANA aritmetična sredina. Kadar imamo namesto frekvenc podane relativne frekvence, uporabimo obrazec

∑=

⋅=K

1kkk ,YfY o

pri podanih strukturnih odstotkih pa izračunamo povprečje kot

100

Y%fY

K

1kkk∑

=⋅

=

Page 31: 6. RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILIphysics.fe.uni-lj.si/members/blaz/StatMet6-7.pdf · S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-1 RANŽIRNA VRSTA, RANG,

S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 7-13 SREDNJE VREDNOSTI

7.3.2.3. Aritmetična sredina iz frekvenčnih porazdelitev (razredi so narejeni za številsko spremenljivko, za katero računamo aritmetično sredino) Na podlagi frekvenčne porazdelitve v splošnem ne moremo izračunati dejanske aritmetične sredine, ker za posamezen razred ne poznamo dejanske povprečne vrednosti. Zato v tem primeru dobimo le približek za aritmetično sredino. V izračunu vzamemo za približek povprečne vrednosti spremenljivke za vsak razred kar sredino razreda , saj je le-ta vzeta kot predstavnik enot v razredu. Upoštevamo torej približek

,Yyf kkk ≅⋅v katerem smo z yk (kot vedno v frekvenčnih porazdelitvah) označili sredino k-tega razreda. Pri tej predpostavki dobimo naslednji obrazec za izračun aritmetične sredine

∑∑

=

=

=

=

= ⋅⋅=⋅

≅⋅

=K

1kkkK

1kk

K

1kkk

K

1kk

K

1kkk

yfN1

f

yf

f

YfY

Kadar nastopajo v porazdelitvi odprti razredi, lahko izračunamo približek za aritmetično sredino le, če imamo za odprte razrede podane skupne vsote vrednosti v teh razredih. Prednost aritmetične sredine pred mediano in modusom je, da jo lahko izračunamo iz delnih aritmetičnih sredin (za mediano in modus moramo delne populacije združiti v celoto in iz te izračunati mediano ali modus).

Page 32: 6. RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILIphysics.fe.uni-lj.si/members/blaz/StatMet6-7.pdf · S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-1 RANŽIRNA VRSTA, RANG,

S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 7-14 SREDNJE VREDNOSTI

Kadar le ena ali nekaj vrednosti spremenljivke bistveno odstopa od ostalih vrednosti, smemo predpostaviti, da so odstopajoče vrednosti netipične za populacijo in jih zato ne upoštevamo pri izračunu povprečja – v tem primeru govorimo o MODIFICIRANI ARITMETIČNI SREDINI.

ODNOS MED MEDIANO, MODUSOM IN ARITMETIČNO SREDINO ZA UNIMODALNE PORAZDELITVE

Za simetrične porazdelitve velja:

YMoMe == Za porazdelitve, asimetrične v desno, veljajo neenakosti:

YMeMo << Za porazdelitve, asimetrične v levo (negativna asimetrija), veljajo neenakosti:

MoMeY << Za unimodalne in ne preveč asimetrične porazdelitve velja zveza:

)MeY(3MoY −⋅≅−

Page 33: 6. RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILIphysics.fe.uni-lj.si/members/blaz/StatMet6-7.pdf · S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-1 RANŽIRNA VRSTA, RANG,

S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 7-15 SREDNJE VREDNOSTI

7.4. HARMONIČNA SREDINA HARMONIČNA SREDINA je definirana kot recipročna vrednost aritmetične sredine reciprokov posameznih osnovnih podatkov (smiselno jo je računati le, če nobena od vrednosti ni nič):

y1N

1i i

y Y1

y1

NH ==∑=

Kadar imamo podatke razvrščene v skupinah in poznamo harmonične sredine skupin in število enot v skupinah, izračunamo harmonično sredino za številsko spremenljivko y kot tehtano (uravnoteženo, ponderirano) harmonično sredino harmoničnih sredin skupin Hk, v kateri so uteži števila enot v skupinah fk:

=

==K

1k k

k

K

1kk

y

Hf

fH

VELJA:

YHy ≤ in

N,,1j,iyyYH jiy K=∀=⇔=

Page 34: 6. RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILIphysics.fe.uni-lj.si/members/blaz/StatMet6-7.pdf · S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-1 RANŽIRNA VRSTA, RANG,

S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 7-16 SREDNJE VREDNOSTI

UPORABA: a) Harmonično sredino uporabimo takrat, kadar se vrednosti

populacije porazdeljujejo asimetrično, porazdelitev recipročnih vrednosti pa je simetrična.

b) Včasih s harmonično sredino računamo povprečja iz relativnih števil (predvsem koeficientov in struktur).

POVPREČJA IZ RELATIVNIH ŠTEVIL

(sestav in statističnih koeficientov)

Relativna števila so v splošnem kvocienti primerjanih količin. Če z Rk označimo razmerje dveh absolutnih podatkov Yk in Xk, potem lahko obrazec

k

kk X

YR =

pišemo tudi v obliki (če poznamo relativno število Rk in primerjalni podatek Xk)

kkk XRY ⋅= ali pa (če poznamo relativno število Rk in primerjani podatek Yk)

k

kk R

YX =

Glede na te zveze računamo povprečna (skupna, sumarna) relativna števila R na tri načine, odvisno od tega, s katerimi podatki razpolagamo:

Page 35: 6. RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILIphysics.fe.uni-lj.si/members/blaz/StatMet6-7.pdf · S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-1 RANŽIRNA VRSTA, RANG,

S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 7-17 SREDNJE VREDNOSTI

A. Če poznamo v skupinah k delni vsoti vrednosti (subtotala) Yk in Xk za obe spremenljivki, izračunamo povprečno (skupno, sumarno) relativno število R z obrazcem

∑=

=

=K

1kk

K

1kk

X

YR

PRIMER: Število aktivnega prebivalstva in registrirane brezposelne osebe v R Sloveniji na dan 31.12.1999 po spolu (vir: Statistične informacije, št. 53, 14. marec 2000):

Spol k Aktivno prebivalstvo Xk

Brezposelne osebe Yk

Ženske 1 403 015 57 903 Moški 2 477 506 56 445 Skupaj 880 521 114 348

Izračunati želimo stopnjo registrirane nezaposlenosti, ki je po definiciji razmerje med številom registrirano brezposlenih oseb in številom aktivnih prebivalcev, izraženo v odstotkih.

%986,12100880521114348100

X

YR

K

1kk

K

1kk

=⋅=⋅∑

∑=

=

=

Page 36: 6. RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILIphysics.fe.uni-lj.si/members/blaz/StatMet6-7.pdf · S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-1 RANŽIRNA VRSTA, RANG,

S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 7-18 SREDNJE VREDNOSTI

B. Če poznamo v skupinah delne vsote vrednosti za spremenljivko x in relativna števila skupin Rk, izračunamo (sumarno) relativno število za populacijo z obrazcem za tehtano aritmetično sredino (TAS)

∑ ⋅=

=

=K

1kk

K

1kkk

X

RXR

Kadar so uteži Xk po vseh skupinah k=1, …, K, enake, se R izraža kot navadna aritmetična sredina relativnih števil Rk po skupinah k. Glede na način, kako so podane sestave uteži Xk po skupinah, osnovni obrazec preoblikujemo v:

100

R%XR

K

1kkk∑ ⋅

= =

če so uteži Xk izražene relativno v strukturnih odstotkih Xk% , oziroma v

∑ ⋅==

K

1kkk RXR o

če so uteži Xk izražene relativno v strukturnih deležih.

Page 37: 6. RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILIphysics.fe.uni-lj.si/members/blaz/StatMet6-7.pdf · S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-1 RANŽIRNA VRSTA, RANG,

S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 7-19 SREDNJE VREDNOSTI

PRIMER: Število aktivnega prebivalstva in stopnje registrirane nezaposlenosti v R Sloveniji na dan 31.12.1999 po spolu (vir: Statistične informacije, št. 53, 14. marec 2000): Spol k Stopnja registrirane

nezaposlenosti Rk

Aktivno prebivalstvo Xk

Ženske 1 14,4 403 015 Moški 2 11,8 477 506 Skupaj (Opozorilo: skupna stopnja registrirane nezaposlenosti ni enaka vsoti niti aritmetični sredini stopenj po skupinah.) Izračunati želimo stopnjo registrirane nezaposlenosti, ki je po definiciji razmerje med številom registrirano brezposlenih oseb in številom aktivnih prebivalcev, izraženo v odstotkih.

%99,12880521

4775068,114030154,14

X

RXR

K

1kk

K

1kkk

=⋅+⋅

=∑

∑ ⋅=

=

=

Page 38: 6. RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILIphysics.fe.uni-lj.si/members/blaz/StatMet6-7.pdf · S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-1 RANŽIRNA VRSTA, RANG,

S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 7-20 SREDNJE VREDNOSTI

D. Če poznamo v skupinah vsote vrednosti za spremenljivko y in relativna števila skupin Rk, izračunamo (sumarno) relativno število za populacijo z obrazcem za tehtano harmonično sredino (THS)

∑=

=

=K

1k k

k

K

1kk

RY

YR

Če so uteži Yk izražene v strukturnih odstotkih Yk% ali strukturnih deležih , obrazec preoblikujemo v

∑=

=

K

1k k

k

R%Y

100R

oziroma

∑=

=

K

1k k

k

RY1R

o

Page 39: 6. RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILIphysics.fe.uni-lj.si/members/blaz/StatMet6-7.pdf · S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-1 RANŽIRNA VRSTA, RANG,

S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 7-21 SREDNJE VREDNOSTI

PRIMER: Stopnje registrirane nezaposlenosti in odstotek brezposlenih v R Sloveniji na dan 31.12.1999 po spolu (vir: Statistične informacije, št. 53, 14. marec 2000): Spol k Stopnja registrirane

nezaposlenosti Rk

Odstotek brezposelnih

Yk% Ženske 1 14,4 50,64 Moški 2 11,8 49,36 Skupaj 100,00 Izračunati želimo stopnjo registrirane nezaposlenosti, ki je po definiciji razmerje med številom registrirano brezposlenih oseb in številom aktivnih prebivalcev, izraženo v odstotkih.

%987,12

8,1136,49

4,1464,50

100

R%Y

100RK

1k k

k=

+=

∑=

=

Page 40: 6. RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILIphysics.fe.uni-lj.si/members/blaz/StatMet6-7.pdf · S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-1 RANŽIRNA VRSTA, RANG,

S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 7-22 SREDNJE VREDNOSTI

STANDARDIZIRANA POVPREČJA

Bistvena pomanjkljivost sumarnih povprečij, ki jih izračunamo iz povprečij po skupinah, je, da niso odvisna samo od teh števil, pač pa so odvisna tudi od sestave ustreznih uteži (strukturnih deležev). Posledica te odvisnosti je, da je neposredna primerjava sumarnih srednjih vrednosti in sumarnih relativnih števil med različnimi populacijami ali med isto populacijo v različnih časovnih obdobjih zelo vprašljiva. Za takšno primerjavo moramo izločiti vpliv različne sestave uteži. To naredimo tako, da izračunamo sumarno srednjo vrednost ali sumarno relativno število za več populacij pri enaki sestavi uteži. Standardna sestava, ki jo vzamemo za osnovo za izračunavanje sumarnih relativnih števil, mora biti taka, da čim bolje ustreza pravim sestavam za posamezne populacije, ki jih med seboj primerjamo. Standardna sestava je zato včasih povprečna sestava iz vseh populacij, ki jih primerjamo, včasih pa idealna sestava, ki je pogojena z analizo pojava, včasih pa za standardno sestavo vzamemo kar sestavo ene od populacij, ki jih primerjamo.

Page 41: 6. RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILIphysics.fe.uni-lj.si/members/blaz/StatMet6-7.pdf · S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-1 RANŽIRNA VRSTA, RANG,

S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 7-23 SREDNJE VREDNOSTI

7.5. GEOMETRIJSKA SREDINA GEOMETRIJSKA SREDINA iz N vrednosti y1, y2, …, yN je N-ti koren produkta vseh N vrednosti (smiselno jo je računati le, kadar so vse vrednosti za strogo pozitivne)

NN21 yyyG L⋅=

Tehtano geometrijsko sredino izračunamo po obrazcu

∑ ⋅= k KK

22

11

w www yyyG L Ker je geometrijske sredine težko računati, si pomagamo z logaritmiranjem

∑=

=N

1ii )ylog(

N1Glog

in

∑∑ =

⋅=K

1iik

k)ylog(w

w1Glog

VELJAJO NEENAKOSTI:

YGH yy ≤≤

Page 42: 6. RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILIphysics.fe.uni-lj.si/members/blaz/StatMet6-7.pdf · S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-1 RANŽIRNA VRSTA, RANG,

S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 7-24 SREDNJE VREDNOSTI

UPORABA: 1. Izračunavanje povprečnih (skupnih) vrednosti

indeksov.

PRIMER: Povečanju cen za 100% (indeks je 200) smiselno ne ustreza znižanje cen za 100%, ker bi bila v tem primeru cena nič, pač pa znižanje za 50% (indeks 50). Izravnava raznosmernih učinkov se pokaže pri geometrijski sredini, saj je geometrijska sredina indeksov 200 in 50

10050200 =⋅ . Ne pokaže pa se pri aritmetični sredini, saj je aritmetična sredina med 200 in 50 enaka 125. Zato je za izračunavanje časovnih sredin iz posameznih indeksov bolj upravičena geometrijska kot aritmetična sredina. 2. Izračunavanje povprečnih vrednosti kazalcev časovne dinamike pojavov (povprečni koeficient dinamike, povprečni verižni indeks, povprečna stopnja rasti).

Predpostavka pri iskanju povprečnega koeficienta dinamike je, da le-ta zagotavlja enakomerno gibanje pojava od časovne enote do časovne enote, ki pripelje pojav od vrednosti v prvem členu do vrednosti v zadnjem členu časovne vrste, zato velja

1N11N

N321N

KYKKKYY

KKKYY−

⋅=⋅⋅=

⋅⋅=

L

L

Page 43: 6. RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILIphysics.fe.uni-lj.si/members/blaz/StatMet6-7.pdf · S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-1 RANŽIRNA VRSTA, RANG,

S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 7-25 SREDNJE VREDNOSTI

Iz teh enakosti izpeljemo obrazce za izračun POVPREČNEGA KOEFICIENTA DINAMIKE glede na dane podatke: A. Poznamo posamezne vrednosti koeficienta dinamike:

1NN32 KKKK − ⋅= L

PRIMER: Ugotovi povprečni letni koeficient dinamike BDP R Slovenije v razdobju 1989-1994 na podlagi letnih koeficientov dinamike v tem razdobju. Koeficienti dinamike BDP R Slovenije v letih 1989-1994 (izračunani iz podatkov po cenah iz leta 1990 - v Mrd SIT)

Leto 1989 1990 1991 1992 1993 1994 t 1 2 3 4 5 6 Kt - 0,953 0,919 0,946 1,013 1,050

Vir: Pfajfar in Arh: STATISTIKA 1, str.134

975,005,1013,1946,0919,0953,0

KKKKKK5

1694939291909489

=⋅⋅⋅⋅=

=⋅⋅⋅⋅= −

BDP R Slovenije se je v razdobju 1989 – 1994 spreminjal z različnimi koeficienti dinamike, v povprečju pa je koeficient dinamike v tem razdobju znašal 0,975 letno. Če bi bilo spreminjanje vrednosti enakomerno, bi se v tem razdobju BDP vsako leto zmanjšal za 2,5 % (povprečna stopnja rasti je 100 krat povprečni koeficient dinamike minus 100, kar znese –2,5%). Povprečni verižni indeks za obravnavano razdobje 1989/1994 znaša 97,5.

Page 44: 6. RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILIphysics.fe.uni-lj.si/members/blaz/StatMet6-7.pdf · S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-1 RANŽIRNA VRSTA, RANG,

S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 7-26 SREDNJE VREDNOSTI

B. Poznamo posamezne vrednosti pojava ali vsaj začetno

in končno vrednost pojava za željeno razdobje:

ali

1N

1

N

YYK −=

)Klog(

1N

10K

))Ylog()Y(log(1N

1)Klog(

=

−−

=

PRIMER: Ugotovi povprečni letni koeficient dinamike BDP R Slovenije v razdobju 1989-1994 na podlagi podatkov o vrednosti BDP v Mrd SIT. Vrednost BDP R Slovenije v letih 1989-1994 po cenah iz leta 1990 (v Mrd SIT) Leto 1989 1990 1991 1992 1993 1994 t 1 2 3 4 5 6 BDP v Mrd SIT 206,4 196,8 180,8 171,1 173,3 182,0 Vir: Pfajfar in Arh: STATISTIKA 1,str.134

975,01010K

011,0)055,0(51))4,206log()182(log(

51)Klog(

011,0)Klog( ===

−=−=−=

Page 45: 6. RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILIphysics.fe.uni-lj.si/members/blaz/StatMet6-7.pdf · S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-1 RANŽIRNA VRSTA, RANG,

S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 7-27 SREDNJE VREDNOSTI

C. Poznamo indekse s stalno osnovo o za željeno razdobje:

ali

1N

o/1

o/N

IIK −=

)Klog(

o/1o/N

10K

))Ilog()I(log(1N

1)Klog(

=

−−

=

PRIMER: Ugotovi povprečni letni koeficient dinamike BDP R Slovenije v razdobju 1989-1994 na podlagi indeksov s stalno osnovo v letu 1989. Indeks BDP R Slovenije v letih 1989-1994 (1989=100) Leto 1989 1990 1991 1992 1993 1994 t 1 2 3 4 5 6 It/89 100 95,3 87,6 82,9 84,0 88,2 Vir: Pfajfar in Arh: STATISTIKA 1,str.134 Povprečni letni koeficient dinamike BDP R Slovenije je v razdobju 1989-1994 znašal 0,975.

Page 46: 6. RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILIphysics.fe.uni-lj.si/members/blaz/StatMet6-7.pdf · S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-1 RANŽIRNA VRSTA, RANG,

S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 7-28 SREDNJE VREDNOSTI

D. Če poznamo verižne indekse za željeno obdobje, poiščemo povprečni verižni indeks in povprečno stopnjo rasti po postopku:

1. Iz Vt izračunamo povprečni verižni indeks:

1NN32 VVVV − ⋅= L

2. Iz povprečnega verižnega indeksa izrazimo

povprečno stopnjo rasti:

100VS −=

PRIMER: Ugotovi povprečni letni koeficient dinamike, povprečni verižni indeks in povprečno letno stopnjo rasti BDP R Slovenije v razdobju 1989-1994 na podlagi verižnih indeksov BDP. Verižni indeksi za BDP R Slovenije v letih 1989-1994

Leto 1989 1990 1991 1992 1993 1994 t 1 2 3 4 5 6 Vt - 95,3 91,9 94,6 101,3 105,0

Vir: Pfajfar in Arh: STATISTIKA 1,str.134

5,970,1053,1016,949,913,95V 5 =⋅⋅⋅⋅= Povprečni verižni indeks BDP R Slovenije v razdobju 1989-1994 znaša 97,5.

Page 47: 6. RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILIphysics.fe.uni-lj.si/members/blaz/StatMet6-7.pdf · S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-1 RANŽIRNA VRSTA, RANG,

S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 7-29 SREDNJE VREDNOSTI

5,21005,97S −=−= Stopnje rasti BDP RS so bile v razdobju 1989-1994 vsako leto različne. Iz začetne ravni v letu 1989 na končno raven v letu 1994 pa bi prišli tudi, če bi se BDP RS vsako leto zmanjšal za 2,5% glede na tako izračunano raven v predhodnem letu. E. Če poznamo stopnje rasti za željeno obdobje, poiščemo povprečni verižni indeks in povprečno stopnjo rasti po postopku: 1. Iz St izračunamo Kt:

100

100SK tt

+=

2. Iz koeficientov rasti izračunamo povprečni koeficient rasti:

1NN32 KKKK − ⋅= L

3. Iz povprečnega koeficienta rasti izrazimo povprečno stopnjo rasti

in povprečni verižni indeks

100100KS −⋅=

Page 48: 6. RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILIphysics.fe.uni-lj.si/members/blaz/StatMet6-7.pdf · S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-1 RANŽIRNA VRSTA, RANG,

S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 7-30 SREDNJE VREDNOSTI

100SV +=

PRIMER: Izračunaj povprečno letno stopnjo rasti BDP R Slovenije za razdobje 1989/1994 na podlagi danih letnih stopenj rasti. Stopnje rasti BDP R Slovenije v letih 1989-1994

Leto 1989 1990 1991 1992 1993 1994 t 1 2 3 4 5 6 St - - 4,7 - 8,1 - 5,4 1,3 5,0

Vir: Pfajfar in Arh: STATISTIKA 1,str.134

100S1K t

t +=

K2 = 0,953, K3 = 0,919, K4 = 0,946, K5 = 1,013, K6 = 1,050

975,005,1013,1946,0919,0953,0K 5 =⋅⋅⋅⋅=5,2100100975,0S −=−⋅=

Povprečna letna stopnja rasti BDP R Slovenije v razdobju 1989-1994 znaša –2,5%. Letne stopnje rasti BDP v Sloveniji so bile v razdobju 1989/1994 različne, iz ravni BDP v letu 1989 pa bi prišli na raven v letu 1994 tudi, če bi se v tem razdobju BDP vsako leto zmanjšal za 2,5% glede na tako izračunano raven v prejšnjem letu.

Page 49: 6. RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILIphysics.fe.uni-lj.si/members/blaz/StatMet6-7.pdf · S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-1 RANŽIRNA VRSTA, RANG,

S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 7-31 SREDNJE VREDNOSTI

F. Izračun začetne ravni pojava, če poznamo končno raven pojava in povprečno vrednost koeficienta dinamike:

1NN

1K

YY −=

PRIMER: Izračunaj BDP R Slovenije v letu 1989, če vemo, da je bila njegova vrednost v letu 1994 enaka 182 Mrd SIT (po cenah iz leta 1990) in je bila povprečna letna stopnja rasti za obdobje od leta 1989 do 1994 enaka –2,5!

975,0100

100SK =+

=

6,206975,0182

KYY 51N

N1 === −

Vrednost BDP R Slovenije je v letu 1989 znašala 206,6 Mrd SIT (po cenah iz leta 1990).

Page 50: 6. RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILIphysics.fe.uni-lj.si/members/blaz/StatMet6-7.pdf · S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-1 RANŽIRNA VRSTA, RANG,

S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 7-32 SREDNJE VREDNOSTI

G. Izračun potrebnih časovnih enota, da dosežemo željeno vrednost, če poznamo začetno raven in povprečno vrednost koeficienta dinamike:

)Klog()Ylog()Ylog(

)Klog(YY

log1N 1N1

N

−==−

PRIMER 1: Ocenimo, katerega leta bi izvoz R Slovenije dosegel 7 Mrd USD,če je vrednost izvoza leta 1992 znašala 4182 Mio USD in predpostavljamo, da je v naslednjih letih izvoz naraščal po povprečni letni stopnji rasti 8 odstotkov.

let69,669,6)08,1log(

)4182log()7000log()Klog(

)Ylog()Ylog(1N 1N

==

=−

=−

=−

1992 + 6,69 = 1998,69

85,25169,0365 =⋅ Ker so podatki o vrednosti izvoza intervalni in se nanašajo na časovno enoto enega leta, na podlagi privzete stopnje rasti izvoza od leta 1992 ocenjujemo, da bi vrednost izvoza dosegla 7 Mrd USD v letu s koncem v 252 dnevu leta 1999, torej v letu, ki se je končalo 9.septembra 1999, torej v letu od 10. septembra 1998 do 9. septembra 1999.

Page 51: 6. RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILIphysics.fe.uni-lj.si/members/blaz/StatMet6-7.pdf · S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-1 RANŽIRNA VRSTA, RANG,

S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 7-33 SREDNJE VREDNOSTI

Preizkus: Leto t Yt v Mio SIT 1992 1 4182 1993 2 4182* 1,08 = 4516,56 1994 3 4516,56*1,08 = 4877,881995 4 5268,12 1996 5 5689,56 1997 6 6144,73 1998 7 6636,31 1999 8 7167,21

Page 52: 6. RANŽIRNA VRSTA, RANG, KVANTILNI RANG IN KVANTILIphysics.fe.uni-lj.si/members/blaz/StatMet6-7.pdf · S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 6-1 RANŽIRNA VRSTA, RANG,

S. Korenjak-Černe: STATISTIČNE METODE Prosojnica 7-34 SREDNJE VREDNOSTI

GRAFIČNI PRIKAZ Grafično prikažemo spreminjanje pojava Y z eksponentno krivuljo, ki poteka skozi točki za začetno (1,Y1) in končno raven (N,YN):

1N1N KYY

−⋅=

Če z Yt označimo vrednost, ki jo dobimo po obrazcu

,KYY1t

1t−

⋅= potem se dobljene vrednosti v prvi T(1,Y1) (t=1) in zadnji točki T(N,YN) (t=N) ujemata z zečetno in končno ravnjo pojava Y.