16513850-formule-statistica

30
FORMULE STATISTICA frecvenţa relativă 100 = i i i n n f ponderea sau greutatea specifică a unui element (x i ) în totalul colectivităţii ( = n i i x 1 ) se obţine pe baza relaţiei: n 1, i , 100 1 = = = n i i i i x x f Media aritmetică simplă se foloseşte pentru seriile în care fiecare nivel al caracteristicii este purtat de o singură unitate statistică. n x ... x x x x n 3 2 1 + + + + = sau n x x n 1 i i = = , n , 1 i = , n=volumul colectivităţii

Upload: sorin

Post on 27-Jun-2015

766 views

Category:

Documents


5 download

TRANSCRIPT

Page 1: 16513850-Formule-Statistica

FORMULE STATISTICA

frecvenţa relativă

100⋅=∑ i

ii n

nf

ponderea sau greutatea specifică a unui element (xi) în totalul

colectivităţii (∑=

n

iix

1) se obţine pe baza relaţiei:

n1,i ,100

1

=⋅=∑

=

n

ii

ii

x

xf

Media aritmetică simplă se foloseşte pentru seriile în care fiecare

nivel al caracteristicii este purtat de o singură unitate statistică.

n

x...xxxx n321 ++++= sau

n

xx

n

1ii∑

== , n,1i = , n=volumul

colectivităţii

Page 2: 16513850-Formule-Statistica

Media aritmetică ponderată se foloseşte în cazul seriilor cu

frecvenţe

m21

mn332211

n...nn

nx...nxnxnxx

+++++++

= sau ∑

=

==n

1ii

n

1iii

n

nxx

formule de calcul simplificat a mediei aritmetice:

-pt. serii simple:a

n

)ax(x

n

1ii

+−

=∑

=

-pt. serii ponderate: an

n)ax(x

n

1ii

n

1iii

+⋅−

=∑

=

=

a. Dacă se micşorează fiecare variantă a caracteristicii de un anumit

număr de ori ”k”, atunci media seriei se micşorează de acelaşi

număr de ori.

Se obţin următoarele relaţii:

-pt. serii simple:k

nk

x

x

n

1i

i

⋅=∑

=

-pt. serii ponderate: kn

nk

x

xn

1ii

n

1ii

i

⋅⋅

=∑

=

=

Page 3: 16513850-Formule-Statistica

b. Dacă frecvenţele seriei se micşorează de un număr „c” de ori,

atunci media aritmetică rămâne neschimbată.

Această proprietate se aplică numai seriilor cu frecvenţe.

xn

nx

nc

1

nxc

1

c

nc

nx

xn

1ii

n

1iii

n

1ii

n

1iii

n

1i

i

n

1i

ii

===⋅

=∑

=

=

=

=

=

=

c. Suma algebrică a abaterilor nivelurilor individuale ale

caracteristicii de la media lor este egală cu zero.

∑ ∑ ∑∑ ∑∑∑

=⋅−=⋅−=−=−

=−

0n

xnxxnxxx)xx(

0)xx(

iiiii

i

formule de calcul simplificat al mediei aritmetice:

-pt. serii simple:ak

nk

ax

x

n

1i

i

+⋅

=∑

=

-pt. serii ponderate: ak

c

nc

n

k

ax

xn

1i

i

n

1i

ii

+⋅⋅

=∑

=

=

Media, în cazul caracteristicii alternative

n

np 1=

Page 4: 16513850-Formule-Statistica

Media unităţilor care nu poartă acea caracteristică se notează cu „q” şi

se determină astfel:

n

nnq 1−

=

aplicarea relaţiei de calcul a modului:

21

10 dxMo

∆+∆∆

⋅+= , unde:

x0 = limita inferioară a intervalului modal,

d = mărimea intervalului modal,

1∆ = diferenţa dintre frecvenţa intervalului modal şi frecvenţa intervalului

anterior celui modal,

2∆ = diferenţa dintre frecvenţa intervalului modal şi frecvenţa intervalului

următor celui modal.

Pe cale grafică, modul se determină pe baza histogramei

Metodologia de calcul a medianei este diferită după natura seriei

luate în calcul.

Pentru serii simple se întâlnesc două situaţii:

-seria are un număr impar de termeni, când mediana este acea variantă a

caracteristicii cu rangul 2

1n +, după ce în prealabil seria a fost ordonată

crescător, unde n = nr. termenilor.

Page 5: 16513850-Formule-Statistica

: 2

nU iMe ∑= ;

Me

Me

0 n

NaUdxMe

−⋅+= , unde:

x0 = limita inferioară a intervalului median;

d = mărimea intervalului median;

Na = frecvenţa cumulată anterioară intervalului median;

nMe = frecvenţa reală a intervalului median.

Pe cale grafică mediana se determină ca şi în situaţia precedentă cu

ajutorul curbei frecvenţelor cumulate.

Quartilele

1Q

1Q

01 n

NaUdxQ

−⋅+=

2Q

2Q

02 n

NaUdxQ

−⋅+=

3Q

3Q

03 n

NaUdxQ

−⋅+=

x0 = limita inferioară a intervalului quattilic;

d = mărimea intervalului quartilic;

UQ1, UQ2, UQ3 = unităţile quartilice;

Na = frecvenţa cumulată anterioară intervalului quartilic;

nQ1, nQ2, nQ3 = frecvenţele reale ale intervalului quartilic.

Page 6: 16513850-Formule-Statistica

4

nU i1Q ∑= ; Meii2Q U

2

n

4

n2U === ∑∑ ;

4

n3U i3Q ∑=

Decilele

1D

1D

01 n

NaUdxD

−⋅+=

2D

2D

02 n

NaUdxD

−⋅+=

D5 = Me = Q2

9D

9D

09 n

NaUdxD

−⋅+=

10

nU i1D ∑=

5

n

10

n2U ii2D ∑∑ ==

10

n9U i9D ∑= .

În cazul seriilor cu frecvenţe în care caracteristica este dată pe

variante, mediala se calculează în următoarele etape:

-se determină produsele iinx ;

Page 7: 16513850-Formule-Statistica

-se calculează şirul produselor iinx cumulate, notate cu Li;

-se determină unitatea medială conform relaţiei: 2

nxU iiMl ∑= ;

-se caută locul unităţii mediale pe şirul Li, alegând un nivel egal sau mai

mare decât acesta;

-se identifică mediala ca fiind nivelul caracteristicii corespunzător unităţii

mediale.

În cazul seriilor cu frecvenţe şi caracteristica sub formă de intervale de

variaţie, mediala se determină tot prin calcul şi grafic.

Prin calcul se parcurg operaţiile:

-se determină produsele iinx ;

-se calculează şirul produselor iinx cumulate, notate cu Li;

-se determină unitatea medială conform relaţiei: 2

nxU iiMl ∑= ;

-se caută locul unităţii mediale pe şirul Li, alegând un nivel egal sau mai

mare decât acesta;

-se identifică intervalul medial, ca fiind intervalul caracteristicii

corespunzător unităţii mediale;

-se aplică formula medialei: Mlii

Ml

0 nx

LaUdxMl

−⋅+= , unde:

x0 = limita inferioară a intervalului medial;

d = mărimea intervalului medial;

UMl = unitatea medială;

La = produsul cumulat anterioar intervalului medial;

iMlinx = produsul iinx corespunzător intervalului medial.

Page 8: 16513850-Formule-Statistica

Media cronologică simplă se calculează când momentele sunt egal distanţate

între ele.

Pentru seria n1-n21 x,x, , x,x , 1n

2

xx

2

xx

2

xx

x

n1n3221

cr−

+++

++

+

=−

.

Prin transformare, această relaţie devine:

1n2

xxxx

2

x

x

n1n32

1

cr−

++++=

−.

Media cronologică ponderată se calculează atunci când intervalele de

timp dintre termenii seriilor de momente sunt inegale.

În acest caz, mediile parţiale, din care se calculează media întregii

perioade, sunt ponderate cu durata perioadelor parţiale dintre termenii seriei,

notate cu ti.

1n21

1nn1n

232

121

crttt

t2

xxt

2

xxt

2

xx

x−

−−

+++

+++

++

+

=

Media armonică simplă: ∑=

i

h

x

1n

x

Page 9: 16513850-Formule-Statistica

Media armonică ponderată: ∑∑

⋅=

ii

ih

nx

1

nx

Considerăm seria: n1-n21 x,x, , x,x .

-mediile mobile din câte 3 termeni:

3

xxxx 321

1

++= ,

3

xxxx 432

2

++= , ,

3

xxxx n1n2n

2n

++= −−− .

-mediile mobile din câte 4 termeni:

4

xxxxx 4321

1

+++= ,

4

xxxxx 5432

2

+++= , ,

4

xxxxx n1n2n3n

3n

+++= −−−

− .

Media progresivă

2

xxx s

progr+

= , unde:

x = media generală a seriei;

sx = media termenilor calitativ superiori mediei generale.

Media geometrică simplă:

nn21g xxxx ⋅⋅⋅=

Media geometrică ponderată:

∑ ⋅⋅⋅= i m21n n

m

n

2

n

1g xxxx

Page 10: 16513850-Formule-Statistica

Media pătratică simplă:n

xx

2i

patr∑=

Media pătratică ponderată: ∑∑ ⋅

=i

i2i

patrn

nxx

• Indicatorii simpli ai dispersiei

Amplitudinea variaţiei

În mărime absolută

minmax xxAx −=

În mărime relativă

100minmax% ⋅

−=

x

xxAx , unde:

minmax , xx = nivelul maxim, respectiv minim al variabilei X;

x = nivelul mediu al variabilei X.

2. Abaterea individuală

În mărime absolutăxxd ii −=

În mărime relativă

Page 11: 16513850-Formule-Statistica

100% ⋅−

=x

xxd i

i

• Indicatorii sintetici ai dispersiei

1. Abaterea medie liniară

-pentru serii simple:n

xx

n

dd i

ii

i ∑∑ −== , când

knnn n ==== ...21 ,

-pentru serii cu frecvenţe: ∑∑

∑∑ ⋅−

=⋅

=

ii

iii

ii

ii

i

n

nxx

n

ndd , când

nnnn ≠≠≠ ...21

2. Varianţa (dispersia)

-pentru serii simple:( )

n

xx

n

di

ii

i ∑∑ −==

22

2σ ,

-pentru serii cu frecvenţe:( )∑

∑∑

∑ ⋅−=

⋅=

ii

iii

ii

iii

n

nxx

n

nd22

2σ .

3. Abaterea medie pătratică (deviaţia standard)

pentru serii simple: ( )

2i

2

ii

2i

n

xx

n

dσσ =

−===

∑∑

-pentru serii cu frecvenţe:( )

2

22

σσ =⋅−

==⋅

=∑

∑∑

ii

iii

ii

iii

n

nxx

n

nd

Intervalul mediu de variaţie

Page 12: 16513850-Formule-Statistica

+

−=±

dx

dxdx , respectiv

+

−=±

σσ

σx

xx

. Coeficientul mediu de variaţie

100⋅=x

dν , respectiv 100⋅=x

σν

>ν<ν<<ν<

<ν<

tativa.nereprezen este media 50%larg sensin tivareprezenta este media 50%35%

tivareprezentamoderat este media 53%17%tivareprezentastrict este media %170

Proprietăţile dispersiei sunt:

• Dispersia unei distribuţii este egală cu diferenţa dintre media pătratelor

tuturor variantelor caracteristicii şi pătratul mediei.

222 )x(x −=σ

( )

22222

i

i

2

i

ii

i

i2i

ii

i

2

i2i

ii

ii

2

i2

xxxx2x

n

nx

n

nxx2

n

nx

n

n)xxx2x(

n

nxx

−=+−=

=+⋅−=+−

=⋅−

=∑∑

∑∑

∑∑

∑∑

∑∑

σ

Dispersia unui şir de valori constante este egală cu zero, • Dispersia calculată din abaterile variantelor caracteristicii faţă de

constanta „a” este mai mare decât dispersia calculată din aceleaşi variante

faţă de media lor cu pătratul diferenţei dintre medie şi constanta „a”.

-pentru serii simple:( )

2i

2i

2 )ax(n

ax−−

−=

∑σ ,

-pentru serii cu frecvenţe:( )

2

ii

ii

2i

2 )ax(n

nax−−

⋅−=

∑∑

σ .

Page 13: 16513850-Formule-Statistica

• Dacă fiecare nivel al caracteristicii se micşorează de „k” ori, atunci

dispersia se micşorează de „k2” ori.

-pentru serii simple:2i

2

i

2 kn

k

xx

=∑

σ,

-pentru serii cu frecvenţe: 2

ii

ii

2

i

2 kn

nk

xx

⋅⋅

=∑

∑σ .

• Dacă se împarte fiecare nivel al frecvenţelor printr-o constantă „c”, atunci

dispersia rămâne neschimbată.

( )

∑ ⋅−=

i

i

i

i2

i2

c

nc

nxx

σ

Aceste proprietăţi sunt folosite pentru calculul simplificat al

dispersiei. Din combinarea lor se ajunge la formulele care conduc la cea mai

mare simplificare a calculelor.

-pentru serii simple: 22i

2

i

2 )ax(kn

k

ax

−−⋅

=∑

σ,

-pentru serii cu frecvenţe: 22

i

i

i

i

2

i

2 )ax(k

c

nc

n

k

ax

−−⋅⋅

=∑

∑σ .

Indicatorii de asimetrie O primă imagine asupra gradului de asimetrie (As) al unei distribuţii o

putem face comparând media ei asimetrică cu modul.

Page 14: 16513850-Formule-Statistica

MoxAs −=

Mox , 0As , asimetrie negativă, cu extinderea frecvenţelor spre

stânga.

Mox , 0As , asimetrie pozitivă, cu extinderea frecvenţelor spre

dreapta.

În mărimi relative se utilizează coeficientul de asimetrie a lui Pearson

(kas).

σMox

k as

−=

Dacă kas =0, Mox = , distribuţie simetrică

Dacă kas >0, Mox , distribuţie asimetrică spre dreapta

Dacă kas <0, Mox , distribuţie asimetrică spre stânga.

Pentru seriile moderat asimetrice, coef. de asimetrie trebuie să ia

valori cuprinse în intervalul (-0,3 ; 0,3). Pentru valori în afara acestui

interval se consideră că distribuţiile respective sunt puternic asimetrice.

coeficientul de asimetrie Yule (Cay).

12

12

qq

qqCay

+−

= , unde: q2 = Q3 – Me

q1 = Me – Q1.

Dacă valorile Cay se apropie de 1,0± , atunci distribuţia este moderat

asimetrică, iar dcaă depăşesc 1,0± , atunci distribuţia este pronunţat

asimetrică.

) Indicatorii de boltire.. de boltire Pearson ( 2β ) şi coef. de boltire Fisher ( 2γ ).

Page 15: 16513850-Formule-Statistica

22

42 µ

µβ = , unde: 2µ este dispersia.

( )∑

∑ ⋅−==

ii

ii

2

i2

2 n

nxxσµ , iar 4µ se determină după relaţia:

( )∑

∑ ⋅−=

ii

ii

4

i

4 n

nxxµ

Pentru o distribuţie normală (curba Gauss-Laplace), coeficientul de

boltire ia valoarea 3. Dacă 32 β , atunci distribuţia este leptocurtică, iar

dacă 32β , atunci distribuţia este platicurtică.

Coef. de boltire Fisher ( 2γ )

3322

422 −=−=

µµβγ , cu interpretarea:

dacă 32 =β , 02 =γ , distribuţie normală;

32 β , 02 γ , distribuţie leptocurtică;

32β , 02γ , distribuţie platicurtică.

6.2. Indicii simpli

• Indicele simplu al cantităţilor sau al volumului fizic care este determinat

după relaţia: 100q

qi

0

1q0/1 ⋅= ,

q1 = volumul fizic în perioada curentă

q0 = volumul fizic în perioada de bază

Page 16: 16513850-Formule-Statistica

• Indicele simplu al preţurilor stabilit astfel:

100p

pi

0

1p0/1 ⋅=

p1 = preţul în perioada curentă

p0 = preţul în perioada de bază

• Indicele simplu valoric stabilit astfel:

100v

vi

0

1v0/1 ⋅= , dar v1=q1p1

v0=q0p0

100pq

pqi

00

11v0/1 ⋅=

Între aceşti indici se verifică relaţia:

0

1

0

1

00

11

p0/1

q0/1

v0/1

p

p

q

q

pq

pq

iii

⋅=

⋅=

6.2. Indicii simpli• Indicele simplu al cantităţilor sau al volumului fizic care este determinat

după relaţia: 100q

qi

0

1q0/1 ⋅= ,

q1 = volumul fizic în perioada curentă

q0 = volumul fizic în perioada de bază

• Indicele simplu al preţurilor stabilit astfel:

100p

pi

0

1p0/1 ⋅=

p1 = preţul în perioada curentă

Page 17: 16513850-Formule-Statistica

p0 = preţul în perioada de bază

• Indicele simplu valoric stabilit astfel:

100v

vi

0

1v0/1 ⋅= , dar v1=q1p1

v0=q0p0

100pq

pqi

00

11v0/1 ⋅=

Între aceşti indici se verifică relaţia:

0

1

0

1

00

11

p0/1

q0/1

v0/1

p

p

q

q

pq

pq

iii

⋅=

⋅=

Indicii de grup

.a Indicele agregat

Indicele agregat simplu al producţiei se determină astfel:

100q

qI

0

1q0/1 ⋅=

∑∑

indicele agregat ponderat, calculat astfel:

100pq

pqI

00

11q0/1 ⋅=

∑∑

sisteme de ponderare

E. Laspeyres

100pq

pqI

00

01q0/1 ⋅=

∑∑

H. Paasche

Page 18: 16513850-Formule-Statistica

100qp

qpI

10

11p0/1 ⋅=

∑∑

100pq

pqI

00

11v0/1 ⋅=

∑∑

variaţiei valorice Între aceşti indici se verifică relaţia:

p0/1

q0/1

v0/1 III ⋅=

În teoria indicilor se mai întâlnesc şi unele sisteme de ponderare care

ţin seama de ponderile din ambele perioade. Întâlnim astfel:

-indicele preţurilor calculat de Edgeworth

100)qq(p

)qq(pI

010

011p0/1 ⋅

++

=∑∑

-indicele ideal al lui Fisher.

∑∑

∑∑ ⋅=

01

11

00

01p0/1 pq

pq

pq

pqI

indicelui de grup al volumului fizicmodificarea absolută va fi

∑ ∑−=∆i i

0001q

0/1 pqpq

Pentru indicele de grup al preţurilor, modificarea absolută va fi:

∑ ∑−=∆i i

1011p

0/1 qpqp

În cazul indicelui de grup valoric, modificarea este:

∑ ∑−=∆i i

0011v

0/1 pqpq

În cazul influenţei factorilor exprimată în mărimi absolute se verifică

relaţia:

Page 19: 16513850-Formule-Statistica

p0/1

q0/1

v0/1 ∆+∆=∆

b. Indicele mediu aritmetic ponderat

100pq

pqiI

i00

i00

q0/1

q0/1 ×

⋅=

∑∑

c. Indicele mediu armonic ponderat

100qp

i

1

qpI

i11q

0/1

i11

p0/1 ×=

6.4Sistemul indicilor calculaţi din mărimi medii

A. indicele de variaţie bifactorială;

B. indicele cu structură fixă;

C. indicele schimbării structurii.

A. indicele de variaţie bifactorială

∑∑

∑∑ ÷==

0

00

1

11

0

1xv.s n

nx

n

nx

x

xI

B. indicele cu structură fixă (Is.f)

∑∑

∑∑ ÷=

1

10

1

11xf.s n

nx

n

nxI

de Laspeyres

∑∑

∑∑ ÷=

0

00

0

01xf.s n

nx

n

nxI

Page 20: 16513850-Formule-Statistica

C. indicele variaţiei structurii (Iv.s.).

Laspeyres,

∑∑

∑∑ ÷=

0

00

1

10x.s.v n

nx

n

nxI

Între aceste trei categorii de indici se stabileşte relaţia:x

.s.vx

f.sx

v.s III ⋅=

6.5 Gruparea indicilor dinamicii după felul bazei

Indici cu bază fixă

0

1q0/1 q

qi = ,

0

2q0/2 q

qi = , .... ,

0

1nq0/1n q

qi −

− = ,0

nq0/n q

qi =

Indici cu bază fixă

0

1q0/1 q

qi = ,

1

2q1/2 q

qi = , .... ,

2n

1nq2n/1n q

qi

−−− = ,

1n

nq1n/n q

qi

−− =

produsul indicilor cu bază mobilă

0

n

1n

n

2n

1n

2

3

1

2

0

1

q

q

q

q

q

q

q

q

q

q

q

q=⋅⋅⋅⋅⋅

−−

împărţind doi indici cu bază fixă

1

2

0

1

0

2

q

q

q

q

q

q=÷

6.6Ritmul variaţiei şi al sporului

A. indicatori absoluţi

B. indicatori relativi

C. indicatori medii.

A. Indicatorii absoluţi

Cuprind sporul absolut, care, după modul de alegere a bazei, este:

Page 21: 16513850-Formule-Statistica

• spor absolut cu bază fixă ( x0/i∆ ) – se obţine ca diferenţă între fiecare

termen al sumei şi termenul ales drept bază de raportare. Considerând

seria: x0, x1, x2, ... , xn, sporul absolut cu bază fixă se va calcula astfel:

01x

0/1 xx −=∆ ; 02x

0/2 xx −=∆ ; .....; 0nx

0/n xx −=∆ sau

generalizând: 0ix

0/i xx −=∆

• spor absolut cu bază mobilă ( x1i/i −∆ ) – este diferenţa dintre fiecare termen

al seriei şi termenul anterior. În aceeaşi serie vom avea:

01x

0/1 xx −=∆ ; 12x

1/2 xx −=∆ ; .....; 1nnx

1n/n xx −− −=∆ sau

generalizând: 1iix

1i/i xx −− −=∆

Între sporurile absolute cu baza fixă şi cele cu baza mobilă se verifică

relaţiile:

-suma sporurilor cu baza mobilă este sporul cu bază fixă al ultimului an:

0n1nn231201 xxxxxxxxxx −=−++−+−+− −

-diferenţa dintre două sporuri absolute cu baza fixă consecutive este egală cu

sporul cu bază mobilă corespunzător:

2302o3 xx)xx()xx( −=−−−

B. Indicatorii relativi

1. Ritmul variaţiei (Rx) – exprimă viteză de variaţie exprimată în mărimi

relative. După modul de calcul, rimul variaţiei este de două feluri:

• Ritmul variaţiei cu bază fixă ( x0/iR ) – arată de câte ori a crescut sau scăzut

nivelul unui fenomen în decursul unei perioade de timp şi se calculează

astfel:

0

ix0/i x

xR = , n,1i =

Page 22: 16513850-Formule-Statistica

• Ritmul variaţiei cu bază mobilă ( x1i/iR − ) – arată de câte ori a crescut sau

scăzut nivelul unui fenomen într-un moment faţă de momentul anterior.

1i

ix1i/i x

xR

−− =

Între ritmul variaţiei cu bază fixă şi cel cu bază mobilă se verifică

relaţiile:

-produsul ritmurilor cu bază mobilă este ritmul cu bază fixă al întregii

perioade:

0

n

1n

n

2

3

1

2

0

1

x

x

x

x

x

x

x

x

x

x=⋅⋅⋅⋅

-raportul a două ritmuri ale variabilei cu bază fixă este egal cu ritmul cu bază

mobilă corespunzător:

1

2

0

1

0

2

x

x

x

x

x

x=÷

2 Ritmul sporului (rx) – exprimă mărimea creşterii sau scăderii în decursul

unei anumite perioade de timp faţă de perioada de bază a unui indicator. Se

calculează:

• Ritmul sporului cu bază fixă ( 0/ixr ) – se calculează ca raport între sporul

cu bază fixă şi nivelul fenomenului considerat din perioada de bază,

astfel:

0

0i

0

x0i

x x

xx

xr

0/i

−=

∆= −

• Ritmul sporului cu bază mobilă ( 1i/ixr − ) – se calculează ca raport între

sporul cu bază mobilă şi nivelul fenomenului considerat din perioada

anterioară, astfel:

1i

1ii

1i

x1i/i

x x

xx

xr

1i/i

− −=

∆=

Page 23: 16513850-Formule-Statistica

Relaţii între aceste ritmuri:

1Rr

1Rr

x1i/ix

x0/ix

1i/i

0/i

−=

−=

−−

C. Indicatorii medii

1. Sporul mediu ( x∆ )

1n

xx 0nx

−−

=∆ , unde:

xn = ultimul termen al seriei,

x0 = primul termen al seriei,

n = nr. termenilor seriei.

2. Ritmul mediu al variaţiei ( xR )

1n

o

nx

x

xR −=

Ritmul mediu al sporului ( xr )

1Rrxx

−= sau în procente: 100Rrxx

−=

A. Regresie şi corelaţie liniară

y = a + bx

-dacă b>0, indică o legătură directă

-dacă b=0, nu există legătură

-dacă b<0, indică o legătură inversă.

metoda celor mai mici pătratesuma pătratelor diferenţelor dintre valorile reale ale lui y şi valorile

teoretice date de ecuaţia de regresie să fie minimă.

=−∑ 2

i )yy( minim, respectiv

Page 24: 16513850-Formule-Statistica

=−−∑ 2)bxay( minim.

=+

=+

∑ ∑ ∑∑ ∑

ii2ii

ii

yxxbxa

yxbna

Prin metoda lui Cramer sau a determinanţilor, parametrii a şi b se

determină astfel (pentru seriile simple):

2i

2i

iiii2i

2ii

i

2iii

ii

)x(xn

yxxyx

x x

x n

x yx

x y

aa

∑∑∑ ∑ ∑ ∑

∑ ∑∑

∑ ∑∑ ∑

−−

==∆∆=

2i

2i

iiii

2ii

i

iii

i

)x(xn

yxyxn

x x

x n

yx x

y n

bb

∑∑∑ ∑ ∑

∑ ∑∑

∑ ∑∑

−−

==∆∆=

serii cu frecvenţe, sistemul de ecuaţii normale devine:

=+

=+

∑ ∑ ∑∑ ∑∑

iiii2iii

iiiii

nyxnxbnxa

nynxbna

Determinarea parametrilor a şi b prin aceeaşi metodă conduce la

rezultatele:

2iii

2ii

iiiiiiii2i

i2iii

iii

i2iiii

iiii

)nx(nxn

nyxnxnynx

nx nx

nx n

nx nyx

nx ny

aa

∑∑∑∑ ∑ ∑ ∑

∑ ∑∑∑

∑ ∑∑ ∑

−−

==∆∆=

Page 25: 16513850-Formule-Statistica

2iii

2ii

iiiiiiii

i2iii

iii

iiiii

iii

)nx(nxn

nynxnyxn

nx nx

nx n

nyx nx

ny n

bb

∑∑∑∑ ∑ ∑ ∑

∑ ∑∑∑

∑ ∑∑ ∑

−−

==∆∆=

Coeficientul de corelaţie

yx

iiy,x n

)yy()xx(r

σσ∑ −⋅−

= , unde:

xi = caracteristica factorială;

yi = caracteristica rezultativă;

y ,x = mediile celor două caracteristici;

yx ,σσ = abaterea medie pătratică a celor două caracteristici.

Dacă în această relaţie înlocuim pe y ,x , yx ,σσ cu expresiile lor dezvoltate şi

efectuăm simplificările posibile, se ajunge la formula:

∑ ∑ ∑∑∑ ∑∑

−⋅−

−=

])y(yn[])x(xn[

yxyxnr

2i

2i

2i

2i

iiiiy,x -pt. serii simple

∑ ∑ ∑∑∑∑∑ ∑∑∑

−⋅−

−=

])ny(nyn[])nx(nxn[

nynxnyxnr

2iii

2ii

2iii

2ii

iiiiiiiiy,x -pt. serii cu

frecvenţă

Raportul de corelaţie (η )

2yi

2y

σσ

η = , unde:

2yσ = dispersia valorilor reale ale variabilei y;

2yiσ = dispersia valorilor teoretice ale variabilei y.

Page 26: 16513850-Formule-Statistica

În cazul unei legături liniare simple, ecuaţia raportului de corelaţie

devine:

∑ ∑∑ ∑ ∑

−+=

n

)y(y

n

)y(yxbya

2i2

i

2i

iii

η

În cazul seriilor cu frecvenţe:

∑ ∑∑

∑ ∑ ∑∑

−+=

i

2ii

i2i

i

2ii

iiiii

n

)ny(ny

n

)ny(nyxbnya

η

Raportul de corelaţie are valori cuprinse între 0 şi 1, cu următoarele

semnificaţii:

-η = 1 arată că între variabile există legătură;

-η = 0 între variabile nu există legătură.

Valoarea la pătrat a raportului de corelaţie prezintă raportul de

determinaţie:

2yi

2y2

σσ

η = şi arată ponderea influenţei factorului x asupra variaţiei

variabilei y.

B. Regresie şi corelaţie curbilinie

a. Regresie şi corelaţie de tip hiperbolic

ix

bay +=

Page 27: 16513850-Formule-Statistica

=+

=+

∑ ∑ ∑

∑ ∑

ii

2i

i

ii

yx

1

x

1bxa

yx

1bna

Prin regula lui Cramer obţinem:

2

i2i

iii

2i

i

)x

1(

x

1n

yx

1

x

1

x

1y

a

∑∑

∑ ∑ ∑ ∑

−=

2

i2i

ii

ii

)x

1(

x

1n

yx

1y

x

1n

b

∑∑

∑ ∑ ∑

−=

Fiind vorba de o legătură curbilinie, intensitatea legăturii se determină

numai cu ajutorul raportului de corelaţie.

2yi

2y

σσ

η =

( )

( )n

yy

n

yy

x

1bya

2

i2i

2

ii

ii

∑∑

∑∑∑

−+=η

b. Regresie şi corelaţie de tip parabolic

parabola de gradul doi, y = a+bx+cx2

Parametrii a, b, c se determină prin metoda celor mai mici pătrate, din

sistemul:

Page 28: 16513850-Formule-Statistica

=++

=++

=++

∑ ∑ ∑∑∑ ∑ ∑∑

∑ ∑∑

i2i

4i

3i

2i

ii3i

2ii

i2ii

yxxcxbxa

yxxcxbxa

yxcxbna

Intensitatea corelaţiei parabolice se măsoară cu ajutorul raportului de

corelaţie:

( )

( )n

yy

n

yyxcyxbya

2

i2i

2

ii

2iiii

∑∑

∑∑∑∑

−++=η

Regresie şi corelaţie multiplă

kkii22110xk,...,2x,1x xaxaxaxaay ++++++= , unde:

a0 = parametrul care exprimă influenţa celorlalţi factori consideraţi cu

acţiune constantă, în afară de factorii cauzali luaţi în calcul;

ai = coeficienţi de regresie multiplă care arată cu cât variază variabila

rezultativă, atunci când variabila factorială xi se modifică cu o unitate.

2y

2y

xk,...,2x,1xxk,...2x,1xy

σσ

η = .

7.1Corelaţia neparametrică

.1 Coeficientul de concordanţă Fechner

Coeficientul de concordanţă simplu

n

dck

−= , unde:

c = număr de concordanţe de semn ale abaterilor;

d = număr de disconcordanţe de semn ale abaterilor.

Page 29: 16513850-Formule-Statistica

1iiiii xxxsau xxx −−=∆−=∆

1iiiii yyysau yyy −−=∆−=∆

n = numărul perechilor de valori corelateDacă unele diferenţe ix∆ sau iy∆ sunt nule, atunci nu se consideră nici

concordanţă, nici discordanţă, ci este exclusă din calcul.

Coeficientul de concordanţă ponderat

DC

DCk

+−= , unde:

C = suma produselor ii yx ∆∆ pozitive,

D = valoarea absolută a sumei produselor ii yx ∆∆ negative.

O altă variantă a coeficientului ponderat de concordanţă Fechner se

apropie de coeficientul de corelaţie Pearson şi se determină astfel:

∑ ∑∑

∆⋅∆

∆⋅∆=

2i

2i

ii

)y()x(

yxk

Coeficientul Fechner poate varia între -1 şi +1, cu semnificaţia unei

legături directe sau inverse mai mult sau mai puţin intense.

.2 Coeficienţii de corelaţie a rangurilor

Coeficientul Spearman

nn

d61

3

2

−−= ∑θ , unde:

d = diferenţele dintre rangurile celor două variabile;

n = nr. perechilor de valori xi, yi.

b. Coeficientul Kendall

)1n(n5,0

S

−=τ , unde:

∑∑ ==−= ii qQ pP QPS

Page 30: 16513850-Formule-Statistica

pi = nr. rangurilor superioare ale variabilei yi ordonate după xi, care există

după fiecare rang;

qi = nr. rangurilor inferioare ale variabilei yi ordonate după xi, care există

după fiecare rang;

n = nr. unităţilor observate.

Acest coef. poate lua valori cuprinse între -1 şi +1, cu aceleaşi

semnificaţii.

Coeficientul de asociere

bcad

bcadQ

+−=

Valoarea coef. de asociere are ca interval de variaţie (-1;+1) şi se

interpretează ca oricare coef. de corelaţie.