CURS STATISTICĂ - Unitatea de învăţare nr. 7
ANALIZA STATISTICĂ A DISTRIBUŢIILOR DE FRECVENŢE.
INDICATORII VARIAŢIEI ŞI ASIMETRIEI
Cuprins:
1.Obiectivele Unităţii de învăţare.
2.Clasificarea indicatorilor variatiei.
2.1. Indicatorii simpli ai variaţiei.
2.2. Indicatorii sintetici ai variaţiei.
3.Indicatorii asimetriei.
4. Răspunsuri şi comentarii la testele de autoevaluare.
5. Teme de control.
6. Rezumatul Unităţii de învăţare.
7. Bibliografia Unităţii de învăţare.
1. Obiectivele unităţii de învăţare
În analiza unei serii statistice ne interesează, pe lângă analiza tendinţei centrale şi
analiza variaţiei sau a variabilităţii, precum şi analiza formei distribuţiei.
Fenomenele şi procesele economico-sociale sunt complexe, aflându-se sub influenţa
unui număr mare de factori esenţiali şi întâmplători, ceea ce face ca media, cel mai utilizat
indicator al tendinţei centrale, să nu fie suficientă pentru analiza acestor fenomene.
☺ Exemplul 1
Fie următoarele seturi de date:
2 4 6 8 10 12 14
11 Mex
5 6 7 8 9 10 11
22 Mex
Se observă că deşi cele două serii au aceeaşi medie şi mediană 2121 MeMexx ,
ele diferă prin modul de împrăştiere a valorilor. De aceea, pe lângă indicatorii tendinţei
centrale se impune şi calculul indicatorilor de variaţie.
In urma parcurgerii acestui capitol, studenţii vor putea :
studia reprezentativitatea mediei pentru o serie de date;
aprecia gradul de omogenitate a seriei;
caracteriza gradului de variaţie a unei serii;
compara în timp şi spaţiu variaţia mai multor serii de repartiţie pentru aceeaşi
caracteristică sau pentru caracteristici diferite care au fost înregistrate pentru aceeaşi
colectivitate;
cunoaşte forma distribuţiei (repartiţiei) de frecvenţe prin comparaţie cu distribuţia
normală
2. Clasificarea indicatorilor variaţiei
Indicatorii variaţiei pentru o serie statistică se clasifică în:
indicatori simpli ai variaţiei – sunt acei indicatori care arată împrăştierea valorilor
una faţă de alta sau împrăştierea valorilor faţă de o anumită valoare;
indicatori sintetici ai variaţiei – care iau în considerare toţi termenii seriei în calculul
lor, sintetizând într-o singură valoare întreaga împrăştiere din serie.
2.1. Indicatorii simpli ai variaţiei
Indicatorii simpli ai variaţiei se exprimă atât în mărimi absolute (având aceleaşi unităţi
de măsură ca şi caracteristica studiată), cât şi în mărimi relative (obţinute prin raportarea
mărimii absolute la medie).
Indicatorii simpli ai variaţiei sunt:
amplitudinea absolută a variaţiei;
amplitudinea relativă a variaţiei;
abaterile individuale absolute;
abaterile individuale relative.
Amplitudinea absolută a variaţiei (Ax) se determină ca diferenţă între valoarea
maximă (xmax) şi valoarea minimă (xmin) a caracteristicii şi arată câmpul maxim de împrăştiere
a valorilor caracteristicii.
Ax = xmax - xmin
Are unitatea de măsură a valorilor caracteristicii şi din acest motiv nu poate fi folosită la
compararea seriilor după caracteristici exprimate în unităţi de măsură diferite.
Se utilizează în etapa de grupare a datelor, mai precis la construirea intervalelor de
variaţie şi se mai utilizează şi la construirea graficelor.
Amplitudinea este foarte sensibilă la valorile extreme. Cu cât acestea sunt mai
îndepărtate cu atât câmpul de împrăştiere a valorilor este mai mare.
Amplitudinea relativă a variaţiei (Ax(%)) se obţine prin raportarea amplitudinii
absolute la medie. Se exprimă în coeficient sau procente, deci pot fi comparate serii după
caracteristici exprimate în unităţi de măsură diferite:
100x
AA x
(%)x
Abaterile individuale absolute care ne arată împrăştierea fiecărei valori de la valoarea
medie:
xxd ii
În practică se utilizează mai mult abaterea absolută maximă şi abaterea absolută
minimă:
0xxd maxmax
0xxd minmin
Abaterile individuale absolute se exprimă prin aceeaşi unitate de măsură ca şi
caracteristica studiată şi pot lua valori negative sau pozitive după cum valoarea individuală
este mai mică sau mai mare ca media.
Dacă di în valoare absolută au valori mari putem concluziona că datele sunt împrăştiate,
adică există o variaţie mare în interiorul seriei.
Suma valorilor abaterilor individuale absolute este nulă:
0xxdn
1ii
n
1ii
Suma abaterilor maxime şi minime luate în modul este egală cu amplitudinea absolută a
variaţiei:
xminmax Add
Dacă în cazul unei serii, abaterea maximă absolută diferă mult de valoarea abaterii
minime absolute luată în modul, atunci pentru seria respectivă trebuie calculaţi pe lângă
indicatorii variaţiei şi indicatorii de asimetrie.
Într-o serie simetrică:
maxmin dd
Abaterile individuale relative se exprimă în coeficienţi sau procente şi se calculează
raportând abaterile individuale absolute la medie:
100x
dd
100x
dd
100x
dd
minmin(%)
maxmax(%)
i(%)i
Toţi aceşti indicatori simpli prezintă dezavantajul că nu sintetizează, într-o singură
valoare, împrăştierea tuturor termenilor din seria analizată.
Pentru a elimina acest dezavantaj calculăm indicatorii sintetici ai variaţiei.
2.2. Indicatorii sintetici ai variaţiei
Indicatorii sintetici ai variaţiei sunt:
abaterea medie liniară d ;
dispersia (varianţa);
abaterea medie pătratică (abatere medie standard sau tip);
coeficientul de variaţie.
Abaterea medie liniară d se calculează ca o medie aritmetică simplă (în cazul seriilor
simple) sau ponderată (în cazul seriilor de distribuţie de frecvenţe) a abaterilor termenilor
seriei de la media lor în valoare absolută.
- pentru o serie simplă:
n
xx
d
n
1ii
- pentru o serie de distribuţie de frecvenţe absolute:
k
1ii
k
1iii
n
nxx
d
În cazul în care seria de distribuţie de frecvenţe este pe intervale, atunci xi este centrul
intervalului.
- pentru o serie de distribuţie de frecvenţe relative:
100
nxx
d
k
1i
*ii
- dacă *in sunt exprimate în procente
k
1i
*ii nxxd - dacă *
in sunt exprimate în coeficienţi
În locul mediei, pot fi folosiţi şi alţi indicatori ai tendinţei centrale.
Dezavantaje ale abaterii medii liniare:
se exprimă în aceeaşi unitate de măsură ca şi caracteristica analizată, deci nu poate fi
utilizată la compararea a două sau mai multe serii după caracteristici exprimate în
unităţi de măsură diferite;
nu ţine seama de semnul algebric;
nu ţine seama de faptul că abaterile mai mari în valoare absolută influenţează în mai
mare măsură gradul de variaţie al unei caracteristici comparativ cu abaterile mici.
Pentru a înlătura aceste dezavantaje se calculează şi alţi indicatori sintetici ai variaţiei.
☺ Exemplul 2
Repartiţia salariaţilor unei întreprinderi după prima obţinută la sfârşitul anului este prezentată
în tabelul următor:
Prima (lei) Nr. salariaţi
ni
Centrul
xi xini xx i ii nxx
sub 100
100 – 200
200 – 300
300 – 400
peste 400
15
20
30
25
10
50
150
250
350
450
750
3.000
7.500
8.750
7.500
+195
+95
5
105
205
2.925
1.900
150
2.625
2.050
Total 100 - 24.500 - 9.650
salariatlei
n
nx
x
i
i
i
ii
/245100
500.245
1
5
1
salariatlei
n
nxx
x
i
i
i
ii
/5,96100
650.95
1
5
1
Prima unui salariat se abate în medie de la prima medie cu 96,5 lei.
Dispersia se calculează ca medie aritmetică simplă (în cazul seriilor simple) sau
ponderată (în cazul seriilor de distribuţie de frecvenţă) a pătratelor abaterilor termenilor seriei
de la tendinţa centrală (cel mai adesea media aritmetică).
- pentru o serie simplă:
n
xxn
1i
2i
2
- pentru o serie de frecvenţe absolute:
k
1ii
k
1ii
2i
2
n
nxx
- pentru o serie de frecvenţe relative:
100
nxxk
1i
*i
2i
2
sau
k
1i
*i
2i
2 nxx
Dacă datele provin din eşantioane de volum redus şi le folosim pentru extinderea rezultatelor
la nivelul colectivităţii generale (le folosim pentru o inferenţă statistică), atunci în calculul
dispersiei la numitor se va folosi (n-1) şi nu “n” fiind astfel dispersia eşantionului un
estimator mai bun al dispersiei în colectivitatea generală:
1n
xx
s
n
1i
2i
2
Dispersia prezintă dezavantajul că este un indicator abstract care nu are o unitate
concretă de măsură. Ea arată modul în care gravitează termenii seriei în jurul tendinţei
centrale (de obicei media). Dacă dispersia unei serii este egală cu 0, atunci acea serie nu
prezintă variaţie, toţi termenii ei fiind egali. Cu cât valoarea dispersiei creşte faţă de zero, cu
atât împrăştierea termenilor seriei creşte şi ea.
Este un indicator deosebit de util în studiile statistice, fiind utilizată în calculul
asimetriei, excesului, boltirii unei serii, precum şi în calculul altor indicatori statistici.
Dispersia caracteristicii alternative:
Varianta xi Frecvenţa
ni Frecvenţe relative
DA
NU
1
0
m
n – m
n
m
w1n
mn
Total - n 1
w1www1w1w
)w1(www1n
mnw
n
mw1
n
)mn(w0mw1
n
nxx
2222
22
2
1ii
2
1ii
2i
2w
Dispersia caracteristicii alternative este egală cu produsul dintre cele două frecvenţe
relative.
☺ Exemplul 3
Prima (lei) Nr. salariaţi (ni)
sub 300
300
65
35
Total 100
Să se calculeze dispersia caracteristicii alternative “salariaţi cu prima sub 300 RON”.
65,0100
65
n
mw
2275,035,065,0)w1(w2w
Dispersia caracteristicii alternative prezintă următoarele particularităţi:
dispersia caracteristicii alternative poate lua valori doar în intervalul:
25,0,02w
când w = 1 – w, adică w = 0,5, dispersia atinge valoarea maximă 25,02w ;
dacă w 1 – w, adică w 0,5 şi w creşte uniform în cadrul intervalului (0, 0,5)
atunci 2w înregistrează o creştere mai rapidă la început şi mai lentă când se apropie
de limita superioară;
dacă w 1 – w, adică w 0,5 şi w creşte uniform în cadrul intervalului (0,5, 1)
atunci 2w înregistrează o scădere în acelaşi ritm în care a avut loc creşterea.
Abaterea medie pătratică (abatere standard, abatere tip sau ecart tip) se calculează
ca o medie pătratică a abaterilor termenilor seriei de la media lor sau ca radical din dispersie.
Abaterea medie pătratică ne arată cu cât în medie se abat termenii unei serii de la
tendinţa centrală (de obicei media):
- pentru o serie simplă:
n
xxn
1i
2i
2
- pentru o serie de frecvenţe absolute:
k
1ii
k
1ii
2i
2
n
nxx
- pentru o serie de frecvenţe relative:
100
nxxk
1i
*i
2i
2
☺ Exemplul 4
Fie 2 serii:
S1: 1 2 3 4 5 6
S2: 101 102 103 104 105 106
Cele două serii au aceeaşi amplitudine, aceeaşi abatere medie liniară şi aceeaşi abatere medie
pătratică. Cu toate acestea, împrăştierea din seria A este mai mare decât cea din seria B.
Este foarte dificil să comparăm serii de date după caracteristici exprimate prin aceeaşi
unitate de măsură deoarece variabilitatea depinde de ordinul de mărime.
Abaterea medie pătratică are aceeaşi semnificaţie ca şi abaterea medie liniară, dar ea
obţinându-se prin ridicarea la pătrat a abaterilor individuale de la tendinţa centrală (medie)
înlătură dezavantajul acordării aceleiaşi importanţe atât abaterilor mari cât şi celor mici.
Abaterea medie pătratică are aceeaşi unitate de măsură cu a caracteristicii studiate, de
aici provenind dezavantajul că nu pot fi comparate colectivităţi după caracteristici exprimate
prin unităţi de măsură diferite.
Deoarece pxx rezultă că d .
În cazul unei serii de distribuţie de frecvenţe simetrică sau uşor asimetrică, adică pentru
o serie cu tendinţă de normalitate între abaterea medie liniară şi abaterea medie pătratică
există relaţia:
8,0d
☺ Exemplu 5
Se utilizează datele din Exemplul 2.
salariat/RON31,120144752
salariat/RON5,96d
8,031,120
5,96dseria este simetrică adică are o repartiţie normală.
Abaterea medie pătratică este un indicator care ne oferă informaţii privind modul de
împrăştiere a termenilor unei serii cu tendinţă de normalitate. Astfel, o regulă empirică spune:
- 68,37% din termenii unei serii se situează în intervalul x,x ;
- 98,45% din termenii unei serii se situează în intervalul 2x,2x ;
- 99,73% din termenii unei serii se situează în intervalul 3x,3x ;
- 99,94% din termeni se găsesc în intervalul 4x,4x
Abaterea medie pătratică este un indicator deosebit de util la estimarea erorilor de
selecţie, la calcule de corelaţie precum şi la orice comparaţie statistică în timp şi spaţiu.
Coeficientul de variaţie este cel mai utilizat şi mai semnificativ indicator pentru
analiza variaţiei. Se calculează ca raport între abaterea medie pătratică sau liniară şi medie.
100x
v
sau 100x
d'v
v v’
Coeficientul de variaţie se exprimă procentual, deci putem aprecia că el reprezintă
exprimarea relativă a lui sau a lui d .
Dacă v = 0 seria este perfect omogenă, toţi termenii seriei sunt egali între ei şi sunt egali
cu media: în acest caz nu există variaţie.
Dacă v 5%, seria este foarte omogenă, variaţia este foarte mică, media este foarte
reprezentativă, iar gruparea a fost foarte bine executată (în cazul seriilor de distribuţie de
frecvenţe).
Dacă v 35%, seria este omogenă.
Dacă v 70-75%, seria este eterogenă, variaţia este foarte mare, media nu este
reprezentativă, iar gruparea trebuie refăcută.
Testul de autoevaluare 1
1.Un auditor bancar a selectat 10 conturi şi a înregistrat sumele existente în fiecare dintre
aceste conturi. Sumele sunt date în Euro:
150 175 195 200 235 240 250 256 275 294
Se cere:
a) să se calculeze suma medie de bani existentă într-un cont
b) să se caracterizeze gradul de omogenitatea al seriei.
Deşi cel mai adesea coeficientul de variaţie se calculează utilizând media (deoarece
respectă cele mai multe din condiţiile impuse de Yule), acest indicator se poate calcula
utilizând şi alţi indicatori ai tendinţei centrale (mediana, mediala, modul).
Acest indicator nu se poate utiliza (adică este lipsit de semnificaţie) în cazul în care
media aritmetică este apropiată de zero sau când valorile termenilor seriei sunt foarte
apropiate.
☺ Exemplul 6
Se utilizează datele din Exemplul 2 şi Exemplul 5.
%35%1,49100245
31,120100
xv
seria nu este omogenă
%3,39100245
5,96100
x
d'v
3. Indicatorii de asimetrie
Asimetria unei serii de distribuţie empirice poate fi determinată atât prin metoda grafică
cât şi prin calculul indicatorilor de asimetrie.
Reprezentarea grafică cea mai utilizată pentru aprecierea asimetriei este poligonul
frecvenţelor, dar graficul ne oferă doar o imagine sugestivă asupra gradului de asimetrie, fără
a putea să-l măsoare printr-o valoare exactă.
x
Pentru distribuţii moderat asimetrice, între x , Me, Mo există următoarea
relaţie: xMe3xMo
Tipuri de repartiţii cu asimetrie pronunţată:
Repartiţii în formă de J se întâlnesc în cazul în care frecvenţele sunt maxime la un capăt
sau altul al intervalului de variaţie.
ni
xi MoMex
ni
xi x Mo Me
ni
xi
Mo Me
Serie perfect simetrică
(Clopotul lui Gauss)
Serie asimetrică cu
asimetrie de stânga sau
pozitivă, predomină
valorile mici
MoMex
Serie asimetrică cu
asimetrie de dreapta sau
negativă, predomină
valorile mari
MoMex
ni
xi 0
ni
xi 0
x
Repartiţie în formă de U se întâlneşte atunci când frecvenţele maxime apar la capetele
intervalului de variaţie, iar frecvenţele minime în centrul intervalului.
Repartiţie complexă obţinută prin suprapunerea a trei repartiţii: una în formă de J şi
două moderat asimetrice. Acest tip de repartiţii apare frecvent când gruparea nu a fost
executată corect.
Indicatorii asimetriei sunt:
- asimetrie absolută:
MoxAs sau Mex3As
Aceşti indicatori au unitatea de măsură a caracteristicii analizate, deci prezintă
dezavantajul că nu pot fi comparate din punct de vedere al asimetriei serii după caracteristici
exprimate prin unităţi de măsură diferite.
Aceşti indicatori pot fi pozitivi (în cazul asimetriei de stânga) sau negativi (în cazul
asimetriei de dreapta).
Datorită faptului că o distribuţie se caracterizează şi prin variabilitate, pentru aceeaşi
asimetrie absolută, o serie care are variabilitatea mai mică va fi mai pronunţat oblică, iar
pentru una cu variabilitatea mai mare, oblicitatea se va atenua.
- asimetrie relativă:
De aceea se calculează coeficientul de asimetrie propus de Pearson (statistician
englez 1857-1936):
ni
xi 0
ni
xi 0
1,1Mox
Cas
Dacă Cas = 0 seria este perfect simetrică:
MoMex
Dacă Cas 0 seria prezintă asimetrie pozitivă sau de stânga:
MoMex (predomină valorile mici)
Dacă Cas 0 seria prezintă asimetrie negativă sau de dreapta:
MoMex (predomină valorile mari)
Cu cât Cas este mai apropiată de 1 seria este mai asimetrică.
Dacă Cas [-0,3; 0,3] seria este uşor sau moderat asimetrică.
Acest coeficient este recomandat numai pentru serii de repartiţie uşor asimetrice.
Dacă se cunoaşte mediana seriei, coeficientul de asimetrie se poate calcula cu relaţia:
3,3
Mex3Cas
Acest indicator este recomandat numai pentru serii de repartiţie uşor asimetrice când
între cei trei indicatori ai tendinţei centrale există relaţia:
xMe3xMo
Cu cât Cas este mai apropiat de 0 cu atât seria este mai simetrică, iar cu cât se apropie
de extremităţile intervalului, asimetria devine mai pronunţată.
Aceşti doi indicatori ai asimetriei sunt cei mai utilizaţi în practică, dar în afară de aceştia
se mai utilizează şi alţi indicatori.
☺ Exemplul 7
Se utilizează datele din Exemplul 2.
0RON55,2166,266245MoxAs asimetrie negativă sau de dreapta
66,266510
10100200hxMo
21
10
300,200Mo
018,031,120
66,21MoxCas
3,0,3,0Cas seria este uşor asimetrică, cu asimetrie negativă sau de dreapta, deci
predomină salariaţii cu prime mari. MoMex
☺ Exersaţi în … Excel
Un profesor doreşte să vadă care au fost rezultatele medii obţinute de studenţii săi la examen. De
asemenea, ar vrea să observe care a fost variaţia notelor. Calculaţi mărimile necesare. Notele obţinute
de studenţi la examen au fost următoarele:
8,1 9,2 3,0 7,9 9,0 6,9 9,6 3,9 9,4 8,8 6,5 7,3 8,4 8,3 9,5 3,8 9,7
9,4 9,3 7,3 7,8 8,6 5,7 9,8 9,3 8,3 9,9 4,2 9,9 5,1 8,4 9,0 8,8 5,9
9,5 7,0 8,1 9,1 7,5 8,2 8,3 6,5 3,4 8,9 4,3 8,5 7,5 6,4 6,4 9,3 8,6
8,4 4,8 8,1 9,6 9,1 9,6 8,3 4,1 10,0 2,5 4,8 7,1 8,9 6,1 7,7 7,6 1,8
5,3 6,9 6,6 9,4 8,0 5,5 8,4 6,6 3,4 9,8 7,2 1,1 3,8 8,5 7,7 9,6 5,0
7,2 8,3 8,7 7,4 9,4 9,0 8,4 9,5 9,0 7,3 9,9 8,5 7,1 3,7 1,6
Rezolvare folosind EXCEL:
1. Se introduc datele. În A1 tastaţi „Nota“.
2. Apăsaţi Tools/Data Analysis şi Descriptive Statistics.
3. Introduceţi Input Range (A1:A101) conţinând şi numele variabilei. Selectaţi Labels in First
Row. 4. Apăsaţi Summary Statistics şi OK.
Se obţin rezultatele: Note
Mean
7.398
Standard Error 0.215022
Median 8.1
Mode 8.4
Standard Deviation 2.150216
Sample Variance 4.62343
Kurtosis 0.393661
Skewness -1.0731
Range 8.9
Minimum 1.1
Maximum 10
Sum 739.8
Count 100
Media notelor obţinute la examen este 7,398 (Mean) cu mediana 8,1 (Median). Modulul este
8,4 (Mode). Acesta este posibil să nu fie singurul, deoarece EXCEL nu afişează decât o singură
valoare.
Cea mai mică notă obţinută a fost 1,1 (Minimum) iar cea mai mare Maximum = 10.
Amplitudinea (diferenţa între valoarea minimă şi cea maximă) este 8,9 (Range).
Variaţia măsurată prin dispersie este 4,62 (Sample Variance) iar abaterea medie pătratică este
2,15 (Standard deviation). Eroarea standard (acest indicator va fi explicat la capitolul de sondaj
statistic) este 0,215 (Standard Error).
Deoarece Skewness este negativ şi mult diferit de zero (-1,07) seria de date este puternic
asimetrică negativ, curba fiind alungită spre stânga.
Kurtosis este 0,39, pozitiv, ceea ce înseamnă că avem o curbă ascuţită (distribuţie
leptocurtică).
Testul de autoevaluare 2
Pentru 200 de agenţi economici se cunosc datele:
Grupe de agenţi economici după mărimea
profilului (mil. lei)
Structura agenţilor economici
(%)
sub 6
6-12
12-18
18-24
24-30
30 şi peste
10
22
25
23
17
3
Total 100
Se cere:
a) să se aprecieze dacă media e reprezentativă;
b) caracterizaţi asimetria distribuţiei;
c) să se calculeze media şi dispersia caracteristicii „profitul ≥18 mil lei”.
Testul de autoevaluare 3
1.Distribuţia salariaţilor unui magazin în funcţie de numărul de zile de concediu de odihnă
dintr-un an se prezintă astfel:
Zile concediu 14 15 16 17 18 19 20
Nr. salariaţi 2 6 10 15 8 5 4
Se cere:
a) să se calculeze indicatorii sintetici ai variaţiei;
b) să se caracterizeze gradul de asimetrie;
c) să se calculeze media şi dispersia caracteristicii “salariaţi care au avut un număr de zile de
concediu mai mare sau egal cu 17”.
2.Un studiu efectuat asupra unui număr de 50 de cutii de brânză topită la cutie dintr-un
magazin a reliefat următoarele informaţii cu privire la numărul de calorii conţinute:
Calorii 75-85 85-95 95-105 105-115 115-125
Nr. cutii cu
brânză topită 5 10 15 14 6
Se cere:
a) să se aprecieze omogenitatea seriei;
b) să se caracterizeze gradul de asimetrie;
c) să se calculeze media şi dispersia caracteristicii “cutii de brânză care au sub 95 de
calorii”
4. Răspunsuri şi comentarii la testele de autoevaluare
Testul de autoevaluare 1
Notăm cu xi = suma existentă în contul i
10,1i
a) Media se calculează ca o medie aritmetică simplă întrucât avem date negrupate:
Euro22710
2270
10
294275256250240235200195175150
10
x
x
10
1ii
b) Gradul de omogenitate al seriei se apreciază prin coeficienţii de variaţie (v, v’).
%12,20100227
68,45100
xv
%56,16100227
6,37100
x
d'v
68,45889,20862
889,2086
10
10
1
2
2
i
i xx
Deoarece v, v’ 35%, apreciem că seria este omogenă, variaţia este mică, media este
reprezentativă.
Testul de autoevaluare 2
1. a) Pentru a aprecia dacă media este reprezentativă, vom utiliza coeficientul de variaţie.
Pentru a calcula coeficientul de variaţie trebuie mai întâi să calculăm media şi abaterea medie
pătratică.
6
1
6
1
i
i
i
ii
n
nx
x
Putem lucra cu relaţia de mai sus dacă calculăm din *
in (din ipoteza, din tabel) şi
200 in (din enunţ) pe in .
100*
i
ii
n
nn , rezultă:
20200100
101 n agenţi economici;
44200100
222 n
50200100
253 n
46200100
234 n
34200100
175 n
6200100
36 n
ix reprezintă centrele de interval
sau putem calcula media utilizând relaţia:
44,16100
333172723212515229103
100
6
1
*
i
iinx
x mil. lei
Profitul mediu al unui agent economic este egal cu 16,44 mil lei.
Centrele de interval ix se determină ca o medie aritmetică simplă a capetelor fiecărui
interval. Rezultatele sunt prezentate în tabelul următor
Mărimea profitului (mil lei) Frecvenţe relative ni*(%) Centre de interval ix
0-6 10 3
6-12 22 9
12-18 25 15
18-24 23 21
24- 17 27
30-36 3 33
Total 100 -
Indicatorul cu ajutorul căruia se apreciază dacă media e reprezentativă este coeficientul de
variaţie.
%17,4810044,16
92,7100
xv
leimil.92,74726,622
7264.62
100
3)44,1633(17)44,1627(23)44,1621(25)44,1615(
100
22)44,169(10)44,163(
1002222
22
6
1
*2
2
i
ii nxx
Interpretarea coeficientului de variaţie 35%<v≤75% media e slab reprezentativă.
b) Asimetria se caracterizează cu ajutorul indicatorilor de asimetrie propuşi de Pearson.
- asimetria absolută: as x Mo =16,44-15,6=0,84 mil. lei
- coeficientul de asimetrie:
106,092,7
84,0
asCas
Cas >0 deci avem serie uşor asimetrică cu asimetrie pozitivă sau de stânga, deci predomină
agenţii economici cu valori mici ale profitului.
c) media şi dispersia caracteristicii „profitul≥18 mil lei”
Avem o caracteristică alternativă sau binară:
- profitul ≥18 mil lei
- profitul <18 mil lei
Varianta xi Frecvenţele relative (*
in)
DA (profitul ≥18 mil lei)
NU (profitul <18 mil lei)
1
0
m = 43
n – m = 57
Total - n = 100
Media caracteristicii alternative:
43,0100
43
n
mw
43% dintre agenţii economici au profitul ≥18 mil.lei.
Dispersia caracteristicii alternative:
2451,0)43,01(43,0)1(2 www
Testul de autoevaluare 3
1. a) Pentru a calcula indicatorii sintetici ai variaţiei, va trebui să calculăm mai întâi
media – care se calculează ca o medie aritmetică ponderată:
concediu zile 04,1750
852
50
42051981815171016615214
n
nx
x7
1ii
7
1iii
Indicatorii sintetici ai variaţiei sunt:
- abaterea medie liniară:
zile1728,150
64,58
50
404,1720504,1719804,17181504,1717
50
1004,1716604,1715204,1714
n
nxx
d7
1ii
7
1iii
Numărul de zile de concediu al unui salariat se abate în medie de la numărul mediu de
zile de concediu cu 1,1728 zile.
- dispersia:
3184,2
50
92,115
50
404,1720504,1719
50
804,17181504,17171004,1716
50
604,1715204,1714
n
nxx
22
222
22
7
1ii
7
1ii
2i
2
- abaterea medie pătratică:
zile5226,13184,22
Numărul de zile de concediu al unui salariat se abate în medie de la numărul mediu de
zile de concediu cu 1,5226 zile.
- coeficientul de variaţie:
%93,810004,17
5226,1100
xv
%88,610004,17
1728,1100
x
d'v
Deoarece v, v’ 35% seria este omogenă, variaţia este mică, media este
reprezentativă.
b) Aprecierea asimetriei:
026,05226,1
1704,17MoxCas
Deoarece Cas 0 avem asimetrie pozitivă sau de stânga, adică mediana şi modul se
găsesc în stânga mediei pe grafic, deci în această serie predomină valorile mici ale
caracteristicii.
Cas [-0,3; 0,3] seria este uşor asimetrică (Cas este foarte apropiat de zero).
c) Avem o caracteristică alternativă:
- salariaţi care au avut un concediu 17 zile;
- salariaţi care au avut un concediu 17 zile.
Varianta xi Frecvenţele absolute
ni
DA (peste 17 zile)
NU (sub 17 zile)
1
0
m = 32
n – m = 18
Total - n = 50
Media caracteristicii alternative:
64,050
32
n
mw
64% dintre salariaţi au avut un concediu 17 zile
Dispersia caracteristicii alternative:
2304,0)64,01(64,0)w1(w2w
2. Se observă că avem o serie de repartiţie de frecvenţă pe intervale egale.
Notăm cu: xi = numărul de calorii
ni = numărul de cutii de brânză topită
Media – se calculează ca o medie aritmetică ponderată
xi reprezintă centrul de interval calculat ca medie aritmetică simplă între limita
inferioară şi limita superioară a fiecărui interval:
calorii 2,10150
5060
50
612014110151001090580
n
nx
x5
1ii
5
1iii
Omogenitatea seriei se apreciază cu ajutorul coeficientului de variaţie:
%46,111002,101
6,11100
xv
calorii6,1156,1342
56,134
50
6728
n
nxx
5
1ii
5
1ii
2i
2
Deoarece v 35% seria este omogenă, variaţia este mică, media este reprezentativă.
b) Gradul de asimetrie:
18,06,11
33,1032,101MoxCas
Deoarece Cas 0 seria prezintă o asimetrie negativă sau de dreapta, deci pe grafic
mediana şi modul se găsesc în dreapta mediei, ceea ce înseamnă că predomină cutiile de
brânză cu multe calorii.
Cas [-0,3; 0,3] seria este uşor asimetrică.
c) Avem o caracteristică alternativă:
- cutii care au sub 95 calorii;
- cutii care au peste 95 calorii.
Varianta xi Frecvenţele absolute
ni
DA (sub 95 calorii)
NU (peste 95 calorii)
1
0
m = 15
n – m = 35
Total - n = 50
Media caracteristicii alternative:
3,050
15
n
mw
30% dintre cutii au sub 95 calorii.
Dispersia caracteristicii alternative:
21,0)3,01(3,0)w1(w2w
5. Teme de control
1. Presupunând că la fiecare termen al unei serii se adaugă aceeaşi constantă “a”:
a) cum se va modifica amplitudinea absolută?
b) cum se va modifica media?
c) cum se va modifica dispersia, dar abaterea medie pătratică?
d) cum se va modifica abaterea medie liniară?
2. Presupunem că fiecare termen al unei serii se multiplică cu aceeaşi constantă “k”:
a) cum se va modifica amplitudinea absolută?
b) cum se va modifica media?
c) cum se va modifica dispersia şi abaterea medie pătratică?
d) cum se va modifica abaterea medie liniară?
3. Preţurile de vânzare pentru un calculator ştiinţific cu aceleaşi caracteristici, fabricat de
aceeaşi firmă, au fost înregistrate în 20 de magazine. Rezultatele sunt redate mai jos şi sunt
exprimate în lei:
10,50 12,75 11,00 16,50 19,30 20,00 16,50 13,90 17,50 18,00
13,50 17,75 18,50 20,00 15,00 14,45 17,85 15,00 17,50 13,50
Se cere:
a) să se caracterizeze gradul de asimetrie al seriei;
b) să se caracterizeze gradul de variaţie al seriei;
4.Despre angajaţii unei sucursale a unei bănci comerciale se cunosc datele:
Grupe de salariaţi după vechime (ani) Nr. salariaţi
0 – 4
4 – 8
8 – 12
12 – 16
16 - 20
2
6
10
8
4
Total 30
Se cere:
a) să se verifice dacă distribuţia salariaţilor după vechime este omogenă;
b) să se caracterizeze gradul de asimetrie;
c) să se calculeze media şi dispersia caracteristicii “salariaţi cu vechimea sub vechimea
medie”.
5.Un studiu privind durata de viaţă în ore a unui produs electrocasnic efectuat pe 100 aparate
a condus la următoarele rezultate:
Durata de viaţă (ore) Structura numărului de aparate electrocasnice
0 – 1000
1000 – 2000
2000 – 3000
3000 – 4000
4000 – 5000
5000 - 6000
8
20
26
22
18
6
Total 100
Se cere:
a) să se aprecieze dacă media este reprezentativă;
b) să se caracterizeze gradul de asimetrie;
c) să se determine media şi dispersia caracteristicii “aparate care au durata de viaţă mai
mică de 3000 ore”.
6. În tabelul următor este prezentată repartiţia gospodăriilor dintr-o localitate în funcţie de
numărul de copii:
Nr. copii 0 1 2 3 4 5 6 7 8
Nr. gospodării 286 380 416 258 112 62 47 12 7
Se cere:să se calculeze numărul mediu de copii pe gospodărie şi să se verifice dacă
media este reprezentativă;
6. Rezumatul Unităţii de învăţare
Fenomenele şi procesele economico-sociale sunt complexe, aflându-se sub influenţa unui număr mare
de factori esenţiali şi întâmplători, ceea ce face ca media, cel mai utilizat indicator al tendinţei
centrale, să nu fie suficientă pentru analiza acestor fenomene. De aceea, pe lângă indicatorii tendinţei
centrale se impune şi calculul indicatorilor de variaţie.
Indicatorii variaţiei pentru o serie statistică se clasifică în:
indicatori simpli ai variaţiei – sunt acei indicatori care arată împrăştierea valorilor una
faţă de alta sau împrăştierea valorilor faţă de o anumită valoare;
indicatori sintetici ai variaţiei – care iau în considerare toţi termenii seriei în calculul lor,
sintetizând într-o singură valoare întreaga împrăştiere din serie.
Cu ajutorul indicatorilor variaţiei putem:
studia reprezentativitatea mediei pentru o serie de date;
aprecia gradul de omogenitate a seriei;
caracteriza gradului de variaţie a unei serii;
compara în timp şi spaţiu a mai multor serii de repartiţie pentru aceeaşi caracteristică sau
pentru caracteristici diferite care au fost înregistrate pentru aceeaşi colectivitate;
cunoaşte gradul de influenţă a factorilor după care s-a efectuat gruparea;
cunoaşte forma distribuţiei (repartiţiei) de frecvenţe prin comparaţie cu distribuţia normală
7. Bibliografia Unităţii de învăţare
1.Chauvat G., Reau J.P., Statistiques descriptives, Armand Colin, Paris, 2004
2. Danciu A.,Niculescu I., Gruiescu M., Statistică economică, Editura Enciclopedică,
Bucureşti, 2009
3. Isaic-Maniu Al., Mitrut C., Voineagu V., Statistică, Editura Universitară, Bucureşti, 2003;
4. Voineagu V., Ţiţan E., Ghiţă S., Boboc C., Todose D. – Statistică. Baze teoretice şi
aplicaţii, Editura Economică, Bucureşti, 2007;
5.Wonnacott T.H., Wonnacott R.J., Statistique, Economica, Paris,1995