indicatori ai formei distribuţieiileana.brudiu.ro/mvr/an i mvr/curs (2020-2021)/12...funcția din...
TRANSCRIPT
![Page 1: Indicatori ai formei distribuţieiileana.brudiu.ro/MVR/An I MVR/CURS (2020-2021)/12...Funcția din Excel ce calculează asimetria este SKEW() Puteți utiliza următoarele două reguli](https://reader036.vdocuments.net/reader036/viewer/2022081502/613dfb2759df642846163caf/html5/thumbnails/1.jpg)
Indicatori ai formei distribuţiei
1. Asimetria
2. Boltirea
Atunci când valorile unei serii sunt distribuite nesimetric în jurul
mediei, acest fapt este imposibil de surprins cu ajutorul
indicatorilor de dispersie.
S-au introdus indicatori care să pună în evidenţă şi acest
aspect al seriilor de valori: excentricitatea, sau asimetria și
boltirea.
![Page 2: Indicatori ai formei distribuţieiileana.brudiu.ro/MVR/An I MVR/CURS (2020-2021)/12...Funcția din Excel ce calculează asimetria este SKEW() Puteți utiliza următoarele două reguli](https://reader036.vdocuments.net/reader036/viewer/2022081502/613dfb2759df642846163caf/html5/thumbnails/2.jpg)
Excentricitate. Asimetria
(Engl. Skew, Skweness).
![Page 3: Indicatori ai formei distribuţieiileana.brudiu.ro/MVR/An I MVR/CURS (2020-2021)/12...Funcția din Excel ce calculează asimetria este SKEW() Puteți utiliza următoarele două reguli](https://reader036.vdocuments.net/reader036/viewer/2022081502/613dfb2759df642846163caf/html5/thumbnails/3.jpg)
Asimetria (excetricitatea)ASIMETRIA reprezintă deplasarea pe orizontală a vîrfului curbei
experimentale faţă de curba normală.
Skewness - indicator folosit în analiza distribuției unei serii
de date pentru a indica deviația distribuției empirice în
raport cu o distribuție simetrică in jurul mediei.
![Page 4: Indicatori ai formei distribuţieiileana.brudiu.ro/MVR/An I MVR/CURS (2020-2021)/12...Funcția din Excel ce calculează asimetria este SKEW() Puteți utiliza următoarele două reguli](https://reader036.vdocuments.net/reader036/viewer/2022081502/613dfb2759df642846163caf/html5/thumbnails/4.jpg)
Interpretare:
Skewness > 0 - distributia este inclinata spre stanga, avand
mai multe valori extreme spre dreapta.
Skewness < 0 - distributia este inclinata spre dreapta, avand
mai multe valori extreme spre stanga.
Skewness = 0 - media = mediana, distributia este simetrica
in jurul mediei.
Asimetria se calculează cu formula:
𝑆 =
1𝑛 − 1
σ𝑖=1𝑛 𝑥𝑖 − ҧ𝑥 3
𝜎3
Funcția din Excel ce calculează asimetria este SKEW()
![Page 5: Indicatori ai formei distribuţieiileana.brudiu.ro/MVR/An I MVR/CURS (2020-2021)/12...Funcția din Excel ce calculează asimetria este SKEW() Puteți utiliza următoarele două reguli](https://reader036.vdocuments.net/reader036/viewer/2022081502/613dfb2759df642846163caf/html5/thumbnails/5.jpg)
Puteți utiliza următoarele două reguli pentru a oferi
unele informații despre asimetrie, chiar și atunci când
nu se poate vedea un grafic linie de date (de
exemplu, tot ce ai nevoie este media și mediana):
Regula 1. Dacă media este mai
mică decât valoarea mediană,
datele sunt înclinate spre stânga.
Regula 2. Dacă media este mai
mare decât valoarea mediană,
datele sunt înclinate spre dreapta.
![Page 6: Indicatori ai formei distribuţieiileana.brudiu.ro/MVR/An I MVR/CURS (2020-2021)/12...Funcția din Excel ce calculează asimetria este SKEW() Puteți utiliza următoarele două reguli](https://reader036.vdocuments.net/reader036/viewer/2022081502/613dfb2759df642846163caf/html5/thumbnails/6.jpg)
ASIMETRIA
distribuții bimodale
distribuții unimodale
![Page 7: Indicatori ai formei distribuţieiileana.brudiu.ro/MVR/An I MVR/CURS (2020-2021)/12...Funcția din Excel ce calculează asimetria este SKEW() Puteți utiliza următoarele două reguli](https://reader036.vdocuments.net/reader036/viewer/2022081502/613dfb2759df642846163caf/html5/thumbnails/7.jpg)
xi ni
2,5 1
2,55 1
2,6 1
2,65 1
2,7 4
2,75 6
2,8 10
2,85 12
2,9 20
2,95 35
3 80
3,05 90
3,1 115
3,15 172
3,2 235
3,25 337
3,3 373
3,35 451
3,4 497
3,45 534
3,5 547
3,55 563
3,6 571
3,65 462
3,7 425
3,75 317
3,8 260
3,85 258
3,9 198
3,95 104
4 85
4,05 25
4,1 20
4,15 18
4,2 16
4,25 10
4,3 3
4,35 2
4,4 2
4,45 2
total 6850
media 3,51
mo 3,60
mediana 3,50
![Page 8: Indicatori ai formei distribuţieiileana.brudiu.ro/MVR/An I MVR/CURS (2020-2021)/12...Funcția din Excel ce calculează asimetria este SKEW() Puteți utiliza următoarele două reguli](https://reader036.vdocuments.net/reader036/viewer/2022081502/613dfb2759df642846163caf/html5/thumbnails/8.jpg)
Conceptul de „curbă normală” :
Are formă de „clopot”. Cea mai mare parte a valorilor se concentrează în zona centrală (medie)
Este perfect simetrică pe ambele laturi ale sale
Linia curbei se apropie la infinit de axa X, fără a o atinge vreodată
În conformitate cu proprietatea 2, de fiecare parte a mediei se află exact jumătate dintre valorile distribuţiei
MEDIA, MEDIANA, MODUL au valori apropiateRangul (amplitudinea) = xmax.- xmin.≈ 6 DS.
„distribuţie normală”, care corespunde reprezentării
grafice a unei caracteristici pentru care există un mare
număr de măsurări, tinzând spre infinit.
![Page 9: Indicatori ai formei distribuţieiileana.brudiu.ro/MVR/An I MVR/CURS (2020-2021)/12...Funcția din Excel ce calculează asimetria este SKEW() Puteți utiliza următoarele două reguli](https://reader036.vdocuments.net/reader036/viewer/2022081502/613dfb2759df642846163caf/html5/thumbnails/9.jpg)
Curba normală Laplace – Gauss
Curba ideală de variaţie este simetrică faţă de ordonata
maximă, notată cu „M”, corespunzând mediei aritmetice
![Page 10: Indicatori ai formei distribuţieiileana.brudiu.ro/MVR/An I MVR/CURS (2020-2021)/12...Funcția din Excel ce calculează asimetria este SKEW() Puteți utiliza următoarele două reguli](https://reader036.vdocuments.net/reader036/viewer/2022081502/613dfb2759df642846163caf/html5/thumbnails/10.jpg)
Între [m-s, m+s] se află aproximativ
68% din indivizii unei populaţii
repartizate normal
Între [m-2s, m+2s] se află
aproximativ 95% din indivizii unei
populaţii repartizate normal
Între [m-3s, m+3s] se află peste 99%
din indivizii unei populaţii
repartizate normal
![Page 11: Indicatori ai formei distribuţieiileana.brudiu.ro/MVR/An I MVR/CURS (2020-2021)/12...Funcția din Excel ce calculează asimetria este SKEW() Puteți utiliza următoarele două reguli](https://reader036.vdocuments.net/reader036/viewer/2022081502/613dfb2759df642846163caf/html5/thumbnails/11.jpg)
Curba lui Gauss (curba normală)
• Simetrică faţă de medie
• Are un maxim în dreptul mediei
• Tinde asimptotic la 0 spre plus infinit şi spre minus infinit
• În intervalul [m − s,m + s] se află aproximativ 68% din indivizii populaţiei
• În intervalul [m − 2s,m + 2s] se află aproximativ 95% din indivizii populaţiei
• În intervalul [m − 3s,m + 3s] se află aproximativ 99% din indivizii populaţiei
![Page 12: Indicatori ai formei distribuţieiileana.brudiu.ro/MVR/An I MVR/CURS (2020-2021)/12...Funcția din Excel ce calculează asimetria este SKEW() Puteți utiliza următoarele două reguli](https://reader036.vdocuments.net/reader036/viewer/2022081502/613dfb2759df642846163caf/html5/thumbnails/12.jpg)
Boltirea (excesul)EXCESUL sau boltirea (E) este acea proprietate a curbei modale
de a fi mai mai turtită sau mai ascuţită decît curba normală
corespunzătoare.
Boltirea se caculează
cu formula:
Funcția din Excel ce calculează boltirea este KURT():
𝐾 =1
𝑛−1σ𝑖=1𝑛 𝑥𝑖− ҧ𝑥 4
𝜎4-3
![Page 13: Indicatori ai formei distribuţieiileana.brudiu.ro/MVR/An I MVR/CURS (2020-2021)/12...Funcția din Excel ce calculează asimetria este SKEW() Puteți utiliza următoarele două reguli](https://reader036.vdocuments.net/reader036/viewer/2022081502/613dfb2759df642846163caf/html5/thumbnails/13.jpg)
Kurtosis - indicator folosit in analiza distributiei unei serii
de date pentru a indica gradul de aplatizare sau de
ascutire a unei distributii.
Interpretare:
Kurtosis > 3 - distributie
leptokurtica, mai ascutita decat o
distibutie normala; avand mai
multe valori concentrate in jurul
mediei si cozi mai groase ceeea
ce inseamna probabilitati ridicate
pentru valorile extreme.
Kurtosis < 3 - distributie platikurtica, mai plata decat o distibutie normal
avand valori dispersate pe un interval mai mare in jurul mediei.
Probabilitatea pentru valori extreme este mai mica decat in cazul unei
distributii normale.
Kurtosis = 3 - distributie mezokurtica - exemplu distributia normala.
![Page 14: Indicatori ai formei distribuţieiileana.brudiu.ro/MVR/An I MVR/CURS (2020-2021)/12...Funcția din Excel ce calculează asimetria este SKEW() Puteți utiliza următoarele două reguli](https://reader036.vdocuments.net/reader036/viewer/2022081502/613dfb2759df642846163caf/html5/thumbnails/14.jpg)
Indicatori statistici
fundamentali
SERIILE DE VALORI
DISTRIBUITE RELATIV
SIMETRIC:
SERIILE DISTRIBUITE
ASIMETRIC:
▪ Media
▪ Deviaţia standard.
Media
Deviaţia standard,
dar sunt mai utile
mediana
cuartilele.
![Page 15: Indicatori ai formei distribuţieiileana.brudiu.ro/MVR/An I MVR/CURS (2020-2021)/12...Funcția din Excel ce calculează asimetria este SKEW() Puteți utiliza următoarele două reguli](https://reader036.vdocuments.net/reader036/viewer/2022081502/613dfb2759df642846163caf/html5/thumbnails/15.jpg)
Statistica descriptiva, abordarea practicăTabelul de efective (tabel de evidenta primară).
HGB g/dL
14,5 14,5 15,4 15,2 14,6 14,6 13,5 14,6 13,8 15,2 13,8 13,6
14,7 15,2 12 13,8 12 14,7 14,7 13,8 14,7 15,3 13,8 15,3
12 13,3 15,7 14,7 14,5 13,3 13,7 14,5 16,4 14,6 13,6 14,6
14,1 15,4 14,8 14,8 14,1 14,5 14,6 13,5 13,8 13,8 15,2 15,2
15 14,8 13,5 13,7 13,5 14,7 15 14,6 13,5 14,7 15,3 14,6
![Page 16: Indicatori ai formei distribuţieiileana.brudiu.ro/MVR/An I MVR/CURS (2020-2021)/12...Funcția din Excel ce calculează asimetria este SKEW() Puteți utiliza următoarele două reguli](https://reader036.vdocuments.net/reader036/viewer/2022081502/613dfb2759df642846163caf/html5/thumbnails/16.jpg)
Statistica descriptiva, abordarea practicăSe ordonează (crescător) - funcţia SORT din meniul Data în scopul urmăririi frecvenţei de apariţia a fiecărei valori observate
HGB g/dL
12 13,7 14,5 14,7 15,2
12 13,7 14,5 14,7 15,2
12 13,8 14,5 14,7 15,2
13,3 13,8 14,5 14,7 15,2
13,3 13,8 14,6 14,7 15,2
13,5 13,8 14,6 14,7 15,3
13,5 13,8 14,6 14,7 15,3
13,5 13,8 14,6 14,8 15,3
13,5 13,8 14,6 14,8 15,4
13,5 14,1 14,6 14,8 15,4
13,6 14,1 14,6 15 15,7
13,6 14,5 14,6 15 16,4
![Page 17: Indicatori ai formei distribuţieiileana.brudiu.ro/MVR/An I MVR/CURS (2020-2021)/12...Funcția din Excel ce calculează asimetria este SKEW() Puteți utiliza următoarele două reguli](https://reader036.vdocuments.net/reader036/viewer/2022081502/613dfb2759df642846163caf/html5/thumbnails/17.jpg)
Statistica descriptiva, abordarea practicăSe obţine repartiţia de frecvenţă
HGB g/dL FrecventaFrecvenţa
cumulată
Frecvenţa
relativă
12 3 3 0,05
13,3 2 5 0,03
13,5 5 10 0,08
13,6 2 12 0,03
13,7 2 14 0,03
13,8 7 21 0,12
14,1 2 23 0,03
14,5 5 28 0,08
14,6 8 36 0,13
14,7 7 43 0,12
14,8 3 46 0,05
15 2 48 0,03
15,2 5 53 0,08
15,3 3 56 0,05
15,4 2 58 0,03
15,7 1 59 0,02
16,4 1 60 0,02
![Page 18: Indicatori ai formei distribuţieiileana.brudiu.ro/MVR/An I MVR/CURS (2020-2021)/12...Funcția din Excel ce calculează asimetria este SKEW() Puteți utiliza următoarele două reguli](https://reader036.vdocuments.net/reader036/viewer/2022081502/613dfb2759df642846163caf/html5/thumbnails/18.jpg)
Întocmirea histogramei
0
1
2
3
4
5
6
7
8
9
12 13,3 13,5 13,6 13,7 13,8 14,1 14,5 14,6 14,7 14,8 15 15,2 15,3 15,4 15,7 16,4
HGB g/dL histograma date observate
0
5
10
15
20
25
30
<13 13-14 14-15 15-16 >16
HGB g/dl histograma date grupate
![Page 19: Indicatori ai formei distribuţieiileana.brudiu.ro/MVR/An I MVR/CURS (2020-2021)/12...Funcția din Excel ce calculează asimetria este SKEW() Puteți utiliza următoarele două reguli](https://reader036.vdocuments.net/reader036/viewer/2022081502/613dfb2759df642846163caf/html5/thumbnails/19.jpg)
0
10
20
30
40
50
60
70
0
1
2
3
4
5
6
7
8
9
12 13,3 13,5 13,6 13,7 13,8 14,1 14,5 14,6 14,7 14,8 15 15,2 15,3 15,4 15,7 16,4
HGB g/dL histogramadate observate
Frecventa absoluta Frecvenţa cumulată
0
10
20
30
40
50
60
70
0
5
10
15
20
25
30
<13 13-14 14-15 15-16 >16
HGB g/dl histograma date grupate
Frecventa absoluta Frecventa absoluta Frecvená cumulata
![Page 20: Indicatori ai formei distribuţieiileana.brudiu.ro/MVR/An I MVR/CURS (2020-2021)/12...Funcția din Excel ce calculează asimetria este SKEW() Puteți utiliza următoarele două reguli](https://reader036.vdocuments.net/reader036/viewer/2022081502/613dfb2759df642846163caf/html5/thumbnails/20.jpg)
Calcularea parametrilor tendinţei de grupare (media, mediana şi modulul) şi parametri tendinţei de împrăştiere (varianţa, deviaţia standard şi coeficientul de variaţie)
media =AVERAGE(C2:C61) 14,348
mediana =MEDIAN(C2:C61) 14,600
modulul =MODE(C2:C61) 14,600
varianţa =VAR(C2:C61) 0,747
deviaţia standard =STDEV(C2:C61) 0,864
coeficientul de
variaţie=(B67/B63) % 0,060
![Page 21: Indicatori ai formei distribuţieiileana.brudiu.ro/MVR/An I MVR/CURS (2020-2021)/12...Funcția din Excel ce calculează asimetria este SKEW() Puteți utiliza următoarele două reguli](https://reader036.vdocuments.net/reader036/viewer/2022081502/613dfb2759df642846163caf/html5/thumbnails/21.jpg)
Microsoft Excel permite calcularea automată a statisticilor descriptive folosind opţiunea Data Analysis din meniul Tools.
HGB g/dL
Mean 14,34833
Standard Error 0,111576
Median 14,6
Mode 14,6
Standard Deviation 0,864261
Sample Variance 0,746946
Kurtosis 1,115185
Skewness -0,71676
Range 4,4
Minimum 12
Maximum 16,4
Sum 860,9
Count 60
Largest(1) 16,4
Smallest(1) 12
Confidence Level(95,0%) 0,223262
![Page 22: Indicatori ai formei distribuţieiileana.brudiu.ro/MVR/An I MVR/CURS (2020-2021)/12...Funcția din Excel ce calculează asimetria este SKEW() Puteți utiliza următoarele două reguli](https://reader036.vdocuments.net/reader036/viewer/2022081502/613dfb2759df642846163caf/html5/thumbnails/22.jpg)
Microsoft Excel permite trasarea automată a histogramei folosind opţiunea Data Analysis din meniul Tools.
![Page 23: Indicatori ai formei distribuţieiileana.brudiu.ro/MVR/An I MVR/CURS (2020-2021)/12...Funcția din Excel ce calculează asimetria este SKEW() Puteți utiliza următoarele două reguli](https://reader036.vdocuments.net/reader036/viewer/2022081502/613dfb2759df642846163caf/html5/thumbnails/23.jpg)
![Page 24: Indicatori ai formei distribuţieiileana.brudiu.ro/MVR/An I MVR/CURS (2020-2021)/12...Funcția din Excel ce calculează asimetria este SKEW() Puteți utiliza următoarele două reguli](https://reader036.vdocuments.net/reader036/viewer/2022081502/613dfb2759df642846163caf/html5/thumbnails/24.jpg)
Column1
Mean 14,34833
Standard Error 0,111576
Median 14,6
Mode 14,6
Standard Deviation 0,864261
Sample Variance 0,746946
Kurtosis 1,115185
Skewness -0,71676
Range 4,4
Minimum 12
Maximum 16,4
Sum 860,9
Count 60
Confidence Level(95,0%) 0,223262
HGB g/dL
14,5 14,5 15,4 15,2 14,6 14,6 13,5 14,6 13,8 15,2 13,8 13,6
14,7 15,2 12 13,8 12 14,7 14,7 13,8 14,7 15,3 13,8 15,3
12 13,3 15,7 14,7 14,5 13,3 13,7 14,5 16,4 14,6 13,6 14,6
14,1 15,4 14,8 14,8 14,1 14,5 14,6 13,5 13,8 13,8 15,2 15,2
15 14,8 13,5 13,7 13,5 14,7 15 14,6 13,5 14,7 15,3 14,6
![Page 25: Indicatori ai formei distribuţieiileana.brudiu.ro/MVR/An I MVR/CURS (2020-2021)/12...Funcția din Excel ce calculează asimetria este SKEW() Puteți utiliza următoarele două reguli](https://reader036.vdocuments.net/reader036/viewer/2022081502/613dfb2759df642846163caf/html5/thumbnails/25.jpg)
![Page 26: Indicatori ai formei distribuţieiileana.brudiu.ro/MVR/An I MVR/CURS (2020-2021)/12...Funcția din Excel ce calculează asimetria este SKEW() Puteți utiliza următoarele două reguli](https://reader036.vdocuments.net/reader036/viewer/2022081502/613dfb2759df642846163caf/html5/thumbnails/26.jpg)
Statistica descriptive (rezumat) Populaţie: totalitatea (mulţimea) persoanelor la care se referă un studiu.
Individ: un element al populaţiei studiate.
Variabilă: o caracteristică măsurabilă a unui individ.
Biostatistică: disciplină care studiază caracteristicile unei populaţii şi/sau
compararea unor populaţii, pornind de la date culese pe eşantioane.
Inferenţă statistică: operaţia de generalizare, la nivelul întregii populaţii, a
caracteristicilor obţinute pe un eşantion.
Eşantion (sample): o submulţime a populaţiei, ce cuprinde indivizii pe care
se efectuează măsurătorile.
Eşantion reprezentativ (random sample): eşantion care cuprinde toate
straturile populaţiei în proporţii similare şi are toate caracteristicile
populaţiei.
![Page 27: Indicatori ai formei distribuţieiileana.brudiu.ro/MVR/An I MVR/CURS (2020-2021)/12...Funcția din Excel ce calculează asimetria este SKEW() Puteți utiliza următoarele două reguli](https://reader036.vdocuments.net/reader036/viewer/2022081502/613dfb2759df642846163caf/html5/thumbnails/27.jpg)
Statistica descriptive (rezumat) Variabilă cantitativă / numerică: exprimată printr-un număr, valoare
obţinută prin măsurare cu un instrument; are unităţi de măsură.
Variabilă ordinală / rang (rank variable): exprimat printr-un număr
asociat unei scări convenţionale.
Variabilă nominală / calitativă (count data): exprimată printr-un cuvânt
care exprimă o calitate a variabilei respective.
Variabilă dihotomică: are numai două valori posibile; rezultatul va fi
distribuţia în cele două clase.
![Page 28: Indicatori ai formei distribuţieiileana.brudiu.ro/MVR/An I MVR/CURS (2020-2021)/12...Funcția din Excel ce calculează asimetria este SKEW() Puteți utiliza următoarele două reguli](https://reader036.vdocuments.net/reader036/viewer/2022081502/613dfb2759df642846163caf/html5/thumbnails/28.jpg)
Transformări
În anumite situaţii putem transforma tipul variabilei.
TENSIUNE ARTERIALĂ SISTOLICĂ- EXPRIMATĂ CA VARIABILĂ
- NUMERICĂ
- RANG
- CALITATIVĂ
- DIHOTOMICĂ (0) =NEHIPERTENSIV (1) = HIPERTENSIV
90 100 110 120 130 140 150 160 170
.............0........ .............1........... ...........2............
HIPOTENSIV NORMOTENSIV HIPERTENSIV
![Page 29: Indicatori ai formei distribuţieiileana.brudiu.ro/MVR/An I MVR/CURS (2020-2021)/12...Funcția din Excel ce calculează asimetria este SKEW() Puteți utiliza următoarele două reguli](https://reader036.vdocuments.net/reader036/viewer/2022081502/613dfb2759df642846163caf/html5/thumbnails/29.jpg)
Pentru caracterizarea unui eşantion se calculează două seturi de indicatori statistici:
Indicatori ai tendinţei centrale – cel mai des folosit este media aritmetică m.
Indicatori de dispersie – cel mai des folosit este deviaţia standard s şi reprezintă
gradul de împrăştiere al valorilor individuale în jurul mediei eşantionului.
Alţi indicatori ai tendinţei centrale:
− mediana – valoarea care împarte lotul de valori ordonate în două subintervale
egale ca număr de valori;
− modulul – cea mai frecventă valoare.
Alţi indicatori de dispersie:
− varianţa – pătratul deviaţiei standard;
− coeficientul de variaţie – raportul între deviaţia standard şi media aritmetică.
Cea mai des întâlnită distribuţie a valorilor de studiu este distribuţia normală
(Gauss).
.
În cazul variabilelor ordinale (rang), folosim mediana ca indicator al tendinţei
centrale şi cuartilele (amplitudinea intercuartile) pentru dispersie.
Pentru a caracteriza distribuţiile asimetrice se folosesc coeficienţii de asimetrie
şi exces.