deaths in greece regions statgraphics
DESCRIPTION
we analysed the different ratio of deaths per 100.000 through the different regions of Greece by using StatgraphicsTRANSCRIPT
ΟΙΚΟΝΟΜΙΚΟ ΡΑΝΕΡΙΣΤΘΜΙΟ ΑΘΘΝΩΝ
Διατμθματικό ΜΒΑ FULL TIME
ΜΑΘΗΜΑ: ΠΟΟΣΙΚΕ ΜΕΘΟΔΟΙ
ΘΕΜΑ : ΟΙ ΘΑΝΑΣΟΙ ΑΠΟ ΣΟ 1994-2009 ΣΙ
ΠΕΡΙΦΕΡΕΙΕ ΣΗ ΕΛΛΑΔΟ
ΕΙΣΘΓΘΤΘΣ: ΣΦΑΚΙΑΝΑΚΘΣ
ΟΜΑΔΑ ΕΓΑΣΙΑΣ: Α. ΑΛΕΞΑΝΔΑΚΘ
Δ. ΔΕΜΙΘΣ
Α. ΧΑΜΡΑ
Δ. ΧΑΤΗΟΡΟΥΛΟΥ
Ακινα 2011
1
2
3
4
5
6
7
8
9
10
11
12
13
Θηκόγραμμα
750 850 950 1050 1150 1250 1350
death
pla
ce
2
ΠΙΝΑΚΑ ΠΕΡΙΕΧΟΜΕΝΩΝ
ΡΙΝΑΚΑΣ ΡΕΙΕΧΟΜΕΝΩΝ ............................................................................................................................. 2
Ρρόλογοσ ........................................................................................................................................................ 3
1. Ειςαγωγι .................................................................................................................................................... 4
1.1. Σθνπόο ............................................................................................................................................... 4
1.2. Γεδνκέλα-Πεγή ................................................................................................................................. 5
1.3. Σπκβνιηζκνί δεδνκέλσλ .................................................................................................................. 5
Κεθάιαην 1 .................................................................................................................................................... 7
1.1.Ρεριγραφικι Ανάλυςθ και Γραφικι απεικόνιςθ . ................................................................................ 7
1.1.1. One-Variable Analysis - death ...................................................................................................... 7
1.3. MULTIPLE VARIANCE ANALYSIS ......................................................................................................... 12
1.4. TWO – SAMPLE COMPARISON ANALYSIS .......................................................................................... 13
1.4.1. TWO – SAMPLE COMPARISON ANALYSIS: ................................................................................. 13
Σφγκριςθ του πλθκυςμοφ Ανατολικισ Μακεδονίασ Θράκθ=1 με τον πλθκυςμό Ρελοπόννθςοσ =9. . 13
1.4.2. TWO – SAMPLE COMPARISON ANALYSIS: ................................................................................. 17
Σφγκριςθ του πλθκυςμοφ Κεντρικισ Μακεδονίασ (Θεςςαλονίκθ)=2 με τον πλθκυςμό Αττικισ =10 .. 17
1.4.3. Σφγκριςθ ανάμεςα ςτον αρικμό των ςυνολικών κανάτων ςε Ελλάδα και Βουλγαρία. ............. 22
ΚΕΦΑΛΑΙΟ 2 ................................................................................................................................................. 25
ADVANCED PROCEDURES ............................................................................................................................. 25
2.1. ANOVA ANALYSIS ............................................................................................................................... 25
2.1.1. ANOVA ANALYSIS ωσ προσ τθν περιοχι .................................................................................... 25
2.1.2. ANOVA ANALYSIS ωσ προσ τθν χρονιά ....................................................................................... 31
2.1.3. Ζλεγχοσ για αναηιτθςθ κατανομισ που να αντιπροςωπεφει τθν γενικι κατανομι των κανάτων
ςτθν Ελλάδα ......................................................................................................................................... 33
2.2. ΡΟΒΛΕΨΘ ........................................................................................................................................ 36
Συμπεράςματα ............................................................................................................................................. 40
Βιβλιογραφία ................................................................................................................................................ 41
3
Πρόλογοσ
Η εξγαζία απηή έγηλε ζηα πιαίζηα ηνπ καζήκαηνο «Πνζνηηθέο κέζνδνη γηα ηε
ιήςε Δπηρεηξεζηαθώλ Απνθάζεσλ» ηνπ πξώηνπ εμακήλνπ ηνπ ηκήκαηνο
Γηαηκεκαηηθνύ ΜΒΑ Full Time. Ήηαλ κηα εμαηξεηηθή επθαηξία λα εξεπλήζνπκε θαη
λα αλαθαιύςνπκε ρξήζηκεο κεζόδνπο αλάιπζεο θαη επεμεξγαζίαο ζηαηηζηηθώλ
δεδνκέλσλ κέζσ απιώλ θαη πην εμεηδηθεπκέλσλ κεζόδσλ.
Η κειέηε όισλ απηώλ ησλ κεζόδσλ θαη ε ρξεζηκόηεηα ηνπο είλαη ηδηαίηεξα
πνιύηηκε ζηελ εμαγσγή ζπκπεξαζκάησλ βαζηζκέλσλ ζηε ρξήζε
εξσηεκαηνινγίσλ δειαδή ηεο πξσηνγελήο αιιά θαη ηεο δεπηεξνγελήο έξεπλαο.
Κάηη ηέηνην ζα γίλεη απόιπηα θαηαλνεηό ζηε ζπλέρεηα ηεο εξγαζίαο πνπ βαζίζηεθε
ζε απηή αθξηβώο ηε ινγηθή θαη ζηα απνηειέζκαηά ηεο.
Οινθιεξώλνληαο ηνλ πξόινγν πνπ ζα ζαο εηζάγεη ζην θύξην κέξνο ηεο
εξγαζίαο ζα ζέιακε λα επραξηζηήζνπκε ηδηαίηεξα ηνλ θαζεγεηή καο ζην κάζεκα
απηό, θύξην Σθαθηαλάθε, πνπ ήηαλ ν θπξηόηεξνο αξσγόο ζε απηή καο ηελ
πξνζπάζεηα. Χσξίο ηε βνήζεηά ηνπ ζίγνπξα ε εξγαζία καο ζα είρε ειιείςεηο νη
νπνίεο απνθεύρζεθαλ ράξε ζηηο ζπκβνπιέο πνπ καο έδσζε όπνηε απηέο
ρξεηάζηεθαλ.
Αζήλα, Ιαλνπάξηνο 2011
Αιεμαλδξάθε Αξγπξή
Γεκίξεο Γεκήηξηνο
Χάξκπα Απνζηνιία
Χαηδνπνύινπ Γηνλπζία
4
1. Ειςαγωγή
1.1. Σκοπός
Σθνπόο ηεο ζπγθεθξηκέλεο εξγαζίαο ήηαλ ε κειέηε ησλ ζαλάησλ σο
πνζνζηό αλά 100.000 θαηνίθνπο ζε δηάθνξεο πεξηνρέο ηεο Διιάδαο. Σηόρνο καο
ήηαλ λα δνύκε πνηεο γεσγξαθηθέο πεξηνρέο ηεο ρώξαο καο έρνπλ παξόκνην
πνζνζηό ζαλάησλ θαη λα πξνζπαζήζνπκε λα εξκελεύζνπκε ηπρόλ νκνηόηεηεο
θαη δηαθνξέο. Αθόκα ζηόρνο ήηαλ θαη ε κειινληηθή πξόβιεςε ησλ ζαλάησλ.
Δπηπξνζζέησο πξνζπαζήζακε λα δνύκε πνηεο γεσγξαθηθέο πεξηνρέο, αλ
ππάξρνπλ, κπνξνύλ λα αληηθαηνπηξίζνπλ θαη ζε πνην βαζκό ηελ πνξεία ησλ
ζαλάησλ ζε όιε ηελ ρώξα έηζη ώζηε λα εμάγνπκε έλα δηάζηξσκα κε βάζε ην
νπνίν λα κπνξνύκε λα θάλνπκε κειινληηθέο εθηηκήζεηο θαη γεληθεύζεηο γηα όιν ηνλ
ειιεληθό πιεζπζκό. Γηα όιε ηελ εξγαζία ρξεζηκνπνηήζακε δηάζηεκα
εκπηζηνζύλεο 95%.
5
1.2. Δεδομένα-Πηγή
Τα δεδνκέλα ηα πήξακε από ηελ Δπξσπατθή Σηαηηζηηθή ππεξεζία θαη
αθνξνύζαλ ηνπο ζαλάηνπο σο λνύκεξν αλά 100.000 πιεζπζκνύ από ην 1994
κέρξη ην 2008 γηα δηάθνξεο γεσγξαθηθέο πεξηνρέο ηεο ρώξαο καο. Αθόκα πήξακε
ζηνηρεία γηα ην γεληθό πνζνζηό ηεο Διιάδαο αιιά θαη ηεο Βνπιγαξίαο.
1.3. Συμβολιζμοί δεδομένων
Σην πξόγξακκα έρνπκε θάλεη ρξήζε ησλ εμήο κεηαβιεηώλ:
Death: όπνπ ζπκβνιίδεη ην αξηζκό ησλ ζαλάησλ αλά 100.000 θαηνίθνπο
Place : όπνπ ζπκβνιίδεη ηηο πεξηνρέο όπνπ
1= Αλαηνιηθή Μαθεδνλία, Θξάθε
2=Κεληξηθή Μαθεδνλία
3=Γπηηθή Μαθεδνλία
4=Θεζζαιία
5=Ήπεηξνο
6=Ιόληα Νεζηά
7=Γπηηθή Διιάδα
6
8=Σηεξεά Διιάδα
9=Πεινπόλεζνο
10=Αηηηθή
11=Βόξεην Αηγαίν
12=Νόηην Αηγαίν
13=Κξήηε
Year : ην έηνο ζην νπνίν αλαθέξεηαη ην death
Total deaths : όπνπ ζπκβνιίδεη ηνπο ζπλνιηθνύο ζαλάηνπο ηεο Διιάδαο θαη
Βνπιγαξίαο
Country: όπνπ ζπκβνιίδεη ηελ ρώξα από όπνπ πξνέξρνληαη νη ζάλαηνη κε
1= Διιάδα
2= Βνπιγαξία
7
Κεθάιαην 1
1.1.Περιγραφική Ανάλυςη και Γραφική απεικόνιςη .
1.1.1. One-Variable Analysis - death
Data variable: death (per 100.000 habitans)
195 values ranging from 757,7 to 1333,3
Summary Statistics for death
Count 195
Average 1010,83
Standard deviation 122,081
Coeff. of variation 12,0774%
Minimum 757,7
Maximum 1333,3
Range 575,6
Stnd. skewness 0,983902
Stnd. kurtosis -1,11866
Πίνακας 1
Από ηνλ πίλαθα 1 παξαηεξνύκε πσο νη ηηκέο ηεο κεηαβιεηήο death
αθνινπζνύλ ηελ θαλνληθή θαηαλνκή θαζώο ε Standared skewness θαη ε
Standared Kurtosis είλαη κέζα ζηα επηηξεπηά όξηα (–2,2) θαη κάιηζηα είλαη πνιύ
θνληά ζηηο ηηκέο 1 θαη –1 αληίζηνηρα. Γειαδή ε θαηαλνκή καο έρεη πνιύ κηθξή
αξηζηεξή αζπκκεηξία θαη θύξησζε ζε ζρέζε κε ηελ θαλνληθή θαηαλνκή ζε βαζκό
ηέηνην πνπ κπνξνύκε λα ζεσξήζνπκε ηελ θαηαλνκή καο σο θαλνληθή. Βάζε
απηνύ αλακέλνπκε ηα δεδνκέλα καο λα είλαη ζηαηηζηηθά ζεκαληηθά.
8
Γράφημα 1
Παξαηεξώληαο ην Ιζηόγξακκα ζην γξάθεκα 1 βιέπνπκε θαη γξαθηθά
πιένλ πσο ε θαηαλνκή καο έρεη κηα ειαθξά δεμηά αζπκκεηξία.
Γράφημα 2
Από ην γξάθεκα 2 παξαηεξνύκε πσο δελ ππάξρνπλ outliers νύηε
suspected outliers θαη πσο ε θαηαλνκή καο έρεη κηα ειαθξά αξλεηηθή θύξησζε.
Ιζηόγραμμα
720 920 1120 1320 1520
death
0
20
40
60
80
fre
qu
en
cy
Θηκόγραμμα
750 850 950 1050 1150 1250 1350
death
9
Frequency Tabulation for death
Lower Upper Relative Cumulative Cum. Rel.
Class Limit Limit Midpoint Frequency Frequency Frequency Frequency
at or below 720,0 0 0,0000 0 0,0000
1 720,0 808,889 764,444 8 0,0410 8 0,0410
2 808,889 897,778 853,333 35 0,1795 43 0,2205
3 897,778 986,667 942,222 34 0,1744 77 0,3949
4 986,667 1075,56 1031,11 64 0,3282 141 0,7231
5 1075,56 1164,44 1120,0 28 0,1436 169 0,8667
6 1164,44 1253,33 1208,89 20 0,1026 189 0,9692
7 1253,33 1342,22 1297,78 6 0,0308 195 1,0000
8 1342,22 1431,11 1386,67 0 0,0000 195 1,0000
9 1431,11 1520,0 1475,56 0 0,0000 195 1,0000
above 1520,0 0 0,0000 195 1,0000
Πίνακας 2
Mean = 1010,83 Standard deviation = 122,081
Σηνλ παξαπάλσ πίλαθα βιέπνπκε ηηο ηηκέο θαη ηελ ζπρλόηεηα εκθάληζεο
ησλ ζηνηρείσλ ρσξηζκέλα ζε θιάζεηο.
10
Γράφημα 3
Γράφημα 4
Σην γξάθεκα 4 απεηθνλίδνληαη νη δηάθνξεο ηηκέο πνπ κπνξεί λα πάξεη ε
κεηαβιεηή death.
Quantile Plot
750 850 950 1050 1150 1250 1350
death
0
0,2
0,4
0,6
0,8
1
pro
po
rtio
n
Δι άγραμμα Σκεδαζμού
750 850 950 1050 1150 1250 1350
death
11
Percentiles for death
Percentiles
1,0% 760,6
5,0% 821,3
10,0% 855,4
25,0% 912,2
50,0% 1020,7
75,0% 1084,8
90,0% 1177,1
95,0% 1213,1
99,0% 1317,2
Πίνακας 3
Σηνλ παξαπάλσ πίλαθα βιέπνπκε όηη γηα ην πιεζπζκό καο ζε πνζνζηό
90% νη ζάλαηνη θπκαίλνληαη από 821,3 αλά 100.000 θαηνίθνπο σο 1213,1 αλά
100.000 θαηνίθνπο.
Γράφημα 5
Σην παξαπάλσ γξάθεκα παξαηεξνύκε ηηο απνθιίζεηο θάζε παξαηήξεζεο
από ηνλ δηάκεζν.
Symmetry Plot
0 100 200 300 400
distance below median
0
100
200
300
400
dis
tan
ce
ab
ov
e m
ed
ian
12
1.3. MULTIPLE VARIANCE ANALYSIS
Σύκθσλα κε ην αθόινπζν πίλαθα δελ ππάξρεη θαλνληθόηεηα αλάκεζα ζε όιεο ηηο κεηαβιεηέο, θαζώο ηα stnd. Skewness θαη stnd. Kurtosis είλαη εθηόο ησλ απνδεθηώλ νξίσλ [-2,2]. Άξα γηα λα εμεηάζνπκε ηελ όπνηα ζπζρέηηζε κεηαμύ ησλ κεηαβιεηώλ ζα επηιέμνπκε ηελ Spearman Rank Correlation.
Summary Statistics
death year place
Count 195 195 195
Average 1010,83 2001,0 7,0
Standard deviation 122,081 4,33161 3,75129
Coeff. of variation 12,0774% 0,216473% 53,5898%
Minimum 757,7 1994,0 1,0
Maximum 1333,3 2008,0 13,0
Range 575,6 14,0 12,0
Stnd. skewness 0,983902 0,0 0,0
Stnd. kurtosis -1,11866 -3,45168 -3,46213
Πίνακας 4
Σύκθσλα κε ηνλ αθόινπζν πίλαθα παξαηεξνύκε όηη δελ ππάξρεη θακία
ζπζρέηηζε κεηαμύ ησλ κεηαβιεηώλ καο , όπσο ήηαλ θαη αλακελόκελν , θαζώο ζε
όιεο ηηο πεξηπηώζεηο ην P-Value είλαη κεγαιύηεξν από ην 0,05 γηα έλα δηάζηεκα
εκπηζηνζύλεο 95%.
Spearman Rank Correlations
death year place
death 0,0872 -0,0909
(195) (195)
0,2245 0,2055
year 0,0872 0,0000
(195) (195)
0,2245 1,0000
place -0,0909 0,0000
(195) (195)
0,2055 1,0000
Πίνακας 5
13
1.4. TWO – SAMPLE COMPARISON ANALYSIS
1.4.1. TWO – SAMPLE COMPARISON ANALYSIS: Σύγκριςη του πληθυςμού Ανατολικήσ Μακεδονίασ Θράκη=1 με τον πληθυςμό Πελοπόννηςοσ =9.
Γηα λα πξνβνύκε ζηελ ζύγθξηζε ησλ δπν πιεζπζκώλ ζα πξέπεη πξώηα
λα δνύκε αλ αθνινπζνύλ ηελ θαλνληθή θαηαλνκή, αλ ηα δηαζηήκαηα
εκπηζηνζύλεο γηα 95% ηεο κεηαβιεηήο ζάλαηνο γηα ην δπν ηηκέο εκθαλίδνπλ θνηλά
ζεκεία, θαη ηέινο ζα εμεηάζνπκε ην Kolmogorov-Smirnov Test γηα λα δσ αλ
ππάξρεη ή όρη ζεκαληηθή ζηαηηζηηθή δηαθνξά αλάκεζα ζηνπο δύν πιεζπζκνύο.
Από ηα παξαπάλσ ζα νδεγεζνύκε ζε ζύγθξηζε ησλ κέζσλ ή ζε ζύγθξηζε ησλ
δηακέζσλ.
Αο αξρίζνπκε ινηπόλ ηνλ έιεγρν.
Summary Statistics
SELECT(death;place=1) SELECT(death;place=9)
Count 15 15
Average 1044,41 1164,51
Standard deviation 23,0713 26,1065
Coeff. of variation 2,20902% 2,24183%
Minimum 1013,3 1126,4
Maximum 1095,8 1219,0
Range 82,5 92,6
Stnd. skewness 1,28182 0,505692
Stnd. kurtosis 0,0425351 -0,108468
Πίνακας 6
Από ηνλ Πίλαθα 6 παξαηεξνύκε πσο θαη νη δύν πιεζπζκνί εκθαλίδνπλ
θαλνληθόηεηα ζηελ θαηαλνκή ηνπο θαζώο νη ηηκέο ηεο θύξησζεο θαη ηεο
αζπκκεηξίαο θαη γηα ηνπο δπν πιεζπζκνύο βξίζθνληαη κέζα ζηα απνδεθηά όξηα
(-2,+2). Έηζη παίξλνπκε ην πξάζηλν θσο θαη πξνρσξάκε ζηνλ επόκελν έιεγρν.
14
Comparison of Standard Deviations
SELECT(death;place=1) SELECT(death;place=9)
Standard deviation 23,0713 26,1065
Variance 532,283 681,547
Df 14 14
Ratio of Variances = 0,780992
95,0% Confidence Intervals
Standard deviation of SELECT(death;place=1): [16,8911; 36,3856]
Standard deviation of SELECT(death;place=9): [19,1132; 41,1724]
Ratio of Variances: [0,262202; 2,32625]
F-test to Compare Standard Deviations
Null hypothesis: sigma1 = sigma2
Alt. hypothesis: sigma1 NE sigma2
F = 0,780992 P-value = 0,650039
Do not reject the null hypothesis for alpha = 0,05.
Πίνακας 7
Όπσο παξαηεξνύκε ν ιόγνο ησλ δηαθπκάλζεσλ ησλ δύν πιεζπζκώλ
θπκαίλεηαη από 0,262 έσο θαη 2,32. ην γεγνλόο όηη ην εύξνο πεξηιακβάλεη ηελ
κνλάδα καο δίλεη ηελ δπλαηόηεηα λα ππνζέζνπκε πσο νη θαηαλνκέο ησλ
απνθιίζεσλ ησλ δύν πιεζπζκώλ είλαη ίδηεο θαη επνκέλσο παίξλνπκε θαη ην
δεύηεξν πξάζηλν θσο ώζηε λα ζπλερίζνπκε κε ηνλ ηειεπηαίν έιεγρν ην
Kolmogorov-Smirnov Test.
Kolmogorov-Smirnov Test
Estimated overall statistic DN = 1,0
Two-sided large sample K-S statistic = 2,73861
Approximate P value = 6,11805E-7
Πίνακας 8
Παξαηεξνύκε όηη ην P-value είλαη κηθξόηεξν από ην 0,05 νπόηε κε 95%
πηζαλόηεηα ππάξρεη ζηαηηζηηθή ζεκαληηθή δηαθνξά αλάκεζα ζηνπο πιεζπζκνύο
πνπ εμεηάδνπκε. Λόγν απηνύ ζα πάκε λα ζπγθξίλνπκε ηηο δηάκεζνπο ησλ δύν
πιεζπζκώλ.
15
Comparison of Medians
Median of sample 1: 1038,9
Median of sample 2: 1167,5
Mann-Whitney (Wilcoxon) W test to compare medians
Null hypothesis: median1 = median2
Alt. hypothesis: median1 NE median2
Average rank of sample 1: 8,0
Average rank of sample 2: 23,0
W = 112,5 P-value = 0,00000339552
Reject the null hypothesis for alpha = 0,05.
Πίνακας 9
Παξαηεξώληαο ηελ ζύγθξηζε ησλ δηακέζσλ βιέπνπκε πσο κε 95%
πηζαλόηεηα νη δπν πιεζπζκνί, δειαδή νη ζάλαηνη από ηελ Αλαηνιηθή Μαθεδνλία
θαη Θξάθε θαη νη ζάλαηνη από ηελ Πεινπόλλεζν, δηαθέξνπλ ζηαηηζηηθά ζεκαληηθά
θαη ηα λνύκεξα ησλ ζαλάησλ αθνινπζνύλ δηαθνξεηηθή πνξεία. Πην ζπγθεθξηκέλα
ν δηάκεζνο ηεο Αλαηνιηθήο Μαθεδνλίαο θαη Θξάθεο είλαη 1038,9 ζάλαηνη αλά
100.000 θαηνίθσλ ελώ ηεο Πεινπνλλήζνπ 1167,5 ζάλαηνη αλά 100.000 θαηνίθσλ.
Παξαηεξνύκε ινηπόλ πσο ππάξρεη κηα απμεκέλε ζλεζηκόηεηα ησλ θαηνίθσλ ηεο
Πεινπνλλήζνπ γη απηό ην ζθνπό θαιό ζα ήηαλ λα επηιέμνπκε γηα ηόπν δηακνλήο
καο ηελ Αλαηνιηθή Μαθεδνλία θαη Θξάθε. Τα παξαπάλσ αλαπαξηζηνύληαη θαη
δηαγξακκαηηθά ζηα γξαθήκαηα 6 θαη 7.
16
Γράφημα 6
Γράφημα 7
SELECT(death;place=1)
1000 1040 1080 1120 1160 1200 1240
SELECT(death;place=9)
10
6
2
2
6
10
fre
qu
en
cy
Quantile-Quantile Plot
1000 1040 1080 1120 1160 1200 1240
SELECT(death;place=1)
1000
1040
1080
1120
1160
1200
1240
SE
LE
CT
(de
ath
;pla
ce
=9
)
17
1.4.2. TWO – SAMPLE COMPARISON ANALYSIS: Σύγκριςη του πληθυςμού Κεντρικήσ Μακεδονίασ (Θεςςαλονίκη)=2 με τον πληθυςμό Αττικήσ =10
Καη πάιη όπσο θαη ζηελ πξνεγνύκελε ζύγθξηζε ζα πξέπεη λα θάλνπκε
πξώηα θάπνηνπο ειέγρνπο . Αξρηθά γηα λα πξνβώ ζηελ ζύγθξηζε ησλ δπν
πιεζπζκώλ ζα πξέπεη πξώηα λα δνύκε αλ αθνινπζνύλ ηελ θαλνληθή θαηαλνκή,
αλ ηα δηαζηήκαηα εκπηζηνζύλεο γηα 95% ηεο κεηαβιεηήο ζάλαηνο γηα ηηο δπν ηηκέο
εκθαλίδνπλ θνηλά ζεκεία, θαη ηέινο ζα εμεηάζνπκε ην Kolmogorov-Smirnov Test
γηα λα δσ αλ ππάξρεη ή όρη ζεκαληηθή ζηαηηζηηθή δηαθνξά αλάκεζα ζηνπο δύν
πιεζπζκνύο. Από ηα παξαπάλσ ζα νδεγεζνύκε ζε ζύγθξηζε ησλ κέζσλ ή ζε
ζύγθξηζε ησλ δηακέζσλ. Απηή ηελ θνξά ζπγθξίλνπκε δπν αζηηθέο πεξηνρέο θαη
αλακέλνπκε λα ππάξρεη παξόκνηνο αξηζκόο ζαλάησλ αλά 100.000 θαη ζηνπο δπν
πιεζπζκνύο.
Αο αξρίζνπκε ινηπόλ ηνλ έιεγρν γηα λα δνύκε αλ ζα επαιεζεπηνύλ νη
πξνζδνθίεο καο.
Summary Statistics
SELECT(death;place=2) SELECT(death;place=10)
Count 15 15
Average 879,68 868,8
Standard deviation 26,4494 14,2551
Coeff. of variation 3,00671% 1,64078%
Minimum 837,7 845,3
Maximum 936,4 892,9
Range 98,7 47,6
Stnd. skewness 1,3236 0,142912
Stnd. kurtosis 0,553786 -0,835711
Πίνακας 10
Από ηνλ παξαπάλσ πίλαθα βιέπνπκε πσο θαη νη δπν πιεζπζκνί
αθνινπζνύλ ηελ θαλνληθή θαηαλνκή θαζώο ε αζπκκεηξία ηνπο θαη ε θύξησζε
ηνπο βξίζθνληαη κέζα ζηα όξηα ηνπ [-2,2]. Έρνπκε ινηπόλ ην πξώην πξάζηλν θσο
ώζηε λα ζπλερίζνπκε ζηνλ επόκελν έιεγρν.
18
Comparison of Standard Deviations
SELECT(death;place=2) SELECT(death;place=10)
Standard deviation 26,4494 14,2551
Variance 699,573 203,207
Df 14 14
Ratio of Variances = 3,44266
95,0% Confidence Intervals
Standard deviation of SELECT(death;place=2): [19,3643; 41,7133]
Standard deviation of SELECT(death;place=10): [10,4365; 22,4816]
Ratio of Variances: [1,1558; 10,2543]
F-test to Compare Standard Deviations
Null hypothesis: sigma1 = sigma2
Alt. hypothesis: sigma1 NE sigma2
F = 3,44266 P-value = 0,0273551
Reject the null hypothesis for alpha = 0,05.
Πίνακας 11
Διέγρνληαο ηνλ ιόγν ησλ δηαθπκάλζεσλ παξαηεξώ όηη ν ιόγνο είλαη από
ηελ ηηκή 1,15 έσο 10,25 θαη δελ εζσθιείεη ηελ κνλάδα. Άξα ππάξρεη ζηαηηζηηθά
ζεκαληηθή δηαθνξά αλάκεζα ζηηο απνθιίζεηο ησλ δύν θαηαλνκώλ. Αιιά αο
εμεηάζνπκε θαη ην Kolmogorov-Smirnov Test.
Kolmogorov-Smirnov Test
Estimated overall statistic DN = 0,266667
Two-sided large sample K-S statistic = 0,730297
Approximate P value = 0,660386
Πίνακας 12
Ο ζπγθεθξηκέλνο έιεγρνο καο δείρλεη πσο δελ ππάξρεη δηαθνξά αλάκεζα
ζηηο θαηαλνκέο. Όκσο ιόγν ηνπ δεύηεξνπ ειέγρνπ πνπ καο ππόδεημε πσο
ππάξρεη ζηαηηζηηθά ζεκαληηθά δηαθνξά αλάκεζα ζηηο απνθιίζεηο ησλ θαηαλνκώλ
ζα νδεγεζνύκε ζε ζύγθξηζε ησλ δηακέζσλ.
19
Comparison of Medians
Median of sample 1: 876,5
Median of sample 2: 864,7
Mann-Whitney (Wilcoxon) W test to compare medians
Null hypothesis: median1 = median2
Alt. hypothesis: median1 NE median2
Average rank of sample 1: 17,0667
Average rank of sample 2: 13,9333
W = -23,5 P-value = 0,340084
Do not reject the null hypothesis for alpha = 0,05.
Πίνακας 13
Η ζύγθξηζε ησλ κέζσλ καο απνθαιύπηεη θαη καο επαιεζεύεη απηά πνπ
αλακέλακε. Φαίλεηαη ινηπόλ πσο νη ζάλαηνη ηεο πεξηνρήο ηεο Κεληξηθήο
Μαθεδνλίαο θαη ηεο Αηηηθήο έρνπλ ην ίδην δηάκεζν θαη έηζη αλά 100.000 θαηνίθνπο
αλακέλνπκε ηνπο ίδηνπο ζαλάηνπο θαη ζηηο δπν πεξηνρέο. Οπόηε αλάκεζα ζε
Θεζζαινλίθε θαη Αζήλα όπνην ηόπν δηακνλήο θαη λα επηιέμνπκε ζα έρνπκε ηηο
ίδηεο πηζαλόηεηεο λα πεζάλνπκε.
Τα παξαπάλσ θαίλνληαη θαη δηαγξακκαηηθά ζηα γξαθήκαηα 8, 9 θαη 10
πνπ αθνινπζνύλ.
20
Γράφημα 8
Γράφημα 9
SELECT(death;place=2)
830 850 870 890 910 930 950
SELECT(death;place=10)
8
4
0
4
8
fre
qu
en
cy
Box-and-Whisker Plot
830 850 870 890 910 930 950
SELECT(death;place=2)
SELECT(death;place=10)
21
Γράφημα 10
Quantile-Quantile Plot
830 850 870 890 910 930 950
SELECT(death;place=2)
830
850
870
890
910
930
950
SE
LE
CT
(de
ath
;pla
ce
=1
0)
22
1.4.3. Σύγκριςη ανάμεςα ςτον αριθμό των ςυνολικών θανάτων ςε Ελλάδα και Βουλγαρία.
Σε αυτό το ςθμείο κα μελετιςουμε τουσ κανάτουσ ανά 100.000 κατοίκουσ ςε
όλθ τθν Ελλθνικι επικράτεια και κα τον ςυγκρίνουμε με αυτόν τθσ Βουλγαρίασ.
Αναμζνουμε πωσ θ γεωγραφικι εγγφτθτα θ οποία υπάρχει κα παίξει ςθμαντικό ρόλο
αλλά επίςθσ ςθμαντικό ρόλο κα παίξει και το γεγονόσ πωσ θ Ελλάδα είναι πιο
ανεπτυγμζνθ χώρα από τθν Βουλγαρία.
Summary Statistics
SELECT(total deaths;country=1) SELECT(total deaths;country=2)
Count 16 14
Average 948,113 1423,51
Standard deviation 12,9937 39,4759
Coeff. of variation 1,37048% 2,77314%
Minimum 925,5 1359,8
Maximum 977,0 1475,3
Range 51,5 115,5
Stnd. skewness 0,796583 -0,485075
Stnd. kurtosis 0,251281 -0,798578
Πίνακας 14
Για να μπορζςουμε να πάμε ςε ςφγκριςθ των δυο πλθκυςμών κα πρζπει πρώτα
να ελζγξουμε αν οι κατανομζσ ακολουκοφν τθν κανονικι κατανομι. Ραρατθρώντασ τον
Ρίνακα 20 βλζπουμε ότι και οι δφο κατανομζσ ζχουν αςυμμετρία και κφρτωςθ που
βρίςκεται μζςα ςτα όρια (-2,+2) και μάλιςτα βρίςκονται μζςα ςτο (-1,+1) οπότε
μποροφμε να ποφμε πωσ ακολουκοφν τθν κανονικι κατανομι.
Comparison of Standard Deviations
SELECT(total deaths;country=1) SELECT(total deaths;country=2)
Standard deviation 12,9937 39,4759
Variance 168,837 1558,35
Df 15 13
Ratio of Variances = 0,108344
95,0% Confidence Intervals
Standard deviation of SELECT(total deaths;country=1): [9,59854; 20,1103]
Standard deviation of SELECT(total deaths;country=2): [28,6182; 63,5973]
Ratio of Variances: [0,035491; 0,316895]
F-test to Compare Standard Deviations
Null hypothesis: sigma1 = sigma2
Alt. hypothesis: sigma1 NE sigma2
F = 0,108344 P-value = 0,000122118
Reject the null hypothesis for alpha = 0,05.
Πίνακας 15
23
Ππωσ βλζπουμε παραπάνω ο λόγοσ των διαςπορών των δυο κατανομών είναι
από 0,035 ζωσ 0,316 γεγονόσ που δεν μασ επιτρζπει να καταλιξουμε ςτο ςυμπζραςμα
πωσ οι διαςπορζσ των δυο κατανομών είναι ίδιεσ. Οπότε κα πρζπει να πάμε ςε
ςφγκριςθ των διαμζςων. Ασ δοφμε όμωσ πρώτα και το Kolmogorov-Smirnov Test.
Kolmogorov-Smirnov Test
Estimated overall statistic DN = 1,0
Two-sided large sample K-S statistic = 2,73252
Approximate P value = 6,53982E-7
Πίνακας 16
Στθν ςφγκριςθ των διαμζςων μασ οδθγεί και το Kolmogorov-Smirnov Test
κακώσ για 95% διάςτθμα εμπιςτοςφνθσ μασ δείχνει πωσ υπάρχει ςτατιςτικά ςθμαντικι
διαφορά ανάμεςα ςτισ κατανομζσ.
Comparison of Medians
Median of sample 1: 946,7
Median of sample 2: 1428,85
Mann-Whitney (Wilcoxon) W test to compare medians
Null hypothesis: median1 = median2
Alt. hypothesis: median1 NE median2
Average rank of sample 1: 8,5
Average rank of sample 2: 23,5
W = 112,0 P-value = 0,00000357121
Reject the null hypothesis for alpha = 0,05.
Πίνακας 17
Ραρατθροφμε πωσ υπάρχει μια πολφ μεγάλθ διαφορά ανάμεςα ςτουσ
διαμζςουσ γεγονόσ που μασ δείχνει πωσ οι κάνατοι ςτθν Βουλγαρία είναι για 95%
διάςτθμα εμπιςτοςφνθσ περιςςότεροι ανά 100.000 κατοίκουσ ςε ςχζςθ με τθν Ελλάδα.
Τθν διαφορά αυτι μποροφμε να τθν δοφμε και οπτικά ςτα Γραφιματα 11 και 12 που
ακολουκοφν
24
.
Γράφημα 11
Γράφημα 12
Θηκόγραμμα
920 1020 1120 1220 1320 1420 1520
SELECT(total deaths;country=1)
SELECT(total deaths;country=2)
SELECT(total deaths;country=1)
890 1090 1290 1490 1690 1890
SELECT(total deaths;country=2)
16
6
4
14
24
fre
qu
en
cy
25
ΚΕΦΑΛΑΙΟ 2 ADVANCED PROCEDURES
2.1. ANOVA ANALYSIS
2.1.1. ANOVA ANALYSIS ωσ προσ την περιοχή
Τώξα ζα ζπγθξίλνπκε όιεο ηηο γεσγξαθηθέο πεξηνρέο ηεο Διιάδνο έηζη
όπσο ηηο είρακε ρσξίζεη ώζηε λα βξνύκε ην θαιύηεξν κέξνο γηα λα δεηο θαζώο θαη
ην ρεηξόηεξν από πιεπξάο πηζαλόηεηαο ζαλάηνπ. Αθόκα αλακέλνπκε λα θάλνπκε
θάπνηεο νκαδνπνηήζεηο, δειαδή λα βξνύκε πεξηνρέο πνπ νη θαηαλνκέο ηνπο
ζπκπεξηθέξνληαη αλάινγα.
Summary Statistics for death
place Count Average Standard deviation Coeff. of variation Minimum Maximum Range Stnd. skewness Stnd. kurtosis
1 15 1044,41 23,0713 2,20902% 1013,3 1095,8 82,5 1,28182 0,0425351
2 15 879,68 26,4494 3,00671% 837,7 936,4 98,7 1,3236 0,553786
3 15 980,2 28,4299 2,90042% 939,1 1048,9 109,8 1,51503 0,76143
4 15 1039,53 37,1686 3,57553% 981,2 1110,6 129,4 0,722892 -0,445645
5 15 1039,61 25,4186 2,44502% 983,6 1076,7 93,1 -0,848323 0,246581
6 15 1098,25 52,5776 4,78741% 1015,1 1184,8 169,7 0,0827112 -0,674922
7 15 986,96 19,3432 1,95988% 939,6 1021,2 81,6 -1,17856 1,29728
8 15 1077,07 31,6408 2,93768% 1021,3 1136,5 115,2 -0,300857 -0,102919
9 15 1164,51 26,1065 2,24183% 1126,4 1219,0 92,6 0,505692 -0,108468
10 15 868,8 14,2551 1,64078% 845,3 892,9 47,6 0,142912 -0,835711
11 15 1239,21 52,0733 4,20212% 1159,2 1333,3 174,1 0,679159 -0,60961
12 15 804,727 31,0329 3,85632% 757,7 868,1 110,4 0,599153 -0,256304
13 15 917,833 16,2866 1,77446% 886,5 949,2 62,7 0,0175638 -0,0335558
Total 195 1010,83 122,081 12,0774% 757,7 1333,3 575,6 0,983902 -1,11866
Πίνακας 18
Σηνλ Πίλαθα 18 παξαηεξνύκε πσο νη θαηαλνκέο όισλ ησλ πεξηνρώλ
αθνινπζνύλ ηελ θαλνληθή θαηαλνκή. Με βάζε ην παξαπάλσ ζα εξγαζηνύκε κε
Παξακεηξηθέο κεζόδνπο θαη κε Pearson.
26
Table of Means with 95,0 percent LSD intervals
Stnd. error
Count Mean (pooled s) Lower limit Upper limit
SELECT(death;place=1) 15 1044,41 8,17504 1033,01 1055,82
SELECT(death;place=2) 15 879,68 8,17504 868,274 891,086
SELECT(death;place=3) 15 980,2 8,17504 968,794 991,606
SELECT(death;place=4) 15 1039,53 8,17504 1028,12 1050,93
SELECT(death;place=5) 15 1039,61 8,17504 1028,2 1051,01
SELECT(death;place=6) 15 1098,25 8,17504 1086,84 1109,65
SELECT(death;place=7) 15 986,96 8,17504 975,554 998,366
SELECT(death;place=8) 15 1077,07 8,17504 1065,66 1088,47
SELECT(death;place=9) 15 1164,51 8,17504 1153,11 1175,92
SELECT(death;place=10) 15 868,8 8,17504 857,394 880,206
SELECT(death;place=11) 15 1239,21 8,17504 1227,81 1250,62
SELECT(death;place=12) 15 804,727 8,17504 793,321 816,132
SELECT(death;place=13) 15 917,833 8,17504 906,428 929,239
Total 195 1010,83
Πίνακας 19
Σηνλ παξαπάλσ πίλαθα βιέπνπκε ηελ κέζε ηηκή θαη ηελ απόθιηζε γηα θάζε
ηηκή μερσξηζηά.
Variance Check
Test P-Value
Levene's 3,53062 0,000100919
Πίνακας 20
27
Σηνλ πίλαθα 20 παξαηεξνύκε όηη ην P-Value είλαη κηθξόηεξν ηνπ 0,05 , άξα
ππάξρεη κηα ζεκαληηθή δηαθνξά κεηαμύ ησλ ηππηθώλ απνθιίζεσλ ζ ηα δεδνκέλα
καο νπόηε ζα πάκε ζε έιεγρν Kruskal-Wallis Test.
Kruskal-Wallis Test for death by place
place Sample Size Average Rank
1 15 118,867
2 15 33,4333
3 15 77,4333
4 15 115,067
5 15 116,833
6 15 146,467
7 15 79,6
8 15 139,067
9 15 172,133
10 15 28,5333
11 15 186,4
12 15 8,96667
13 15 51,2
Test statistic = 180,379 P-Value = 0,0
Πίνακας 21
Ο πίλαθαο 21 καο δείρλεη όηη ππάξρεη ιόγνο γηα πεξηζζόηεξε κειέηε-
εμέηαζε ησλ δεδνκέλσλ, θαζώο ην P-Value είλαη ίζν κε κεδέλ. Έηζη πξνρσξάκε
ζε αλάιπζε Myltiple Range Test , ώζηε λα δνύκε αλ νη ζάλαηνη δηαθέξνπλ κεηαμύ
ηνπο αλάινγα κε ην ηόπν δηακνλήο.
Όπσο παξαηεξνύκε ζην πίλαθα 22 πνπ αθνινπζεί ππάξρεη κηα
νκνηνγέλεηα κεηαμύ Αλαηνιηθήο Μαθεδνλίαο θαη Θξάθεο θαη Θεζζαιίαο,
Αλαηνιηθήο Μαθεδνλίαο θαη Θξάθεο θαη Ηπείξνπ, Κεληξηθήο Μαθεδνλίαο θαη
Αηηηθήο, Γπηηθήο Μαθεδνλίαο θαη Γπηηθήο Διιάδαο, Θεζζαιίαο θαη Ηπείξνπ θαη
ηέινο Ιόλησλ Νεζηώλ θαη Σηεξεάο Διιάδαο όζνλ αλαθνξά ηνπο ζαλάηνπο.
Multiple Range Tests for death by place
Method: 95,0 percent LSD
place Count Mean Homogeneous Groups
12 15 804,727 X
10 15 868,8 X
2 15 879,68 X
13 15 917,833 X
3 15 980,2 X
7 15 986,96 X
4 15 1039,53 X
5 15 1039,61 X
1 15 1044,41 X
8 15 1077,07 X
6 15 1098,25 X
9 15 1164,51 X
11 15 1239,21 X
28
Contrast Sig. Difference +/- Limits
1 - 2 * 164,733 22,8114
1 - 3 * 64,2133 22,8114
1 - 4 4,88667 22,8114
1 - 5 4,80667 22,8114
1 - 6 * -53,8333 22,8114
1 - 7 * 57,4533 22,8114
1 - 8 * -32,6533 22,8114
1 - 9 * -120,1 22,8114
1 - 10 * 175,613 22,8114
1 - 11 * -194,8 22,8114
1 - 12 * 239,687 22,8114
1 - 13 * 126,58 22,8114
2 - 3 * -100,52 22,8114
2 - 4 * -159,847 22,8114
2 - 5 * -159,927 22,8114
2 - 6 * -218,567 22,8114
2 - 7 * -107,28 22,8114
2 - 8 * -197,387 22,8114
2 - 9 * -284,833 22,8114
2 - 10 10,88 22,8114
2 - 11 * -359,533 22,8114
2 - 12 * 74,9533 22,8114
2 - 13 * -38,1533 22,8114
3 - 4 * -59,3267 22,8114
3 - 5 * -59,4067 22,8114
3 - 6 * -118,047 22,8114
3 - 7 -6,76 22,8114
3 - 8 * -96,8667 22,8114
3 - 9 * -184,313 22,8114
3 - 10 * 111,4 22,8114
3 - 11 * -259,013 22,8114
3 - 12 * 175,473 22,8114
3 - 13 * 62,3667 22,8114
4 - 5 -0,08 22,8114
4 - 6 * -58,72 22,8114
4 - 7 * 52,5667 22,8114
4 - 8 * -37,54 22,8114
4 - 9 * -124,987 22,8114
4 - 10 * 170,727 22,8114
4 - 11 * -199,687 22,8114
4 - 12 * 234,8 22,8114
4 - 13 * 121,693 22,8114
5 - 6 * -58,64 22,8114
5 - 7 * 52,6467 22,8114
5 - 8 * -37,46 22,8114
5 - 9 * -124,907 22,8114
5 - 10 * 170,807 22,8114
5 - 11 * -199,607 22,8114
5 - 12 * 234,88 22,8114
5 - 13 * 121,773 22,8114
6 - 7 * 111,287 22,8114
6 - 8 21,18 22,8114
6 - 9 * -66,2667 22,8114
6 - 10 * 229,447 22,8114
6 - 11 * -140,967 22,8114
6 - 12 * 293,52 22,8114
29
6 - 13 * 180,413 22,8114
7 - 8 * -90,1067 22,8114
7 - 9 * -177,553 22,8114
7 - 10 * 118,16 22,8114
7 - 11 * -252,253 22,8114
7 - 12 * 182,233 22,8114
7 - 13 * 69,1267 22,8114
8 - 9 * -87,4467 22,8114
8 - 10 * 208,267 22,8114
8 - 11 * -162,147 22,8114
8 - 12 * 272,34 22,8114
8 - 13 * 159,233 22,8114
9 - 10 * 295,713 22,8114
9 - 11 * -74,7 22,8114
9 - 12 * 359,787 22,8114
9 - 13 * 246,68 22,8114
10 - 11 * -370,413 22,8114
10 - 12 * 64,0733 22,8114
10 - 13 * -49,0333 22,8114
11 - 12 * 434,487 22,8114
11 - 13 * 321,38 22,8114
12 - 13 * -113,107 22,8114
Πίνακας 22
* denotes a statistically significant difference.
Σηνλ πίλαθα 22 εμεηάδνληαη όιεο νη πεξηνρέο αλά δπν ώζηε λα δνύκε αλ
κεηαμύ ηνπο δηαθέξνπλ ζηαηηζηηθά ζεκαληηθά ή όρη. Τα απνηειέζκαηα θαίλνληαη
ζηνλ Πίλαθα 21 όπνπ βιέπνπκε πνηεο πεξηνρέο κπνξνύλ λα απνηειέζνπλ κηα
νκνηνγελνπνηεκέλε νκάδα.
Σε ζπλδπαζκό θαη κε ην γξάθεκα 13 βιέπνπκε πσο ηνπο ιηγόηεξνπο
ζαλάηνπο αλά 100.000 θαηνίθνπο έρεη ε πεξηνρή ηνπ Νόηηνπ Αηγαίνπ. Έηζη αλ
ζέιακε λα επηιέμνπκε λα αλνίμνπκε έλα γξαθείν θεδεηώλ ζε κηα πεξηνρή ζηελ
Διιάδα ηόηε δελ ζα επηιέγακε ζίγνπξα ηελπεξηνρή ηνπ Νόηηνπ Αηγαίνπ.
Αθνινπζνύλ ε πεξηνρή ηεο Αηηηθήο θαη ηεο Κεληξηθήο Μαθεδνλίαο όπνπ
απνηεινύλ ίζσο έθπιεμε ιόγν ησλ επηβαξύλζεσλ πνπ πξνθαινύλ νη ξπζκνί ηεο
πόιεο αιιά πηζαλόηαηα αληηζηαζκίδνληαη από ηηο πςεινύ επηπέδνπ ππεξεζίεο
πγείαο. Αθόκα ζε απηέο ηηο πεξηνρέο δεη πεξηζζόηεξνο ελεξγόο πιεζπζκόο νπόηε
πηζαλόηαηα ν κέζνο όξνο ειηθίαο είλαη κηθξόηεξνο νπόηε ιηγόηεξνη θαη νη ζάλαηνη.
Έπεηηα αθνινπζεί ε Κξήηε. Σηελ ζπλέρεηα αθνινπζνύλ ε Γπηηθή Μαθεδνλία θη ε
Γπηηθή Διιάδα. Αλακέλακε νη δπν απηέο πεξηνρέο λα βξίζθνληαη θνληά θαζώο
παξνπζηάδνπλ γεσγξαθηθή εγγύηεηα. Σηελ ζπλέρεηα αθνινπζνύλ νη πεξηνρέο ηεο
30
Αλαηνιηθήο Μαθεδνλίαο Θξάθεο, ηεο Θεζζαιίαο θαη ηεο Ηπείξνπ πνπ κπνξνύλ
λα απνηειέζνπλ κηα απηνηειή νκάδα. Έπεηηα βξίζθνληαη νη πεξηνρέο ηεο Σηεξεάο
Διιάδαο θαη ησλ Ιόλησλ λήζσλ. Έπεηηα αθνινπζεί ε Πεινπόλλεζνο θαη ζηελ
ηειεπηαία ζέζε βξίζθνληαη ηα Νεζηά ηνπ Βόξεηνπ Αηγαίνπ. Η ηειεπηαία απηή ζέζε
καο πξνθαιεί κηα έθπιεμε δηόηη ηα λεζηά Ννηίνπ Αηγαίνπ έρνπλ ην κηθξόηεξν
αξηζκό ζαλάησλ ελώ ηα λεζηά ηνπ Βνξείνπ Αηγαίνπ εκθαλίδνπλ ηνλ κεγαιύηεξν
αξηζκό. Κάηη ηέηνην ζίγνπξα δελ ην αλακέλακε θαζώο θαη νη δπν πεξηνρέο είλαη
λεζησηηθέο θαη αλακέλακε λα ζπκπεξηθέξνληαη κε ηνλ ίδην ηξόπν. Σε απηνύο ηνπο
δπν πιεζπζκνύο ζα κπνξνύζε λα γίλεη πεξαηηέξσ αλάιπζε θαη έξεπλα γηα λα
βξνύκε ηνπο ιόγνπο νη νπνίνη επεξεάδνπλ ηνπο ζαλάηνπο ζε απηνύο ηνπο
πιεζπζκνύο.
Γράφημα 13
1
2
3
4
5
6
7
8
9
10
11
12
13
Θηκόγραμμα
750 850 950 1050 1150 1250 1350
death
pla
ce
31
2.1.2. ANOVA ANALYSIS ωσ προσ την χρονιά
Πηζηέςακε πσο έρεη αμία λα εξεπλήζνπκε αλ θάπνηα ρξνληά κέζα από ην
δείγκα καο ν αξηζκόο ησλ ζαλάησλ αλά 100.000 είρε θάπνηα ηδηαίηεξε κεηαβνιή
ώζηε κεηά λα αλαδεηήζνπκε ηα αίηηα απηήο ηεο κεηαβνιήο. Έηζη απνθαζίζακε λα
ζπγθξίλνπκε όιεο ηηο ρξνλνινγίεο κεηαμύ ηνπο.
Summary Statistics for death
year Count Average Standard deviation Coeff. of variation Minimum Maximum Range Stnd. skewness Stnd. kurtosis
1994 13 1006,58 129,86 12,9011% 850,0 1304,9 454,9 1,2833 0,666709
1995 13 1013,99 138,656 13,6743% 842,9 1317,2 474,3 1,33458 0,334259
1996 13 1007,97 147,27 14,6106% 760,6 1333,3 572,7 0,786205 0,699156
1997 13 980,038 111,685 11,396% 789,2 1177,1 387,9 0,0524268 -0,169126
1998 13 1004,44 129,804 12,9231% 757,7 1258,1 500,4 0,00474072 0,289977
1999 13 1010,6 124,294 12,2991% 823,1 1239,1 416,0 0,457455 -0,433574
2000 13 1028,63 140,059 13,6161% 797,3 1281,4 484,1 0,398136 -0,344517
2001 13 995,846 123,243 12,3758% 782,4 1206,6 424,2 -0,0330508 -0,345101
2002 13 1014,48 127,956 12,613% 821,3 1209,8 388,5 -0,00947284 -0,998254
2003 13 1025,09 122,604 11,9603% 837,7 1262,6 424,9 0,365671 -0,24907
2004 13 1007,9 122,941 12,1977% 783,9 1213,1 429,2 -0,368267 -0,434944
2005 13 1000,95 107,898 10,7796% 809,8 1194,2 384,4 -0,216354 -0,18704
2006 13 1008,82 120,982 11,9925% 786,6 1211,5 424,9 -0,297118 -0,158844
2007 13 1035,05 117,948 11,3954% 822,0 1220,1 398,1 -0,184856 -0,399651
2008 13 1022,07 118,568 11,6008% 788,3 1180,4 392,1 -1,00789 -0,30066
Total 195 1010,83 122,081 12,0774% 757,7 1333,3 575,6 0,983902 -1,11866
Πίνακας 23
Ο πίλαθαο 23 καο δείρλεη πσο όιεο νη θαηαλνκέο αθνινπζνύλ ηελ θαλνληθή
θαηαλνκή.
Table of Means for death by year with 95,0 percent LSD intervals
Stnd. error
year Count Mean (pooled s) Lower limit Upper limit
1994 13 1006,58 34,9448 957,827 1055,34
1995 13 1013,99 34,9448 965,234 1062,75
1996 13 1007,97 34,9448 959,211 1056,73
1997 13 980,038 34,9448 931,28 1028,8
1998 13 1004,44 34,9448 955,68 1053,2
1999 13 1010,6 34,9448 961,842 1059,36
2000 13 1028,63 34,9448 979,873 1077,39
2001 13 995,846 34,9448 947,088 1044,6
2002 13 1014,48 34,9448 965,719 1063,24
2003 13 1025,09 34,9448 976,334 1073,85
2004 13 1007,9 34,9448 959,142 1056,66
2005 13 1000,95 34,9448 952,188 1049,7
2006 13 1008,82 34,9448 960,057 1057,57
2007 13 1035,05 34,9448 986,288 1083,8
2008 13 1022,07 34,9448 973,311 1070,83
Total 195 1010,83
Πίνακας 24
32
Στον πίνακα αυτό μποροφμε να δοφμε τθν μζςθ τιμι κανάτων ανά 100.000 για
όλεσ τισ χρονολογίεσ κακώσ και το εφροσ κανάτων τθσ κάκε χρονιάσ.
Ππωσ μασ δείχνει ο πίνακασ 25 θ μεταβλθτι year δεν παρουςιάηει ςθμαντικι
διαφορά όςο αναφορά τθ τυπικι απόκλιςθ, γι΄αυτό το λόγο κα προχωριςουμε ςτο
Anova Table.
Variance Check
Test P-Value
Levene's 0,135351 0,999929
Πίνακας 25
Σύκθσλα ινηπόλ κε ηνλ πίλαθα 26 δελ ην F-ratio είλαη θάησ από 5 (0,15)
θαη ην p-value 0,9999 άξα δελ ππάξρεη ιόγνο γηα πεξαηηέξσ αλάιπζε.
ANOVA Table for death by year
Source Sum of Squares Df Mean Square F-Ratio P-Value
Between groups 33883,3 14 2420,23 0,15 0,9999
Within groups 2,85747E6 180 15874,8
Total (Corr.) 2,89135E6 194
Πίνακας 26
Γράφημα 14
Θηκόγραμμα
199419951996
199719981999200020012002200320042005
200620072008
750 850 950 1050 1150 1250 1350
death
ye
ar
33
2.1.3. Έλεγχοσ για αναζήτηςη κατανομήσ που να αντιπροςωπεύει την γενική κατανομή των θανάτων ςτην Ελλάδα
Σε απηό ην ζεκείν ζα εξεπλήζνπκε ηελ ύπαξμε κηαο θαηαλνκήο ε νπνία ζα
είλαη αληηπξνζσπεπηηθή ηνπ αξηζκνύ ησλ ζαλάησλ αλά 100.000 όιεο ηεο
Διιάδαο. Σε πεξίπησζε πνπ βξεζεί κηα ηέηνηα θαηαλνκή ζα κπνξνύκε κειεηώληαο
ηελ πνξεία ησλ ζαλάησλ ζε απηή ηελ πεξηνρή λα εμάγνπκε ζπκπεξάζκαηα γηα ηελ
πνξεία ησλ ζαλάησλ ζε όιε ηελ Διιάδα. Γη απηό ησλ ιόγν ζα ηξέμνπκε κηα
πνιιαπιή παιηλδξόκεζε κε όιεο ηηο πεξηνρέο θαη κε ηνλ γεληθό αξηζκό ηεο
Διιάδαο ειπίδνληαο πσο απηόο ν αξηζκόο ζα απνηειέζεη νκνγελνπνηεκέλε
νκάδα κε θάπνηα άιιε πεξηνρή.
Summary Statistics
Count Average Standard deviation Coeff. of variation Minimum Maximum Range
SELECT(death;place=1) 15 1044,41 23,0713 2,20902% 1013,3 1095,8 82,5
SELECT(death;place=2) 15 879,68 26,4494 3,00671% 837,7 936,4 98,7
SELECT(death;place=3) 15 980,2 28,4299 2,90042% 939,1 1048,9 109,8
SELECT(death;place=4) 15 1039,53 37,1686 3,57553% 981,2 1110,6 129,4
SELECT(death;place=5) 15 1039,61 25,4186 2,44502% 983,6 1076,7 93,1
SELECT(death;place=6) 15 1098,25 52,5776 4,78741% 1015,1 1184,8 169,7
SELECT(death;place=7) 15 986,96 19,3432 1,95988% 939,6 1021,2 81,6
SELECT(death;place=8) 15 1077,07 31,6408 2,93768% 1021,3 1136,5 115,2
SELECT(death;place=9) 15 1164,51 26,1065 2,24183% 1126,4 1219,0 92,6
SELECT(death;place=10) 15 868,8 14,2551 1,64078% 845,3 892,9 47,6
SELECT(death;place=11) 15 1239,21 52,0733 4,20212% 1159,2 1333,3 174,1
SELECT(death;place=12) 15 804,727 31,0329 3,85632% 757,7 868,1 110,4
SELECT(death;place=13) 15 917,833 16,2866 1,77446% 886,5 949,2 62,7
SELECT(total deaths;country=1) 16 948,113 12,9937 1,37048% 925,5 977,0 51,5
Total 211 1006,07 118,564 11,7848% 757,7 1333,3 575,6
Stnd. skewness Stnd. kurtosis
SELECT(death;place=1) 1,28182 0,0425351
SELECT(death;place=2) 1,3236 0,553786
SELECT(death;place=3) 1,51503 0,76143
SELECT(death;place=4) 0,722892 -0,445645
SELECT(death;place=5) -0,848323 0,246581
SELECT(death;place=6) 0,0827112 -0,674922
SELECT(death;place=7) -1,17856 1,29728
SELECT(death;place=8) -0,300857 -0,102919
SELECT(death;place=9) 0,505692 -0,108468
SELECT(death;place=10) 0,142912 -0,835711
SELECT(death;place=11) 0,679159 -0,60961
SELECT(death;place=12) 0,599153 -0,256304
SELECT(death;place=13) 0,0175638 -0,0335558
SELECT(total deaths;country=1) 0,796583 0,251281
Total 1,67676 -0,739706
Πίνακας 27
34
Κάλνπκε έιεγρν γηα λα δνύκε αλ όιεο νη θαηαλνκέο αθνινπζνύλ ηελ
θαλνληθή θαηαλνκή. Πξάγκαηη ε αζπκκεηξία θαη ε θύξησζε βξίζθεηαη ζε όιεο ηηο
θαηαλνκέο κέζα ζηα επηηξεπηά όξηα (-2, +2).
Έπεηηα πξνρσξάκε ζην δεύηεξν έιεγρν, ζηνλ έιεγρν ησλ ηππηθώλ
απνθιίζεσλ . Όπσο θαίλεηαη ζην πίλαθα 28 ππάξρεη ζεκαληηθή δηαθνξά κεηαμύ
ησλ δηαζπνξώλ .
Variance Check
Test P-Value
Levene's 3,97134 0,00000929523
Πίνακας 28
Δλ ζπλερεία ζα πξνρσξήζνπκε ζηελ One Way Anova Analysis. Όπσο θαίλεηαη
από ηνλ αθόινπζν πίλαθα ππάξρεη ζεκαληηθή δηαθνξά κεηαμύ ησλ κέζσλ , άξα
θαη ιόγνο γηα πεξαηηέξσ αλάιπζε.
ANOVA Table
Source Sum of Squares Df Mean Square F-Ratio P-Value
Between groups 2,76707E6 13 212851, 226,68 0,0000
Within groups 184982, 197 938,995
Total (Corr.) 2,95205E6 210
Πίνακας 29
Έηζη ζπλερίδνπκε ηελ αλάιπζε καο κε ην Multiple Range Test.
Multiple Range Tests
Method: 95,0 percent LSD
Count Mean Homogeneous Groups
SELECT(death;place=12) 15 804,727 X
SELECT(death;place=10) 15 868,8 X
SELECT(death;place=2) 15 879,68 X
SELECT(death;place=13) 15 917,833 X
SELECT(total deaths;country=1) 16 948,113 X
SELECT(death;place=3) 15 980,2 X
SELECT(death;place=7) 15 986,96 X
SELECT(death;place=4) 15 1039,53 X
SELECT(death;place=5) 15 1039,61 X
SELECT(death;place=1) 15 1044,41 X
SELECT(death;place=8) 15 1077,07 X
SELECT(death;place=6) 15 1098,25 X
SELECT(death;place=9) 15 1164,51 X
SELECT(death;place=11) 15 1239,21 X
Πίνακας 30
35
Όπσο βιέπνπκε από ηνλ πίλαθα 30 θαη ην Γξάθεκα 15 δπζηπρώο ν
αξηζκόο ησλ ζαλάησλ αλά 100.000 όιεο ηεο ειιεληθήο επηθξαηείαο δελ
νκνγελνπνηήζεθε κε θάπνηα άιιε νκάδα. Όκσο βξίζθεηαη αλάκεζα ζηελ Κξήηε
θαη ηελ νκάδα ηεο Γπηηθήο Διιάδαο θαη Γπηηθήο Μαθεδνλίαο. Έηζη ην κόλν πνπ
κπνξνύκε λα πνύκε είλαη όηη κειεηώληαο ηνλ αξηζκό ησλ ζαλάησλ ηεο Κξήηεο θαη
ηεο νκάδαο ηεο Γπηηθήο Διιάδαο θαη Γπηηθήο Μαθεδνλίαο ζα κπνξνύκε λα έρνπκε
κόλν κηα γεληθή εηθόλα γηα ην πνπ ζα βξίζθεηαη ν αξηζκόο ζαλάησλ αλά 100.00
όιεο ηεο Διιάδαο ρσξίο όκσο νη εθηηκήζεηο καο λα κπνξνύλ λα ρξεζηκνπνηεζνύλ
κε ζηαηηζηηθά ζεκαληηθή ζπκαληηθόηεηα .
Γράφημα 15
SELECT(death;place=1)SELECT(death;place=2)SELECT(death;place=3)
SELECT(death;place=4)SELECT(death;place=5)SELECT(death;place=6)SELECT(death;place=7)SELECT(death;place=8)SELECT(death;place=9)
SELECT(death;place=10)SELECT(death;place=11)SELECT(death;place=12)
SELECT(death;place=13)total deaths in Bulgaria
total deaths in g reece
Box-and-Whisker Plot
750 950 1150 1350 1550
response
36
2.2. ΠΡΟΒΛΕΨΗ
Σε απηό ην ζεκείν ζα δνύκε αλ κπνξνύκε λα πξνβιέςνπκε ηνλ αξηζκό ηνπ
πνζνζηνύ ησλ κειινληηθώλ ζαλάησλ ζε όιε ηελ ειιεληθή επηθξάηεηα Σηε
ζπγθεθξηκέλε πεξίπησζε πξόθεηηαη γηα κηα ρξνλνζεηξά, , νπόηε ζα
πξνζπαζήζνπκε αξρηθά λα βξνύκε ην πην αληηπξνζσπεπηηθό κνληέιν. Γηα εκάο
ην πην αληηπξνζσπεπηηθό κνληέιν είλαη ην κνληέιν Δ., θαζώο έρεη ην κηθξόηεξν
AIC θαη πεξλάεη όια ηα ηεζη, όπσο δείρλνπλ νη πίλαθεο 31 θαη 32.
Model Comparison
Data variable: SELECT(total deaths;country=1)
Number of observations = 16
Start index = 1994
Sampling interval = 1,0 year(s)
Models
(D) Quadratic trend = 67006,4 + -67,6944 t + 0,0173319 t^2
(E) Exponential trend = exp(3,30308 + 0,00177432 t)
(F) S-curve trend = exp(10,4054 + -7107,29 /t)
(H) Simple exponential smoothing with alpha = 0,2769
(I) Brown's linear exp. smoothing with alpha = 0,1918
(J) Holt's linear exp. smoothing with alpha = 0,1269 and beta = 0,221
(K) Brown's quadratic exp. smoothing with alpha = 0,1384
(M) ARIMA(0,1,1) with constant
(N) ARIMA(1,1,1) with constant
(O) ARIMA(2,1,1) with constant
(P) ARIMA(0,1,2) with constant
(Q) ARIMA(1,1,2) with constant
Estimation Period
Model RMSE MAE MAPE ME MPE AIC
(D) 10,5734 7,8933 0,831363 2,25526E-11 -0,0108133 4,96669
(E) 10,2197 7,88696 0,830698 0,0514536 -0,00540694 4,77364
(F) 10,2203 7,88665 0,830667 0,0514592 -0,0054075 4,77374
(H) 12,2996 9,44614 0,990859 3,91358 0,398348 5,01913
(I) 12,8539 9,84298 1,03285 4,70361 0,483628 5,10729
(J) 11,3341 8,6281 0,909615 -1,41322 -0,162346 4,98063
(K) 13,0345 10,1667 1,06726 4,38306 0,450798 5,1352
(M) 9,97413 7,186 0,757683 -1,22956 -0,139387 4,84999
(N) 10,2754 6,99878 0,73836 -1,66801 -0,185027 5,03451
(O) 9,84537 6,01996 0,634457 -0,467139 -0,0579374 5,074
(P) 11,1833 7,84451 0,825349 0,403938 0,0314757 5,20384
(Q) 10,7199 7,13046 0,751947 -1,46817 -0,164197 5,24421
Πίνακας 31
37
Model RMSE RUNS RUNM AUTO MEAN VAR
(D) 10,5734 OK OK OK OK OK
(E) 10,2197 OK OK OK OK OK
(F) 10,2203 OK OK OK OK OK
(H) 12,2996 OK OK OK OK OK
(I) 12,8539 OK OK OK OK OK
(J) 11,3341 OK OK OK OK OK
(K) 13,0345 OK OK OK OK OK
(M) 9,97413 OK OK OK OK OK
(N) 10,2754 OK OK OK OK OK
(O) 9,84537 OK OK OK OK OK
(P) 11,1833 OK OK OK OK OK
(Q) 10,7199 OK OK OK OK OK
Πίνακας 32
Forecast Table for SELECT(total deaths;country=1)
Model: Exponential trend = exp(3,30308 + 0,00177432 t)
Period Data Forecast Residual
1994 932,6 935,497 -2,89708
1995 941,8 937,158 4,64157
1996 940,7 938,823 1,87728
1997 925,5 940,49 -14,99
1998 947,6 942,16 5,43981
1999 949,3 943,833 5,46663
2000 963,3 945,51 17,7905
2001 936,6 947,189 -10,5887
2002 945,8 948,871 -3,07076
2003 957,3 950,556 6,74414
2004 948,7 952,244 -3,54395
2005 941,2 953,935 -12,735
2006 941,5 955,629 -14,1291
2007 977,0 957,326 19,6738
2008 960,9 959,026 1,87366
2009 960,0 960,729 -0,729476
Lower 95,0% Upper 95,0%
Period Forecast Limit Limit
2010 962,436 936,859 988,71
2011 964,145 938,004 991,015
Πίνακας 33
38
Γράφημα 16
Σην γξάθεκα 16 κπνξνύκε λα δνύκε κε ηελ θόθθηλε γξακκή ην κνληέιν
καο , ελώ νη δύν θόθθηλέο γξακκέο πνπ είλαη πάλσ θαη θάησ από ηε γξακκή ηνπ
κνληέινπ αληηπξνζσπεύνπλ ηηο πηζαλέο απνθιίζεηο. Γεληθά αλακέλνπκε όηη γηα
ηνλ επόκελν ρξόλν νη ζάλαηνη ζηελ Διιάδα ζα είλαη πεξίπνπ 962,436 κε άλσ
όξην 988,71 θαη θάησ όξην 936,859, θάηη πνπ θαίλεηαη θαη απν ηνλ πίλαθα 33. Σε
απηό ην ζεκείν λα επηζεκάλνπκε όηη θαζώο έρνπκε 15 παξαηεξήζεηο κπνξνύκε
λα θάλνπκε πξόβιεςε γηα 15/10 ρξόληα δειαδή γηα ηα επόκελα 1,5 ρξόληα, άξα
ε πξνβιεπηηθή ηθαλόηεηα ηνπ κνληέινπ καο αλαθέξεηαη θπξίσο ζην 2010 , ελώ
βάδνπκε ηελ πξόβιεςε γηα ην 2011 κε πνιιέο επηθπιάμεηο, θαζώο δελ κπνξνύκε
λα βαζηζηνύκε ζε απηέο.
Time Sequence Plot for SELECT(total deaths;country=1)
Exponential trend = exp(3,30308 + 0,00177432 t)
1990 1994 1998 2002 2006 2010 2014
920
940
960
980
1000
SE
LE
CT
(to
tal d
ea
ths;c
ou
ntr
y=
1)
actual
forecast
95,0% limits
39
Γράφημα 17
Σην γξάθεκα 17 κπνξνύκε λα δνύκε πσο ζα θπκαλζνύλ νη ζάλαηνη ηνπο
κήλεο ηνπ 2010.Παξαηεξνύκε ινηπόλ όηη ππάξρεη κηα ζηαδηαθή αύμεζε ησλ
ζαλάησλ ζην πέξαζκα ηνπ ρξόλνπ.
Γράφημα 18
Σην γξάθεκα 18 βιέπνπκε όηη ε πξόβιεςε καο είλαη κέζα ζηα όξηα, άξα ε
πξόβιεςε καο είλαη απνδεθηή.
Forecast Plot for SELECT(total deaths;country=1)
Exponential trend = exp(3,30308 + 0,00177432 t)
2009 2009,4 2009,8 2010,2 2010,6 2011
930
950
970
990
1010
SE
LE
CT
(to
tal d
ea
ths;c
ou
ntr
y=
1)
actual
forecast
95,0% limits
Residual Partial Autocorrelations for SELECT(total deaths;country=1)
Exponential trend = exp(3,30308 + 0,00177432 t)
0 1 2 3 4 5 6
lag
-1
-0,6
-0,2
0,2
0,6
1
Pa
rtia
l A
uto
co
rre
latio
ns
40
υμπεράςματα
Ο αξηζκόο ησλ ζαλάησλ αλά 100.000 θαηνίθνπο ζηελ Διιεληθή επηθξάηεηα
απμάλεηαη κε έλαλ ξπζκό πνπ κπνξεί λα πεξηγξαθεί από ην κνληέιν:
Exponential trend = exp(3,30308 + 0,00177432 t)
Όκσο ν ξπζκόο απηόο δελ είλαη ν ίδηνο ζε θάζε γεσγξαθηθή πεξηνρή από
ηηο 13 πνπ κειεηήζακε. Δλδηαθέξνλ είρε ην γεγνλόο όηη εκθαλίζηεθαλ πνιύ
κεγάιεο αλάκεζα ζε πιεζπζκνύο πνπ αλακέλακε λα έρνπλ όκνηα θαηαλνκή. Γηα
παξάδεηγκα ν αξηζκόο ησλ ζαλάησλ ησλ θαηνίθσλ ηνπ Νόηηνπ Αηγαίνπ αλά
100.000 ήηαλ ν κηθξόηεξνο όιεο ηεο ρώξαο ελώ ζην άιιν άθξν ήηαλ ν αξηζκόο
ησλ ζαλάησλ αλά 100.000 ησλ θαηνίθσλ ηνπ Βνξείνπ Αηγαίνπ. Κάηη ηέηνην δελ
κπνξνύκε λα εμεγήζνπκε θαη απαηηείηαη πεξαηηέξσ έξεπλα γηα ηελ αλάιπζε ηνπ
ζέκαηνο.
Αθόκα από ηελ One-way Anova σο πξνο ηελ ρξνληά θαηαιήμακε πσο δελ
ππήξρε θάπνηα ρξνληά από ην δείγκα καο πνπ νη ζάλαηνη λα απνηεινύζαλ
μερσξηζηή θαηαλνκή θαη λα είραλ κηα κε αλακελόκελε ηηκή. Άιισζηε γηα ην
ρξνληθό δηάζηεκα ηνπ δείγκαηνο δελ ππήξμε θάπνην ηδηαίηεξα θαηαζηξνθηθό
γεγνλόο όπσο ηζρπξόο ζεηζκόο, πόιεκνο ή θάπνηα αζζέλεηα κε πςειό πνζνζηό
ζλεζηκόηεηαο πνπ λα κπνξνύζε λα απμήζεη δξακαηηθά ην πνζνζηό ησλ ζαλάησλ
εθείλεο ηεο ρξνληάο
41
Βιβλιογραφία
Black Ken, 2008, Business Statistics for Contemporary Decision Making,
Wiley Editions
Σεκεηώζεηο Μαζήκαηνο «Πνζνηηθέο Μέζνδνη γηα Λήςε Δπηρεηξεκαηηθώλ
Απνθάζεσλ»
Πεγή ησλ δεδνκέλσλ: Δπξσπατθή Σηαηηζηηθή ππεξεζία