ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ

51
ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ– ΠΑΡΑΡΤΗΜΑ ΦΛΩΡΙΝΑΣ ΣΧΟΛΗ ΤΕΧΝΟΛΟΓΙΑΣ ΓΕΩΠΟΝΙΑΣ ΤΜΗΜΑ ΕΜΠΟΡΙΑΣ ΚΑΙ ΠΟΙΟΤΙΚΟΥ ΕΛΕΓΧΟΥ ΑΓΡ.ΠΡΟΪΟΝΤΩΝ 2010 ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ Ι ΚΕΤΖΑΚΗ ΕΛΕΝΗ ΦΛΩΡΙΝΑ

Upload: giorgos88

Post on 27-Jul-2015

3.953 views

Category:

Documents


7 download

TRANSCRIPT

Page 1: ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙ∆ΕΥΤΙΚΟ Ι∆ΡΥΜΑ∆ΥΤΙΚΗΣ ΜΑΚΕ∆ΟΝΙΑΣ– ΠΑΡΑΡΤΗΜΑ ΦΛΩΡΙΝΑΣ ΣΧΟΛΗ ΤΕΧΝΟΛΟΓΙΑΣ ΓΕΩΠΟΝΙΑΣ

ΤΜΗΜΑ ΕΜΠΟΡΙΑΣ ΚΑΙ ΠΟΙΟΤΙΚΟΥ ΕΛΕΓΧΟΥ ΑΓΡ.ΠΡΟΪΟΝΤΩΝ

2010

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ Ι

ΚΕΤΖΑΚΗ ΕΛΕΝΗ

ΦΛΩΡΙΝΑ

Page 2: ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ Ι – ΚΕΤΖΑΚΗ ΕΛΕΝΗ

Τμήμα Εμπορίας και Ποιοτικού Ελέγχου Αγροτικών Προϊόντων, Φλώρινα 2010-2011

2

ΚΕΦΑΛΑΙΟ 1

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

1. ΕΙΣΑΓΩΓΗ

Η περιγραφική στατιστική ασχολείται με την οργάνωση, συγκέντρωση και την

περιγραφή ενός συνόλου δεδομένων. Στο παρόν κεφάλαιο θα δοθούν αρχικά οι

ορισμοί από βασικές έννοιες της περιγραφικής στατιστικής. Έπειτα θα οριστούν η

μέση τιμή, η διασπορά και άλλα στατιστικά μέτρα.

ΟΡΙΣΜΟΙ:

Πληθυσμός ονομάζεται το σύνολο των δεδομένων το οποίο μας απασχολεί.

Δείγμα ονομάζεται ένα μέρος του πληθυσμού.

Μεταβλητές ονομάζονται τα χαρακτηριστικά ως προς τα οποία εξετάζουμε τον

πληθυσμό.

Τιμές της μεταβλητής (xi) οι δυνατές τιμές που μπορεί να πάρει μια μεταβλητή.

Είδη μεταβλητών. Οι μεταβλητές διακρίνονται σε ποιοτικές και σε ποσοτικές.

Ποιοτικές είναι αυτές οι οποίες δεν περιγράφουν κάτι μετρήσιμο, για παράδειγμα το

φύλλο (Άνδρας ή Γυναίκα), η ομάδα αίματος κ.λπ.

Ποσοτικές είναι οι μεταβλητές είναι αυτές οι οποίες παίρνουν μόνο αριθμητικές τιμές.

Οι ποσοτικές μεταβλητές διακρίνονται σε δύο κατηγορίες διακριτές και συνεχείς. Οι

διακριτές είναι αυτές οι οποίες παίρνουν πεπερασμένο πλήθος τιμών (αποτελέσματα

ρίψης ζαριού) ενώ οι συνεχείς είναι αυτές οι οποίες μπορούν να πάρουν άπειρες τιμές

μέσα σε ένα διάστημα (πχ ύψος).

Για παράδειγμα αν εξετάζουμε το ύψος των φοιτητών, ο πληθυσμός είναι όλοι οι

φοιτητές. Το δείγμα το οποίο θα μπορούσαμε να πάρουμε είναι οι φοιτητές ενός

συγκεκριμένου τμήματος. Η μεταβλητή είναι το ύψος ενώ οι τιμές της μεταβλητής

είναι για παράδειγμα 1,65m ,1,90m κ.α

Page 3: ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ Ι – ΚΕΤΖΑΚΗ ΕΛΕΝΗ

Τμήμα Εμπορίας και Ποιοτικού Ελέγχου Αγροτικών Προϊόντων, Φλώρινα 2010-2011

3

Συχνότητα (vi) είναι ο φυσικός αριθμός ο οποίος δείχνει πόσες φορές εμφανίζεται η

τιμή xi της μεταβλητής που μελετάμε.

Ας υποθέσουμε ότι μελετάμε το φύλλο 10 φοιτητών. Συμβολίζεται με Κ κορίτσι και με

Α το αγόρι. Τα αποτελέσματα τα οποία καταγράφηκαν είναι τα ακόλουθα:

Κ, Α, Κ, Κ, Α, Α, Α, Α, Κ, Α.

Εύκολα διαπιστώνουμε ότι η συχνότητα των κοριτσιών είναι vκ =4, ενώ η συχνότητα

των αγοριών είναι vΑ = 6.

Αθροιστική Συχνότητα (Νi)

Ονομάζεται το άθροισμα των συχνοτήτων έως και την συχνότητα της i-παρατήρησης Ν = + + ⋯

Σχετική Συχνότητα (fi) είναι το πηλίκο της συχνότητας της i-παρατήρησης προς το

πλήθος των παρατηρήσεων. =

Αθροιστική Σχετική Συχνότητα (Fi)

Ονομάζεται το άθροισμα των συχνοτήτων έως και την σχετική συχνότητα της

i-παρατήρησης F = + + ⋯

Σχετική Συχνότητα επί τις εκατό (fi%)

% = ∙ 100%

ΙΔΙΟΤΗΤΕΣ ΤΗΣ ΣΧΕΤΙΚΗΣ ΣΥΧΝΟΤΗΤΑΣ

1. Η σχετική συχνότητα παίρνει τιμές από 0 έως 1. 0 ≤ ≤ 1

2.Ας υποθέσουμε ότι έχουμε κ-παρατηρήσεις x1, x2,…,xκ, οι οποίες εμφανίζονται με

συχνότητες ν1, ν2,…,νκ και σχετικές συχνότητες f1, f2,…,fκ αντίστοιχα.

Τότε ισχύει ότι f1+f2+…+fκ = 1

Απόδειξη f + f + ⋯ + f = + + ⋯ + = + + ⋯ = = 1

Page 4: ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ Ι – ΚΕΤΖΑΚΗ ΕΛΕΝΗ

Τμήμα Εμπορίας και Ποιοτικού Ελέγχου Αγροτικών Προϊόντων, Φλώρινα 2010-2011

4

2. ΕΦΑΡΜΟΓΗ ΣΕ ΠΟΙΟΤΙΚΕΣ ΜΕΤΑΒΛΗΤΕΣ

ΑΣΚΗΣΗ 1

Ένα δείγμα 25 ατόμων εξετάστηκε ως προς την ομάδα αίματος που έχει ο καθένας και

τα αποτελέσματα ήταν τα ακόλουθα

Α Β Β ΑΒ Ο

Ο Ο Β ΑΒ Β

Β Β Ο Α Ο

Α Ο Ο Ο ΑΒ

ΑΒ Α Ο Α Α

Να κατασκευαστεί πίνακας συχνοτήτων, σχετικών συχνοτήτων, αθροιστικών

συχνοτήτων και σχετικών αθροιστικών συχνοτήτων

Λύση Ομάδα

Αίματος

Διαλογή Συχνότητα

(vi)

Αθροιστική

Συχνότητα

(Ni)

Σχετική

Συχνότητα

(fi)

Αθροιστική

σχετική

συχνότητα

(Fi)

Σχετική

συχνότητα

(%)

(fi %)

Αθροιστική

Σχετική

συχνότητα

(Fi%)

A |||| | 6 6 0,24 0,24 24% 24%

B |||| | 6 12 0,24 0,48 24% 48%

AB |||| 4 16 0,16 0,64 16% 64%

O |||| |||| 9 25 0,36 1 36% 100% Σύνολο 25 1 100%

Ο παραπάνω πίνακας αποτελεί έναν πίνακα κατανομής συχνοτήτων και σχετικών

συχνοτήτων.

Η στήλη συχνότητας συμπληρώθηκε υπολογίζοντας πόσες φορές εμφανίστηκε κάθε

μια ομάδα αίματος. Εύκολα διαπιστώθηκε ότι η ομάδα αίματος Α εμφανίστηκε v1=6

φορές, η ομάδα αίματος Β εμφανίστηκε επίσης και αυτή v2=6 φορές, η ομάδα αίματος

ΑΒ συναντάται v3=4 φορές ενώ η ομάδα αίματος Ο καταμετρήθηκε v4=9 φορές.

Η στήλη αθροιστική συχνότητα συμπληρώθηκε ως εξής στην πρώτη γραμμή της

στήλης τοποθετήθηκε η συχνότητα εμφάνισης της πρώτης παρατήρησης (N1=6), στην

δεύτερη γραμμή της στήλης προστέθηκαν οι συχνότητες εμφάνισης της πρώτης αλλά

και της δεύτερης παρατήρησης (N2=ν1+ν2= 6+6=12), στην τρίτη γραμμή της στήλης

προστεθήκαν οι συχνότητες εμφάνισης της πρώτης, της δεύτερης και της τρίτης

παρατήρησης(N3=ν1+ν2+ ν3 =6+6+4=16),κ.ο.κ

Η στήλη σχετική συχνότητα προέκυψε διαιρώντας την συχνότητα την οποία έχει η

κάθε ομάδα αίματος προς το πλήθος των παρατηρήσεων επομένως η σχετική

συχνότητα για την ομάδα αίματος Α είναι = = , , ομοίως και για την ομάδα

αίματος Β, για την ομάδα αίματος ΑΒ η σχετική συχνότητα θα είναι = = , με

όμοιο τρόπο προκύπτει ότι η σχετική συχνότητα για την ομάδα αίματος Ο είναι = = , .

Η στήλη αθροιστική σχετική συχνότητα συμπληρώνεται ακριβώς με τον ίδιο τρόπο που

συμπληρώνεται και στήλη αθροιστική συχνότητα, απλά εδώ αθροίζεται η σχετική

συχνότητα και όχι η συχνότητα.

Page 5: ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ Ι

Τμήμα Εμπορίας και Ποιοτικού Ελέγχου Αγροτικών Προϊόντων, Φλώρινα 2010

Η στήλη σχετική συχνότητα %

σχετική συχνότητα επί 100, ώστε να προκύψουν τα αντίστοιχα ποσοστά.

3.ΓΡΑΦΗΜΑΤΑ ΤΑ ΟΠΟΙΑ ΑΦΟΡΟΥΝ ΠΟΙΟΤΙΚΕΣ ΜΕΤΑΒΛΗΤΕΣ

1. Ραβδόγραμμα

(Συχνοτήτων, Σχετικών Συχνοτήτων και Σχετικών Συχνοτήτων %)

Το ραβδόγραμμα αποτελείτε από ράβδους οι οποίες έχουν βάσεις ίσου

κάθε μία ράβδος θα αντιστοιχεί σε ένα είδος παρατήρησης το ύψος κάθε ράβδου

φανερώνει την συχνότητα ή την σχετική συχνότητα της παρατήρησης ανάλογα με

το είδος του γραφήματος.

Για παράδειγμα το ραβδόγραμμα συχνοτήτων της άσκησης

Ενώ το ραβδόγραμμα σχετικών συχνοτήτων είναι της άσκησης

Ανάλογα με την μεταβλητή που θα θεωρήσουμε να έχει ο κατακόρυφος

προκύπτει ραβδόγραμμα σχετικών συχνοτήτων, ραβδόγραμμα σχετικών συχνοτήτων

%, κ.ο.κ

0

5

10

15

20

25

συ

χνό

τητα

νi

0

5

10

15

20

25

σχε

τικ

ή σ

υχν

ότη

τα f

i

Ραβδόγραμμα σχετικών συχνοτήτων

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ Ι – ΚΕΤΖΑΚΗ ΕΛΕΝΗ

Τμήμα Εμπορίας και Ποιοτικού Ελέγχου Αγροτικών Προϊόντων, Φλώρινα 2010-2011

σχετική συχνότητα % προκύπτει πολλαπλασιάζοντας κάθε στοιχείο της στήλης

ητα επί 100, ώστε να προκύψουν τα αντίστοιχα ποσοστά.

ΓΡΑΦΗΜΑΤΑ ΤΑ ΟΠΟΙΑ ΑΦΟΡΟΥΝ ΠΟΙΟΤΙΚΕΣ ΜΕΤΑΒΛΗΤΕΣ

(Συχνοτήτων, Σχετικών Συχνοτήτων και Σχετικών Συχνοτήτων %)

Το ραβδόγραμμα αποτελείτε από ράβδους οι οποίες έχουν βάσεις ίσου

κάθε μία ράβδος θα αντιστοιχεί σε ένα είδος παρατήρησης το ύψος κάθε ράβδου

φανερώνει την συχνότητα ή την σχετική συχνότητα της παρατήρησης ανάλογα με

το είδος του γραφήματος.

Για παράδειγμα το ραβδόγραμμα συχνοτήτων της άσκησης 1 είναι το ακ

Ενώ το ραβδόγραμμα σχετικών συχνοτήτων είναι της άσκησης 1 είναι το ακόλουθο

Ανάλογα με την μεταβλητή που θα θεωρήσουμε να έχει ο κατακόρυφος

προκύπτει ραβδόγραμμα σχετικών συχνοτήτων, ραβδόγραμμα σχετικών συχνοτήτων

0 1 2 3

ομάδα αίματος

Ραβδόγραμμα Συχνοτήτων

0 1 2 3

ομάδα αίματος

Ραβδόγραμμα σχετικών συχνοτήτων

5

προκύπτει πολλαπλασιάζοντας κάθε στοιχείο της στήλης

ητα επί 100, ώστε να προκύψουν τα αντίστοιχα ποσοστά.

(Συχνοτήτων, Σχετικών Συχνοτήτων και Σχετικών Συχνοτήτων %)

Το ραβδόγραμμα αποτελείτε από ράβδους οι οποίες έχουν βάσεις ίσου μήκους,

κάθε μία ράβδος θα αντιστοιχεί σε ένα είδος παρατήρησης το ύψος κάθε ράβδου

φανερώνει την συχνότητα ή την σχετική συχνότητα της παρατήρησης ανάλογα με

είναι το ακόλουθο

1 είναι το ακόλουθο

Ανάλογα με την μεταβλητή που θα θεωρήσουμε να έχει ο κατακόρυφος άξονας

προκύπτει ραβδόγραμμα σχετικών συχνοτήτων, ραβδόγραμμα σχετικών συχνοτήτων

Page 6: ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ Ι

Τμήμα Εμπορίας και Ποιοτικού Ελέγχου Αγροτικών Προϊόντων, Φλώρινα 2010

2. Κυκλικό γράφημα

Για να κατασκευαστεί το κυκλικό γράφημα θα πρέπει να υπολογιστεί πόσες μοίρες

είναι ο κάθε κυκλικός τομέα που αντιστοιχεί σε κάθε τιμή της παρατήρησης. Ο τύπος ο

οποίος θα χρησιμοποιηθεί είναι ο ακόλουθος:

Το κυκλικό γράφημα το οποίο αντιστοιχεί στην άσκηση 1 είναι το ακόλουθο

3. ΕΦΑΡΜΟΓΗ ΣΕ ΠΟΣΟΤΙΚΕΣ ΜΕΤΑΒΛΗΤΕΣ

ΑΣΚΗΣΗ 2

Ένα δείγμα 40 φοιτητών εξετάστηκε ως προς τον αριθμό των αδερφ

καθένας και τα αποτελέσματα ήταν τα ακόλουθα

1 0 2 1

3 1 1 1

0 2 1 1

2 0 1 1

2 1 1 1

Να κατασκευαστεί πίνακας συχνοτήτων, σχετικών συχνοτήτων, αθροιστικών

συχνοτήτων και σχετικών αθροιστικών συχνοτήτων

Λύση

Στην συνέχεια θα κατασκευαστεί και θα συμπληρωθεί πίνακας συχνοτήτων

συχνοτήτων, κ.ο.κ Στην άσκηση 1 περιγράφηκε διεξοδικά ο τρόπος με τον οποίο

συμπληρώνεται ο πίνακας στις ασκήσεις που ακολουθούν απλά θα παρουσιάζεται ο

πίνακας συμπληρωμένος.

Λύση

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ Ι – ΚΕΤΖΑΚΗ ΕΛΕΝΗ

Τμήμα Εμπορίας και Ποιοτικού Ελέγχου Αγροτικών Προϊόντων, Φλώρινα 2010-2011

Κυκλικό γράφημα

Για να κατασκευαστεί το κυκλικό γράφημα θα πρέπει να υπολογιστεί πόσες μοίρες

είναι ο κάθε κυκλικός τομέα που αντιστοιχεί σε κάθε τιμή της παρατήρησης. Ο τύπος ο

οποίος θα χρησιμοποιηθεί είναι ο ακόλουθος: = 360" ∙ = 360" ∙

λικό γράφημα το οποίο αντιστοιχεί στην άσκηση 1 είναι το ακόλουθο

ΠΟΣΟΤΙΚΕΣ ΜΕΤΑΒΛΗΤΕΣ

Ένα δείγμα 40 φοιτητών εξετάστηκε ως προς τον αριθμό των αδερφ

καθένας και τα αποτελέσματα ήταν τα ακόλουθα

0 3 2 1

3 1 0 2

1 1 2 1

0 1 0 1

1 1 0 1

Να κατασκευαστεί πίνακας συχνοτήτων, σχετικών συχνοτήτων, αθροιστικών

συχνοτήτων και σχετικών αθροιστικών συχνοτήτων

Στην συνέχεια θα κατασκευαστεί και θα συμπληρωθεί πίνακας συχνοτήτων

συχνοτήτων, κ.ο.κ Στην άσκηση 1 περιγράφηκε διεξοδικά ο τρόπος με τον οποίο

συμπληρώνεται ο πίνακας στις ασκήσεις που ακολουθούν απλά θα παρουσιάζεται ο

πίνακας συμπληρωμένος.

0

20%

1

55%

2

17%

3

8%

Κυκλικό γράφημα

6

Για να κατασκευαστεί το κυκλικό γράφημα θα πρέπει να υπολογιστεί πόσες μοίρες

είναι ο κάθε κυκλικός τομέα που αντιστοιχεί σε κάθε τιμή της παρατήρησης. Ο τύπος ο

λικό γράφημα το οποίο αντιστοιχεί στην άσκηση 1 είναι το ακόλουθο

Ένα δείγμα 40 φοιτητών εξετάστηκε ως προς τον αριθμό των αδερφών που έχει ο

Να κατασκευαστεί πίνακας συχνοτήτων, σχετικών συχνοτήτων, αθροιστικών

Στην συνέχεια θα κατασκευαστεί και θα συμπληρωθεί πίνακας συχνοτήτων, σχετικών

συχνοτήτων, κ.ο.κ Στην άσκηση 1 περιγράφηκε διεξοδικά ο τρόπος με τον οποίο

συμπληρώνεται ο πίνακας στις ασκήσεις που ακολουθούν απλά θα παρουσιάζεται ο

Page 7: ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ Ι – ΚΕΤΖΑΚΗ ΕΛΕΝΗ

Τμήμα Εμπορίας και Ποιοτικού Ελέγχου Αγροτικών Προϊόντων, Φλώρινα 2010-2011

7

Αριθμός

Αδερφών

(Χi)

Διαλογή

Συχνότητα

(vi)

Αθροιστική

Συχνότητα

(Ni)

Σχετική

Συχνότητα

(fi)

Αθροιστική

σχετική

συχνότητα

(Fi)

Σχετική

συχνότητα

(%)

(fi %)

Αθροιστική

Σχετική

συχνότητα

(Fi%)

0

|||| ||| 8

8 0,20 0,20 20% 20%

1

|||| ||||

|||| ||||

||

22 30 0,55 0,75 55% 75%

2

|||| || 7 37 0,175 0,925 17,5% 92,5%

3

||| 3 40 0,075 1 7,5% 100%

Σύνολο 40 1 100%

Κατανομή συχνοτήτων της μεταβλητής Χ ενός δείγματος ονομάζεται το σύνολο των

ζευγών (x i, νi) για i = 1,2,…,k

Κατανομή σχετικών συχνοτήτων της μεταβλητής Χ ενός δείγματος ονομάζεται το

σύνολο των ζευγών (x i, fi) για i = 1,2,…,k.

Διάγραμμα κατανομής συχνοτήτων

0

5

10

15

20

25

0 1 2 3

vi

xi

Page 8: ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ Ι – ΚΕΤΖΑΚΗ ΕΛΕΝΗ

Τμήμα Εμπορίας και Ποιοτικού Ελέγχου Αγροτικών Προϊόντων, Φλώρινα 2010-2011

8

ΑΣΚΗΣΗ 3

Τα αποτελέσματα της κατάστασης 32 ασθενών δίνονται από τον παρακάτω πίνακα.

Να συμπληρωθεί ο πίνακας

Κατάσταση (xi) Συχνότητα (vi) Σx.Συχνότητα (fi)%

Άριστη 2

Πολύ Καλή 8

Καλή 13

Σχεδόν Καλή 25

Κακή

Σύνολο 32

Λύση

Είναι γνωστό ότι % = 100%

Επομένως θα ισχύει ότι #% = $%$ 100%

Άρα 25 = $%& ∙ 100 => # = )∙&"" = 8

Άρα το + = ,

Από θεωρία είναι γνωστό ότι + + & + # + ) = 32 ⇒ 2 + 8 + 13 + 8 + ) = 32 ⇒ 31 + ) = 32 ) = 32 − 31 = 1

Άρα + =

% = 100% = 232 100% = 6,25%

% = 100% = 832 100% = 25%

&% = & 100% = 1332 100% = 40,6%

)% = ) 100% = 132 100% = 3,125%

Επομένως ο πίνακας θα συμπληρωθεί ως εξής

Κατάσταση (xi) Συχνότητα (vi) Σx.Συχνότητα (fi)%

Άριστη 2 6,25

Πολύ Καλή 8 25

Καλή 13 40,6

Σχεδόν Καλή 8 25

Κακή 1 3,125

Σύνολο 32 100

Page 9: ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ Ι – ΚΕΤΖΑΚΗ ΕΛΕΝΗ

Τμήμα Εμπορίας και Ποιοτικού Ελέγχου Αγροτικών Προϊόντων, Φλώρινα 2010-2011

9

5. ΟΜΑΔΟΠΟΙΗΣΗ ΠΑΡΑΤΗΡΗΣΕΩΝ

Η ομαδοποίηση παρατηρήσεων είναι μια μέθοδος η οποία εφαρμόζεται όταν το

πλήθος των παρατηρήσεων είναι πάρα πολύ μεγάλο. Τότε χωρίζουμε τις

παρατηρήσεις σε κλάσεις έτσι ώστε κάθε τιμή να ανήκει σε μία μόνο κλάση.

Εύρος του δείγματος

Είναι η διαφορά της μεγαλύτερης τιμής από την μικρότερη τιμή των παρατηρήσεων

που μελετώνται.

R = Xmax - Xmin

Πλάτος της κλάσης

Έστω μια κλάση [α, β), πλάτος της κλάσης ονομάζεται η διαφορά C = β – α

Κέντρο της κλάσης

Έστω μια κλάση [α, β), κέντρο της κλάσης ονομάζεται ο αριθμός 234 .

6. ΕΦΑΡΜΟΓΗ ΣΕ ΟΜΑΔΟΠΟΙΗΜΕΝΑ ΔΕΔΟΜΕΝΑ

ΑΣΚΗΣΗ 4

Καταγράφηκαν οι εβδομαδιαίες αποδοχές υπαλλήλων μερικής απασχόλησης μιας

επιχείρησης, τα αποτελέσματα δίνονται στον πίνακα που ακολουθεί.

Αμοιβή σε ευρώ (€) Συχνότητα (vi)

[50,60) 8

[60,70) 10

[70,80) 16

[80,90) 14

[90,100) 10

[100,110) 5

[110,120) 2

Σύνολο 65

(i) Να κατασκευαστεί πίνακας συχνοτήτων και σχετικών συχνοτήτων για

ομαδοποιημένα δεδομένα

(ii) Τι ποσοστό των εργαζομένων είχε αποδοχές το πολύ 90 €;

(iii) Τι ποσοστό των εργαζομένων είχα αποδοχές πάνω από 100 €;

Λύση

Στην συγκεκριμένη άσκηση τα δεδομένα είναι ομαδοποιημένα σε 7 κλάσεις ίσου

πλάτους.

Η αθροιστική συχνότητα, η σχετική συχνότητα κ.λπ. έχουν υπολογιστεί με τον τρόπο ο

οποίος περιγράφηκε στην άσκηση 1.

Ο πίνακας που ακολουθεί περιέχει συνοπτικά τις απαντήσεις.

Page 10: ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ Ι – ΚΕΤΖΑΚΗ ΕΛΕΝΗ

Τμήμα Εμπορίας και Ποιοτικού Ελέγχου Αγροτικών Προϊόντων, Φλώρινα 2010-2011

10

Αμοιβή σε

ευρώ (€)

(xi)

Συχνότητα

(vi)

Αθροιστική

Συχνότητα

(Νi)

Σχετική

Συχνότητα

(fi)

Σχετική

Συχνότητα

(fi %)

Αθρ Σχετική

Συχνότητα

(Fi %)

[50,60) 8 8 0.123 12.3% 12.3%

[60,70) 10 18 0.153 15.3% 27.6%

[70,80) 16 34 0.246 24.6% 52.2%

[80,90) 14 48 0.215 21.5% 73.7%

[90,100) 10 58 0.153 15.3% 89%

[100,110) 5 63 0.07 7% 96%

[110,120) 2 56 0.04 4% 100%

Σύνολο 65 1 100%

(ii) To ποσοστό των εργαζομένων των οποίων οι αποδοχές είναι το πολύ μέχρι 90€

είναι το F4 = 73,7 %. Προκύπτει δηλαδή από την αθροιστική σχετική συχνότητα.

(iii) Το ποσοστό των εργαζομένων των οποίων οι αποδοχές είναι πάνω από 100€

προκύπτει αν προστεθούν τα ποσοστά των κλάσεων [100,110) και [110,120) δηλαδή

το 7% και το 4%. Επομένως το ποσοστό των εργαζομένων των οποίων οι εβδομαδιαίες

αποδοχές είναι πάνω από 100€ είναι 7+4=11%.

Παρατήρηση:

Για τα παραπάνω δεδομένα μπορούν να χρησιμοποιηθούν γραφήματα όπως

ιστόγραμμα συχνοτήτων (ή σχετικών συχνοτήτων), ιστόγραμμα αθροιστικών

συχνοτήτων (ή αθροιστικών σχετικών συχνοτήτων).

Η γραφική παράσταση του πίνακα συχνοτήτων για ομαδοποιημένα δεδομένα γίνεται

με το ιστόγραμμα συχνοτήτων ως εξής, στον οριζόντιο άξονα σημειώνονται τα όρια

των κλάσεων. Οι αποστάσεις ανάμεσα στις κλάσεις πρέπει να είναι ίσες μεταξύ τους.

Στην συνέχεια κατασκευάζουμε διαδοχικά ορθογώνια, καθένα από τα οποία έχει ύψος

την συχνότητα ή την σχετική συχνότητα κ.λπ. ανάλογα με τον τύπο του

ιστογράμματος. Χαρακτηριστικό παράδειγμα ιστογράμματος συχνοτήτων και

αθροιστικών συχνοτήτων είναι το ακόλουθο

vi

0

2

4

6

8

10

12

50 70 90

110

130

150

170

Fi

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1111

50 150 170 130 110 90 70

Page 11: ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ Ι – ΚΕΤΖΑΚΗ ΕΛΕΝΗ

Τμήμα Εμπορίας και Ποιοτικού Ελέγχου Αγροτικών Προϊόντων, Φλώρινα 2010-2011

11

7. ΑΡΙΘΜΗΤΙΚΑ ΠΕΡΙΓΡΑΦΙΚΑ ΜΕΤΡΑ

Τα αριθμητικά περιγραφικά μέτρα χωρίζονται σε τρεις κατηγορίες:

Α. Μέτρα κεντρικής τάσης (ή μέτρα θέσης) τα οποία είναι: (i) Δειγματική μέση τιμή

(ii) Διάμεσος

(iii)Επικρατούσα Τιμή

Β. Μέτρα μεταβλητότητας: (i) Εύρος

(ii) Διασπορά

(iii) Τυπική απόκλιση

(iv) Ποσοστιαία σημεία

(v) Συντελεστής Μεταβλητότητας

Γ. Μέτρα ασυμμετρίας: (i) Συντελεστής Λοξότητας

(ii) Συντελεστής Κύρτωσης

Α. ΜΕΤΡΑ ΚΕΝΤΡΙΚΗΣ ΤΑΣΗΣ

(i) ΔΕΙΓΜΑΤΙΚΗ ΜΕΣΗ ΤΙΜΗ (67)

Έστω ένα δείγμα n-παρατηρήσεων x1, x2,…,xn, ορίζεται ως δειγματική μέση τιμή

ονομάζεται η τιμή η οποία προκύπτει από τον παρακάτω τύπο

9 = ; 9<=

>

Έστω ένα δείγμα n-παρατηρήσεων x1, x2,…,xn, ας θεωρήσουμε ότι ν1, ν2,…,νn, είναι οι

συχνότητες που αντιστοιχούν σε κάθε μια από τις παραπάνω παρατηρήσεις, ορίζεται

ως δειγματική μέση τιμή ονομάζεται η τιμή η οποία προκύπτει από τον παρακάτω

τύπο

9 = ; 9<=

> ή 9 = ; =

> 9

Page 12: ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ Ι – ΚΕΤΖΑΚΗ ΕΛΕΝΗ

Τμήμα Εμπορίας και Ποιοτικού Ελέγχου Αγροτικών Προϊόντων, Φλώρινα 2010-2011

12

ΑΣΚΗΣΗ 5:

Μετρήθηκαν οι μεσημβρινές θερμοκρασίες κατά την διάρκεια 10 ημερών. Τα

αποτελέσματα συνοψίζονται στον πίνακα που ακολουθεί:

ΒΑΘΜΟΙ (0C) ΣΥΧΝΟΤΗΤΑ

13 2

14 1

15 4

16 2

18 1

ΣΥΝΟΛΟ 10

Να υπολογιστεί η μέση θερμοκρασία κατά την διάρκεια των δέκα ημερών

ΛΥΣΗ:

9 = ; 9<=

> = 2 ∙ 13 + 1 ∙ 14 + 4 ∙ 15 + 2 ∙ 16 + 1 ∙ 1810 = 15010 = 15

Επομένως η μέση θερμοκρασία είναι 15οC.

ΑΣΚΗΣΗ 6

Έστω μια συνεχής μεταβλητή της οποίας η συχνότητα έχει υπολογιστεί από τον

παρακάτω πίνακα.

Κλάσεις Συχνότητα(νi)

[10,20) 10

[20,30) 18

[30,40) 8

[40,50) 30

[50,60) 14

Σύνολο 80

Να υπολογιστεί η μέση τιμή της μεταβλητής .

ΛΥΣΗ

Όταν οι τιμές της μεταβλητής προέρχονται από συνεχή ποσοτικά δεδομένα τα οποία

είναι χωρισμένα σε κλάσεις πρέπει πρώτα να υπολογίσουμε για κάθε κλάση την

κεντρική τιμή και στην συνέχεια να υπολογίσουμε την μέση τιμή

Page 13: ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ Ι – ΚΕΤΖΑΚΗ ΕΛΕΝΗ

Τμήμα Εμπορίας και Ποιοτικού Ελέγχου Αγροτικών Προϊόντων, Φλώρινα 2010-2011

13

Κλάσεις Συχνότητα(νi) Κεντρική Τιμή (Κι)

[10,20) 10 15

[20,30) 18 25

[30,40) 8 35

[40,50) 30 45

[50,60) 14 55

Σύνολο 80

Υπενθυμίζουμε ότι οι κεντρικές τιμές αποτελούν το ημιάθροισμα των άκρων της

κλάσης. Δηλαδή @ = "3" = 15 @ = "3&" = 25 @& = &"3#" = 35 κ.ο.κ

9 = ; A<=

> = 10 ∙ 15 + 18 ∙ 25 + 8 ∙ 35 + 30 ∙ 45 + 14 ∙ 5580 =

= 150 + 450 + 280 + 1350 + 77080 = 37,5

Επομένως η μέση τιμή ισούται με 37,5.

(ii) ΔΙΑΜΕΣΟΣ (δ)

Έστω ένα δείγμα n-παρατηρήσεων x1, x2,…,xn, οι οποίες είναι διατεταγμένες σε

αύξουσα σειρά, ορίζεται ως διάμεσος η μεσαία παρατήρηση.

Ισχύει ότι

C = DEF=3 G, για < = περιττό12 PEF=G + EF=3 GQ , για < = άρτιοT

ΑΣΚΗΣΗ 7:

Να βρεθεί η διάμεσος των παρακάτω δεδομένων

(α) 3,4,0,6,5,8,1,1,6,1,2,8,9.

(β) 9, 3,4,0,6,5,8,1,1,6,1,2,8,9.

Λύση:

(α)Τα δεδομένα είναι 13 σε πλήθος, επομένως η διάμεσος θα είναι η

EFUVWUX G = E(Y), δηλαδή η 7η παρατήρηση εφόσον αυτές διαταχθούν σε αύξουσα

σειρά.

Page 14: ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ Ι – ΚΕΤΖΑΚΗ ΕΛΕΝΗ

Τμήμα Εμπορίας και Ποιοτικού Ελέγχου Αγροτικών Προϊόντων, Φλώρινα 2010-2011

14

Διατάσσοντας τις παρατηρήσεις σε αύξουσα σειρά προκύπτει:

0, 1, 1, 1, 2, 3, 4, 5, 6, 6, 8, 8, 9.

Από τις παραπάνω παρατηρήσεις η 7η παρατήρηση είναι η τιμή 4, επομένως θα ισχύει

ότι δ = 4.

(β)Τα δεδομένα είναι 14 σε πλήθος, επομένως η διάμεσος θα υπολογίζεται στην

περίπτωση του άρτιου πλήθους και θα ισούται με το ημιάθροισμα της 7ης

και της 8ης

παρατήρησης, εφόσον αυτές διαταχθούν σε αύξουσα σειρά.

Διατάσσοντας τις παρατηρήσεις σε αύξουσα σειρά προκύπτει:

0, 1, 1, 1, 2, 3, 4, 5, 6, 6, 8, 8, 9,9

Από τις παραπάνω παρατηρήσεις το ημιάθροισμα της 7ης

και της 8ης

παρατήρησης

είναι #3) = 4,5. Επομένως η διάμεσος θα είναι δ = 4,5.

(iii) Επικρατούσα Τιμή

Ονομάζεται η παρατήρηση η οποία εμφανίζεται με την μεγαλύτερη συχνότητα.

ΑΣΚΗΣΗ 8:

Να βρεθεί η επικρατούσα τιμή στον πίνακα συχνοτήτων που ακολουθεί

(xi) (vi)

1 5

2 10

3 7

4 9

Λύση

Εύκολα μπορεί να διαπιστωθεί ότι η επικρατούσα τιμή, δηλαδή αυτή η οποία έχει την

μεγαλύτερη συχνότητα είναι η x2 = 2.

Παρατήρηση:

Υπάρχει περίπτωση η επικρατούσα τιμή να μην είναι μοναδική, αν παρατηρηθεί ο

πίνακας που ακολουθεί διαπιστώνουμε ότι:

(xi) (vi)

1 8

2 10

4 9

6 10

η μεγαλύτερη συχνότητα παρατηρείται στις μεταβλητές x2 =2 και x4 =6, οι οποίες και οι

δύο εμφανίζονται με την μεγαλύτερη συχνότητα.

Page 15: ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ Ι – ΚΕΤΖΑΚΗ ΕΛΕΝΗ

Τμήμα Εμπορίας και Ποιοτικού Ελέγχου Αγροτικών Προϊόντων, Φλώρινα 2010-2011

15

Μέτρα Μεταβλητότητας

(i) Εύρος του δείγματος (R)

Στο εύρος του δείγματος έχουμε αναφερθεί προηγουμένως υπενθυμίζουμε τον

ορισμό.

Είναι η διαφορά της μεγαλύτερης τιμής από την μικρότερη τιμή των παρατηρήσεων

που μελετώνται.

R = Xmax - Xmin

(ii) Διακύμανση ή διασπορά (s2)

Έστω ότι έχουμε τις παρατηρήσεις t1, t2,…,tv. H διακύμανση ή διασπορά ορίζεται να

είναι ο μέσος όρος των τετραγώνων των αποκλίσεων των παρατηρήσεων ti, από την

δειγματική τους μέση τιμή 9. Υπολογίζεται κάνοντας χρήση των δύο τύπων παρακάτω

Z = 1 ;([ − x])$>

Ο παραπάνω τύπος χρησιμοποιείται στην περίπτωση που η μέση τιμή που δίνεται

είναι ακέραιος αριθμός, ενώ ο τύπος που ακολουθεί χρησιμοποιείται στην περίπτωση

που η μέση τιμή των παρατηρήσεων είναι δεκαδικός αριθμός.

Z = 1 ^; [ − (∑ [$> )$

> `

Σε περίπτωση που οι παρατηρήσεις που δίνονται t1, t2,…,tν, δεν εμφανίζονται μία

φορά η κάθε μία αλλά κάθε μια από αυτές έχουν συχνότητα εμφάνισης ν1, ν2,…,νν.

Τότε η διασπορά θα υπολογίζεται από τους τύπους που ακολουθούν.

Z = $ ∑ ([ − x])$> ∙ , αν η μέση τιμή x] είναι ακέραιος αριθμός και

Z = $ a∑ [ ∙ − (∑ bc$defgU )X$$> h, αν η μέση τιμή x] δεν είναι ακέραιος αριθμός.

(iii) Τυπική απόκλιση (s)

Η τυπική απόκλιση ορίζεται ως εξής Z = √Z

Page 16: ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ Ι – ΚΕΤΖΑΚΗ ΕΛΕΝΗ

Τμήμα Εμπορίας και Ποιοτικού Ελέγχου Αγροτικών Προϊόντων, Φλώρινα 2010-2011

16

(iii) Ποσοστιαία σημεία (Pk)

Το ποσοστιαίο σημείο Pk, ορίζεται η τιμή για την οποία το πολύ το κ% είναι

μικρότερες από αυτή και το (100-κ)% είναι μεγαλύτερες από αυτήν.

Τα βασικότερα ποσοστιαία σημεία είναι τα τεταρτημόρια (quartiles)

Q1= P25,

Q2= P50, (το οποίο είναι και η διάμεσος των παρατηρήσεων αφού η διάμεσος

είναι η τιμή η οποία έχει δεξιά και αριστερά της το 50% των παρατηρήσεων)

c= P75

Η ποσότητα Q= Q3- Q1. Ονομάζεται ενδοτεταρτημοριακό εύρος.

(iv) Συντελεστής Μεταβλητότητας (CV)

Είναι η ποσότητα η οποία δίνεται από τον ακόλουθο τύπο

jk = Z|9| 100%

Παρατήρηση:

Ένα δείγμα χαρακτηρίζεται ομοιογενές όταν ο CV δεν ξεπερνά τον 10%

ΑΣΚΗΣΗ 9:

Δύο ομάδες των 10 ατόμων συμμετείχαν σε ένα test ικανοτήτων, για το οποίο και

βαθμολογήθηκαν με άριστα το 20. Τα αποτελέσματα είναι τα ακόλουθα:

Ομάδα Α: 13,13,14,15,15,16,15,15,18,16

Ομάδα Β: 10,13,14,14,15,15,16,18,20,15

Να υπολογιστεί η μέση επίδοση κάθε ομάδας, ποια ομάδα είναι καλύτερη τι

συμπέρασμα προκύπτει;

Λύση

Για να υπολογιστεί η μέση επίδοση κάθε ομάδας θα υπολογίσουμε την μέση τιμή για

τις επιδόσεις που αφορούν κάθε μία ομάδα χωριστά.

Em]]] = 13 + 13 + 14 + 15 + 15 + 16 + 15 + 15 + 18 + 1610 = 15010 = 15

En]]]] = 10 + 13 + 14 + 14 + 15 + 15 + 16 + 18 + 20 + 1510 = 15010 = 15

Διαπιστώνουμε ότι και οι δύο ομάδες έχουν την ίδια μέση τιμή, επομένως με κριτήριο

την μέση τιμή δεν μπορούμε να συμπεράνουμε ποια από τις δύο έχει την καλύτερη

Page 17: ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ Ι – ΚΕΤΖΑΚΗ ΕΛΕΝΗ

Τμήμα Εμπορίας και Ποιοτικού Ελέγχου Αγροτικών Προϊόντων, Φλώρινα 2010-2011

17

επίδοση. Για να γίνει εφικτή η σύγκριση θα υπολογιστεί η διασπορά για κάθε μία

ομάδα χωριστά. Γνωρίζουμε ότι η διασπορά δίνεται από τον τύπο που ακολουθεί.

Z = 1 ;([ − x])$>

Το πλήθος των παρατηρήσεων είναι 10, άρα ν=10 και η x] = 15, επομένως θα ισχύει

Zm = 110 ;([ − 15)"> =

= 110 o(13 − 15) + (13 − 15)+(14 − 15)+(15 − 15)+ (15 − 15) + (16 − 15) + (15 − 15)+(15 − 15) + (18 − 15)+ (16 − 15)p = ⋯ = 2

Zn = 110 ;([ − 15)"> = 110 o(10 − 15) + (13 − 15)+(14 − 15)+(14 − 15)+ (15 − 15) + (15 − 15) + (16 − 15)+(18 − 15) + (20 − 15)+ (15 − 15)p = ⋯ = 6,6

Παρατηρούμε ότι η διακύμανση στην δεύτερη ομάδα είναι μεγαλύτερη από την

πρώτη επομένως, αν υποθέσουμε ότι μεγάλη διακύμανση ισοδυναμεί με κακή

επίδοση τότε καλύτερα τα πήγε η πρώτη ομάδα.

ΆΣΚΗΣΗ 10

Μία εταιρία Α έχει μέσο κέρδος (σε €)από πωλήσεις Em]]] = 300000 & qr = 45000 και

μία εταιρία Β έχει μέσο κέρδος (σε €)από πωλήσεις En]]]] = 130000 & qn = 96000. Να

εξεταστεί σε ποια από τις δύο εταιρίες υπάρχει μεγαλύτερη ανομοιογένεια στον

τρόπο με τον οποίο λαμβάνονται τα κέρδη.

Λύση

Για την εταιρία Α ισχύει jkm = Zm|9m| 100% = 45000300000 100% = 15%

Για την εταιρία Β ισχύει jkn = Zn|9n| 100% = 13000026000 100% = 20%

Επομένως διαπιστώνουμε ότι η σχετική διασπορά των κερδών είναι μεγαλύτερη

στην Β εταιρία, άρα συγκριτικά υπάρχει μεγαλύτερη ομοιογένεια στον τρόπο με τον

οποίο λαμβάνονται τα κέρδη από την εταιρία Α.

Page 18: ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ Ι – ΚΕΤΖΑΚΗ ΕΛΕΝΗ

Τμήμα Εμπορίας και Ποιοτικού Ελέγχου Αγροτικών Προϊόντων, Φλώρινα 2010-2011

18

ΆΣΚΗΣΗ 11

Ρωτήθηκαν 60 άτομα για τις ώρες που βλέπουν τηλεόραση κατά την διάρκεια μιας

εβδομάδας και τα αποτελέσματα είναι τα ακόλουθα

Ώρες

(χι) 3 4 5 6 7 8 9 10 11 12

Άτομα

(νι) 1 2 2 4 7 11 17 10 4 2

Να κατασκευαστεί πίνακας συχνοτήτων και να υπολογιστούν η μέση τιμή, η

διασπορά και η τυπική απόκλιση.

Λύση

Σε περίπτωση που χρειάζεται να υπολογίσουμε μέση τιμή, διασπορά και τυπική

απόκλιση πρέπει να συμπληρωθεί ο ακόλουθος πίνακας

Ώρες

(χι)

Άτομα

(νι)

Αθ.

Συχνοτ.

(Νι)

Σχ. Συχνοτ.

(fi)

Σχ. Συχνοτ.

(fi%)

(tu)

(tu) ∙ +u tu ∙ +u 3 1 1 0,016 1,6% 9 9 3

4 2 3 0,033 3,3% 16 32 8

5 2 5 0,048 4,8% 25 50 10

6 4 9 0,064 6,4% 36 144 24

7 7 16 0,112 11,2% 49 343 49

8 11 27 0,176 17,6% 64 704 81

9 17 44 0,272 27,2% 81 1377 153

10 10 54 0,16 16% 100 1000 100

11 4 58 0,064 6,4% 121 484 44

12 2 60 0,033 3,3% 144 288 24

Σύνολο 60 1 100% ∑ (tu)+uv> =

∑ tu ∙ +u">

=496

Η μέση τιμή θα είναι ίση με w = ∑ tu ∙ +u10x=1 = 49660 = 8,26

Δεδομένου ότι η μέση τιμή είναι δεκαδικός αριθμός η διασπορά θα υπολογίζεται

από τον ακόλουθο τύπο

Z = 1 ^; w ∙ − (∑ w$> )$

> ` = 160 P4431 − 496260 Q = 55,16

Ο συντελεστής μεταβλητότητας (CV) ισούται με

jk = Z|9| 100% = y55,168,26 100% = 89,9%

Επομένως το δείγμα δεν είναι ομοιογενές διότι 89,9% > 10%.

Page 19: ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ Ι – ΚΕΤΖΑΚΗ ΕΛΕΝΗ

Τμήμα Εμπορίας και Ποιοτικού Ελέγχου Αγροτικών Προϊόντων, Φλώρινα 2010-2011

19

ΘΕΩΡΗΜΑ

(α) Έστω ένα δείγμα n-παρατηρήσεων x1, x2,…,xn οι οποίες έχουν μέση τιμή 9 και

τυπική απόκλιση Sx. Ας υποθέσουμε ότι c=σταθερά τέτοια ώστε y1 = x1+c, y2 = x2+c,. . . ,

yn = xn+c,

Να αποδείξετε ότι Sx= Sy, αν γνωρίζετε ότι. z] = 9 +

(β) Έστω ένα δείγμα n-παρατηρήσεων x1, x2,…,xn οι οποίες έχουν μέση τιμή 9 και

τυπική απόκλιση Sx. Ας υποθέσουμε ότι c=σταθ. τέτοια ώστε y1 =cx1, y2 =cx2,...,yn =c xn,

Να αποδείξετε ότι z] = 9, αν γνωρίζετε ότι Sy. =|c|Sx

Αποδείξεις:

(α)

Στον τύπο της διασποράς αντικαθιστούμε τα yi = xi+c και το z] = 9 + οπότε προκύπτει

| = (z − z]) + (z − z]) + ⋯ + (z= − z])< =

= (9 + − z]) + (9 + − z]) + ⋯ + (9= + − z])< =

= (9 + − 9 − ) + (9 + − 9 − ) + ⋯ + (9= + − 9 − )< =

= (9 − 9) + (9 − 9) + ⋯ + (9= − 9)< = |6

Επομένως Sx=Sy.

(b)

Στον τύπο της διασποράς αντικαθιστούμε τα yi = cxi και το z] = 9]]] οπότε προκύπτει

| = (z − z]) + (z − z]) + ⋯ + (z= − z])< =

= (9 − z]) + (9 − z]) + ⋯ + (9= − z])< =

= (9 − 9) + (9 − 9) + ⋯ + (9= − 9)< =

= (9 − 9) + (9 − 9) + ⋯ + (9= − 9)< = |6

Επομένως Sy=|c|Sx.

Page 20: ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ Ι – ΚΕΤΖΑΚΗ ΕΛΕΝΗ

Τμήμα Εμπορίας και Ποιοτικού Ελέγχου Αγροτικών Προϊόντων, Φλώρινα 2010-2011

20

ΆΣΚΗΣΗ 12

Η μέση τιμή των παρατηρήσεων 1, 2, 4, 2, 3, 2x, x+2, 3, 4 είναι 5. Να βρείτε το

εύρος, την διάμεσο, την τυπική απόκλιση και τον συντελεστή μεταβλητότητας των

παρατηρήσεων.

Λύση

Η μέση τιμή θα δίνεται από τον τύπο

9 = ; 9<=

> = 1 + 2 + 4 + 2 + 3 + 2x + ( x + 2) + 3 + 49 = 5 21 + 3x9 = 5

21+3x=45

3x=45-21

3x=24

x=8

Επομένως αν αντικατασταθεί το x=8 οι παρατηρήσεις θα είναι οι ακόλουθες:

1, 2, 4, 2, 3, 16, 10, 3, 4

Το εύρος των παρατηρήσεων είναι

R = Xmax - Xmin = 16-1 = 15

Για να βρεθεί η διάμεσος θα πρέπει πρώτα οι παρατηρήσεις να διαταχθούν σε

αύξουσα σειρά 1, 2, 2, 3, 3, 4, 4, 10, 16. Το πλήθος των παρατηρήσεων είναι 9

επομένως η διάμεσος θα είναι η 5η σε σειρά παρατήρηση, δηλαδή η τιμή 3.

Η διακύμανση δίνεται από τον τύπο Z = ~ ∑ (w − x]) =~> ~ o(1 − 5) + (2 − 5) + (2 − 5) + (3 − 5) + (3 − 5) +4−52+4−52+10−52+16−52 =…=21,11

Η τυπική απόκλιση θα είναι ίση με Z = yZ = y21,11 = 4,59

Ο συντελεστής μεταβλητότητας (CV) θα ισούται με jk = Z|9| 100% = 4,565 100% = 91,8% ≫ 10%

Επομένως το δείγμα δεν είναι ομοιογενές.

Page 21: ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ Ι – ΚΕΤΖΑΚΗ ΕΛΕΝΗ

Τμήμα Εμπορίας και Ποιοτικού Ελέγχου Αγροτικών Προϊόντων, Φλώρινα 2010-2011

21

ΆΣΚΗΣΗ 13

Μελετήθηκε ένα δείγμα 100 ατόμων τα οποία προσβλήθηκαν κατά την διάρκεια

μιας επιδημίας από έναν συγκεκριμένου τύπου ιό, ως προς την ηλικία των ατόμων και

τα αποτελέσματα είναι τα ακόλουθα

Ηλικία [0,10) [10,20) [20,30) [30,40) [40,50) [50,60) [60,70) [70,80) [80,90)

Συχνότητα 14 1 2 5 6 17 15 21 19

(α) Να συμπληρωθούν οι πίνακες συχνοτήτων και σχετικών συχνοτήτων

(β)Να υπολογιστεί η μέση τιμή, η διασπορά, η τυπική απόκλιση, ο συντελεστής

μεταβλητότητας και η διάμεσος των παρατηρήσεων.

Λύση

(α) Ηλικία

(xi)

Συχνότητα

(νi)

Αθρ.

Συχνοτ.

(Νι)

Σχετ.

Συχνοτ.

(fi)

Σχ.

Συχνοτ.

(fi%)

Αθρ.Σχ.

Συχνοτ.

(Fi%)

u

u

u ∙ +u

u ∙ +u [0,10) 14 14 0,14 14% 14% 5 25 350 70

[10,20) 1 15 0,01 1% 15% 15 225 225 15

[20,30) 2 17 0,02 2% 17% 25 625 1250 50

[30,40) 5 22 0,05 5% 22% 35 1225 6125 175

[40,50) 6 28 0,06 6% 28% 45 2025 12150 270

[50,60) 17 45 0,17 17% 45% 55 3025 51425 935

[60,70) 15 60 0,15 15% 60% 65 4225 63375 975

[70,80) 21 81 0,21 21% 81% 75 5625 118125 1575

[80,90) 19 100 0,19 19% 100% 85 7225 137275 1615

Σύνολο 100 1 100% 390300 5740

(β) Η μέση τιμή είναι 9 = ∑ d$d==> = )Y#""" = 57,4

Η διασπορά ισούται με Z = $ a∑ A ∙ − (∑ c$defgU )X$$> h = "" a390300 − 57402100 h ="" o390300 − 329476p = "#"" = 608,24

Άρα η τυπική απόκλιση είναι Z = √Z = √608,24 = 24.66

Ο συντελεστής μεταβλητότητας είναι jk = Z|9| 100% = 24,6657,4 100% = 42,9% ≫ 10%

Επομένως το δείγμα δεν είναι ομοιογενές.

Η διάμεσος είναι στην κλάση όπου βρίσκεται το 50% των παρατηρήσεων και είναι η

τιμή 65.

Page 22: ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ Ι – ΚΕΤΖΑΚΗ ΕΛΕΝΗ

Τμήμα Εμπορίας και Ποιοτικού Ελέγχου Αγροτικών Προϊόντων, Φλώρινα 2010-2011

22

Μέτρα ασυμμετρίας

Η ροπή r-τάξης δίνεται από τον ακόλουθο τύπο = = ∑ (9 − 9)=>

(i) Συντελεστής Λοξότητας

Θα ονομάζεται η ποσότητα & = &Z&

Διακρίνουμε περιπτώσεις αν & > 0 τότε οι παρατηρήσεις βρίσκονται δεξιά της

επικρατούσας τιμής

αν & < 0 τότε οι παρατηρήσεις βρίσκονται αριστερά της

επικρατούσας τιμής

(ii) Συντελεστής Κύρτωσης

Θα ονομάζεται η ποσότητα # = #Z#

Διακρίνουμε περιπτώσεις αν # > 3 τότε η κατανομή θα λέγεται λεπτόκυρτη

αν # < 3 τότε η κατανομή θα λέγεται πλατύκυρτη.

Κανονική κατανομή Θετική Λοξότητα & > 0 αρνητική Λοξότητα & < 0

Κανονική κατανομή Λεπτόκυρτη κατανομή Πλατύκυρτη κατανομή

Page 23: ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ Ι – ΚΕΤΖΑΚΗ ΕΛΕΝΗ

Τμήμα Εμπορίας και Ποιοτικού Ελέγχου Αγροτικών Προϊόντων, Φλώρινα 2010-2011

23

Ασκήσεις κατανόησης:

ΑΣΚΗΣΗ 14

Στον πίνακα που ακολουθεί δίνεται η βαθμολογία σε ένα τεστ δεξιοτήτων, το οποίο

βαθμολογούνταν με άριστα 100.

Να κατασκευαστεί πίνακας συχνοτήτων, σχετικών συχνοτήτων κ.λπ. καθώς και

ιστόγραμμα συχνοτήτων.

Βαθμολογία Μαθητών (xi) Συχνότητα (νi)

[0,10) 4

[10,20) 4

[20,30) 15

[30,40) 22

[40,50) 45

[50,60) 48

[60,70) 30

[70,80) 12

[80,90) 10

[90,100) 10

ΑΣΚΗΣΗ 15

Στον πίνακα που ακολουθεί δίνεται η διάρκεια ζωής λαμπτήρων σε ώρες

(α) Να κατασκευαστεί πίνακας συχνοτήτων, σχετικών συχνοτήτων κ.λπ. καθώς και

ιστόγραμμα συχνοτήτων.

(β) Να υπολογιστεί η μέση τιμή και η διασπορά.

Βαθμολογία Μαθητών (xi) Συχνότητα (νi)

[300,400) 4

[400,500) 9

[500,600) 11

[600,700) 6

[700,800) 15

[800,900) 25

[900,1000) 10

[1000,1100) 15

[1100,1200) 5

Σύνολο 100

Page 24: ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ Ι

Τμήμα Εμπορίας και Ποιοτικού Ελέγχου Αγροτικών Προϊόντων, Φλώρινα 2010

ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΙΣΗ

1.ΕΙΣΑΓΩΓΗ

Στην συγκεκριμένη ενότητα θα ασχοληθούμε με την ταυτόχρονη μελέτη δύο ή

περισσότερων μεταβλητών, με σκοπό να προσδιορίσουμε με ποιο τρόπο οι μεταβλητές αυτέ

σχετίζονται μεταξύ τους. Ο κλάδος της στατιστικής ο οποίος εξετάζει την σχέση μεταξύ δύ

περισσότερων μεταβλητών με σκοπό την πρόβλεψη μίας από αυτές μέσω των άλλων

ονομάζεται ανάλυση παλινδρόμησης

Η απλούστερη περίπτωση της ανάλυσης παλινδρόμησης είναι η απλή γραμμική

παλινδρόμηση.

2. ΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΙΣΗ

Στην απλή γραμμική παλινδ

οποία ονομάζεται ανεξάρτητη μεταβλητή και η μεταβλητή Υ

μεταβλητή. Η τιμή της εξαρτημένης μεταβλητής Υ μπορεί να προσεγγιστεί από μία γραμμική

συνάρτηση του Χ. Σκοπός μα

συνδέει τις δύο μεταβλητές.

Αρχικά θα περιγραφεί η έννοια του διαγράμματος διασποράς και στην συνέχεια η ευθεία

γραμμικής παλινδρόμησης έτσι ώστε να γίνει κατανοητή η

ΠΑΡΑΔΕΙΓΜΑ

Ας υποθέσουμε ότι έχουμε δύο μεταβλητές η μεταβλητή Χ αφορά τις ώρες ποτίσματος μιας

καλλιέργειας σιτηρών και η μεταβλητή Υ αφορά τους τόνους σιτηρών που θα παραχθούν από

την συγκεκριμένη καλλιέργεια. Τα αποτελέσματα περιγράφονται στον πίνακα που ακολουθεί.

Το διάγραμμα διασποράς των μεταβλητών Χ, Υ είναι το ακόλουθο

0

5

10

15

0

Y

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ Ι – ΚΕΤΖΑΚΗ ΕΛΕΝΗ

Τμήμα Εμπορίας και Ποιοτικού Ελέγχου Αγροτικών Προϊόντων, Φλώρινα 2010-2011

ΚΕΦΑΛΑΙΟ

ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΙΣΗ

Στην συγκεκριμένη ενότητα θα ασχοληθούμε με την ταυτόχρονη μελέτη δύο ή

περισσότερων μεταβλητών, με σκοπό να προσδιορίσουμε με ποιο τρόπο οι μεταβλητές αυτέ

σχετίζονται μεταξύ τους. Ο κλάδος της στατιστικής ο οποίος εξετάζει την σχέση μεταξύ δύ

περισσότερων μεταβλητών με σκοπό την πρόβλεψη μίας από αυτές μέσω των άλλων

ανάλυση παλινδρόμησης.

Η απλούστερη περίπτωση της ανάλυσης παλινδρόμησης είναι η απλή γραμμική

2. ΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΙΣΗ

Στην απλή γραμμική παλινδρόμηση χρησιμοποιούνται δύο μεταβλητές. Η μεταβλητή Χ η

οποία ονομάζεται ανεξάρτητη μεταβλητή και η μεταβλητή Υ, η οποία ονομάζεται εξαρτημένη

μεταβλητή. Η τιμή της εξαρτημένης μεταβλητής Υ μπορεί να προσεγγιστεί από μία γραμμική

Σκοπός μας θα είναι να προσδιοριστεί η γραμμική συσχέτιση η οποία

.

Αρχικά θα περιγραφεί η έννοια του διαγράμματος διασποράς και στην συνέχεια η ευθεία

γραμμικής παλινδρόμησης έτσι ώστε να γίνει κατανοητή η εφαρμογή της.

θέσουμε ότι έχουμε δύο μεταβλητές η μεταβλητή Χ αφορά τις ώρες ποτίσματος μιας

καλλιέργειας σιτηρών και η μεταβλητή Υ αφορά τους τόνους σιτηρών που θα παραχθούν από

την συγκεκριμένη καλλιέργεια. Τα αποτελέσματα περιγράφονται στον πίνακα που ακολουθεί.

Υ Χ

2 1

5 3

6 5

7 7

10 8

11 9

Το διάγραμμα διασποράς των μεταβλητών Χ, Υ είναι το ακόλουθο

5 10 15 20

X

24

ΚΕΦΑΛΑΙΟ 2

ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΙΣΗ

Στην συγκεκριμένη ενότητα θα ασχοληθούμε με την ταυτόχρονη μελέτη δύο ή

περισσότερων μεταβλητών, με σκοπό να προσδιορίσουμε με ποιο τρόπο οι μεταβλητές αυτέ

σχετίζονται μεταξύ τους. Ο κλάδος της στατιστικής ο οποίος εξετάζει την σχέση μεταξύ δύο ή

περισσότερων μεταβλητών με σκοπό την πρόβλεψη μίας από αυτές μέσω των άλλων

Η απλούστερη περίπτωση της ανάλυσης παλινδρόμησης είναι η απλή γραμμική

ρόμηση χρησιμοποιούνται δύο μεταβλητές. Η μεταβλητή Χ η

ονομάζεται εξαρτημένη

μεταβλητή. Η τιμή της εξαρτημένης μεταβλητής Υ μπορεί να προσεγγιστεί από μία γραμμική

ς θα είναι να προσδιοριστεί η γραμμική συσχέτιση η οποία

Αρχικά θα περιγραφεί η έννοια του διαγράμματος διασποράς και στην συνέχεια η ευθεία

θέσουμε ότι έχουμε δύο μεταβλητές η μεταβλητή Χ αφορά τις ώρες ποτίσματος μιας

καλλιέργειας σιτηρών και η μεταβλητή Υ αφορά τους τόνους σιτηρών που θα παραχθούν από

την συγκεκριμένη καλλιέργεια. Τα αποτελέσματα περιγράφονται στον πίνακα που ακολουθεί.

20

Page 25: ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ Ι

Τμήμα Εμπορίας και Ποιοτικού Ελέγχου Αγροτικών Προϊόντων, Φλώρινα 2010

Το διάγραμμα διασποράς προκύπτει αν σχεδιάσουμε στους άξονες συντεταγμένων τα

σημεία με συντεταγμένες τις τιμές

μπορεί να διαπιστωθεί ότι τα σημεία είναι συγκεντρωμένα γύρω από μία ευθεία

γραμμή, όπως φαίνεται και στο επόμενο σχήμα.

υπάρχει γραμμική συσχέτιση μεταξύ των δύο μεταβλητών.

παλινδρόμησης είναι να βρεθεί η εξίσωση αυτής της ευθείας.

Όπως γνωρίζουμε η εξίσωση μίας ευθείας δίνεται από την σχέση

Όπου α, β είναι παράμετροι τις οποίες πρέπει να εκτιμηθούν ώστε να προκύψει η

ευθεία ε. Η μέθοδος η οποία θα χρησιμοποιηθεί για την εκτίμηση τους ονομάζεται

μέθοδος ελαχίστων τετραγώνων. Σύμφωνα με την μέθοδο αυτήν ισχύει

Και

Θα κάνουμε εφαρμογή των παραπάνω τύπων στα

να γίνει κάτι τέτοιο θα πρέπει να συμπληρωθεί ο ακόλουθος πίνακας.

Υ

2

5

6

7

10

11 ; z = 41

0

2

4

6

8

10

12

14

0

Y

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ Ι – ΚΕΤΖΑΚΗ ΕΛΕΝΗ

Τμήμα Εμπορίας και Ποιοτικού Ελέγχου Αγροτικών Προϊόντων, Φλώρινα 2010-2011

Το διάγραμμα διασποράς προκύπτει αν σχεδιάσουμε στους άξονες συντεταγμένων τα

σημεία με συντεταγμένες τις τιμές τις αντίστοιχες τιμές των μεταβλητών Χ, Υ. Εύκολα

μπορεί να διαπιστωθεί ότι τα σημεία είναι συγκεντρωμένα γύρω από μία ευθεία

γραμμή, όπως φαίνεται και στο επόμενο σχήμα. Γεγονός το οποίο φανερώνει ότι

υπάρχει γραμμική συσχέτιση μεταξύ των δύο μεταβλητών. Σκοπός της γραμμικής

παλινδρόμησης είναι να βρεθεί η εξίσωση αυτής της ευθείας.

Όπως γνωρίζουμε η εξίσωση μίας ευθείας δίνεται από την σχέση

Υ= βΧ + α

Όπου α, β είναι παράμετροι τις οποίες πρέπει να εκτιμηθούν ώστε να προκύψει η

ποία θα χρησιμοποιηθεί για την εκτίμηση τους ονομάζεται

μέθοδος ελαχίστων τετραγώνων. Σύμφωνα με την μέθοδο αυτήν ισχύει

= < ∑ 9z − (∑ 9=> )(∑ z=> )=>< ∑ 9 − (∑ 9=> )=>

= z] − 9

Θα κάνουμε εφαρμογή των παραπάνω τύπων στα δεδομένα του παραδείγματος, για

να γίνει κάτι τέτοιο θα πρέπει να συμπληρωθεί ο ακόλουθος πίνακας.

Χ Χ2

1 1

3 9

5 25

7 49

8 64

9 81 ; = 33 ; Χ = 229

5 10 15

X

25

Το διάγραμμα διασποράς προκύπτει αν σχεδιάσουμε στους άξονες συντεταγμένων τα

τις αντίστοιχες τιμές των μεταβλητών Χ, Υ. Εύκολα

μπορεί να διαπιστωθεί ότι τα σημεία είναι συγκεντρωμένα γύρω από μία ευθεία

Γεγονός το οποίο φανερώνει ότι

Σκοπός της γραμμικής

Όπου α, β είναι παράμετροι τις οποίες πρέπει να εκτιμηθούν ώστε να προκύψει η

ποία θα χρησιμοποιηθεί για την εκτίμηση τους ονομάζεται

μέθοδος ελαχίστων τετραγώνων. Σύμφωνα με την μέθοδο αυτήν ισχύει

δεδομένα του παραδείγματος, για

να γίνει κάτι τέτοιο θα πρέπει να συμπληρωθεί ο ακόλουθος πίνακας.

ΥΧ

2

15

30

49

80

99 ; = 275

20

Page 26: ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ Ι

Τμήμα Εμπορίας και Ποιοτικού Ελέγχου Αγροτικών Προϊόντων, Φλώρινα 2010

= < ∑ 9z − (∑ 9=>=>< ∑ 9 − (∑==>

Για να υπολογιστεί το θα πρέπει αρχικά να υπολογιστεί το

Ισχύει ότι 9 = ∑ = = && =Επομένως = z] − 9 =

Η ευθεία επομένως ελαχίστων

ΑΣΚΗΣΗ 1

Ο παρακάτω πίνακας δίνει τα τεμάχια πώλησης ενός προϊόντος

καθώς και τις αντίστοιχες

(α) Να γίνει διάγραμμα διασποράς και να βρεθεί η ευθεία ελαχίστων τετραγώνων

(β) Ποια θα είναι η αναμενόμενη ζήτηση όταν μία τηλεόραση κοστίζει 800

(γ) Αν θέλουμε να πωληθούν σε ένα κατ

είναι το κόστος κάθε μίας από

Λύση

Το διάγραμμα διασποράς είναι το ακόλουθο

0

2

4

6

8

10

12

14

16

0 2τεμ

άχι

α τ

α ο

πο

ία π

ωλ

ήθ

ηκ

αν

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ Ι – ΚΕΤΖΑΚΗ ΕΛΕΝΗ

Τμήμα Εμπορίας και Ποιοτικού Ελέγχου Αγροτικών Προϊόντων, Φλώρινα 2010-2011

9)(∑ z=> )( 9=> ) = 6 ∙ 275 − 33 ∙ 416 ∙ 229 − 33 = ⋯ = 10.24 θα πρέπει αρχικά να υπολογιστεί το 9 και το = 5,5 και επιπλέον z] = ∑ z= = # = 6.83 6,83 − 10,24 ∙ 5,5 = 1,099

Η ευθεία επομένως ελαχίστων τετραγώνων θα είναι

Y=1.099+1.042X

Ο παρακάτω πίνακας δίνει τα τεμάχια πώλησης ενός προϊόντος (τηλεόραση

καθώς και τις αντίστοιχες τιμές /τεμάχιο του προϊόντος σε εκατοντάδες

Υ Χ

5 15

6 13

8 11

10 9

9 9

12 6

15 5

11 4

(α) Να γίνει διάγραμμα διασποράς και να βρεθεί η ευθεία ελαχίστων τετραγώνων

(β) Ποια θα είναι η αναμενόμενη ζήτηση όταν μία τηλεόραση κοστίζει 800

(γ) Αν θέλουμε να πωληθούν σε ένα κατάστημα 10 τηλεοράσεις πόσο θα πρέπει να

είναι το κόστος κάθε μίας από αυτές;

Το διάγραμμα διασποράς είναι το ακόλουθο

2 4 6 8 10 12 14

Τιμή τηλεόρασης σε εκατοντάδες ευρώ/τεμάχιο

26

24

y].

(τηλεόραση LCD) (Υ)

εκατοντάδες € (Χ).

(α) Να γίνει διάγραμμα διασποράς και να βρεθεί η ευθεία ελαχίστων τετραγώνων

(β) Ποια θα είναι η αναμενόμενη ζήτηση όταν μία τηλεόραση κοστίζει 800€

τηλεοράσεις πόσο θα πρέπει να

14 16

Page 27: ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ Ι

Τμήμα Εμπορίας και Ποιοτικού Ελέγχου Αγροτικών Προϊόντων, Φλώρινα 2010

Για να υπολογιστεί η ευθεία θα πρέπει να συμπληρωθεί ο πίνακας που ακολουθεί έτσι

ώστε να μας βοηθήσει να υπολογίσουμε τους εκτιμητές ελαχίστων τετραγώνων.

Υ

5

6

8

10

9

12

15

11 ; = 76

Επίσης θα ισχύει ότι Ισχύει ότι

Άρα = < ∑ 9z − (∑ 9=>=>< ∑ 9 − (∑==>Και = z] − 9 = 9,5 − (−0,

Η ευθεία ελαχίστων τετραγώνων θα είναι η ακόλουθη Υ=16,34

Και η αντίστοιχη γραφική παράσταση θα είναι η

(β) Όταν η αξία της τηλεόρασης είναι 800

υπολογίστηκε για εκατοντάδες ευρώ θα κάνουμε αντικατάσταση στην (1) όπου Χ=8

και το αποτέλεσμα θα είναι

τεμάχια.

(γ)Από το προηγούμενο ερώτημα έχει ήδη απαντηθεί ότι για να πωληθούν 10 τεμάχια

θα πρέπει το κόστος της τηλεόρασης να είναι 800

0

2

4

6

8

10

12

14

16

0 2

αρ

ιθμ

ός

τεμ

αχί

ων

πο

υ

πω

λή

θη

κα

ν

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ Ι – ΚΕΤΖΑΚΗ ΕΛΕΝΗ

Τμήμα Εμπορίας και Ποιοτικού Ελέγχου Αγροτικών Προϊόντων, Φλώρινα 2010-2011

Για να υπολογιστεί η ευθεία θα πρέπει να συμπληρωθεί ο πίνακας που ακολουθεί έτσι

ώστε να μας βοηθήσει να υπολογίσουμε τους εκτιμητές ελαχίστων τετραγώνων.

Χ Χ2

15 225

13 169

11 121

9 81

9 81

6 36

5 25

4 16 ; = 72 ; Χ = 754

Επίσης θα ισχύει ότι Ισχύει ότι 9 = ∑ = = Y = 9 και z] = ∑ z= = Y = 9,9)(∑ z=> )( 9=> ) = 8 ∙ 603 − 72 ∙ 738 ∙ 754 − 72 = −648848 =

( ,76)9 = 16,34

Η ευθεία ελαχίστων τετραγώνων θα είναι η ακόλουθη Υ=16,34 -0,76Χ

Και η αντίστοιχη γραφική παράσταση θα είναι η

(β) Όταν η αξία της τηλεόρασης είναι 800 € , αφού η παραπάνω γραμμική σχέση

υπολογίστηκε για εκατοντάδες ευρώ θα κάνουμε αντικατάσταση στην (1) όπου Χ=8

και το αποτέλεσμα θα είναι y=16,34-0,76∙8 = 10,26 (δηλαδή θα πωληθούν περίπου 10

ροηγούμενο ερώτημα έχει ήδη απαντηθεί ότι για να πωληθούν 10 τεμάχια

θα πρέπει το κόστος της τηλεόρασης να είναι 800€.

4 6 8 10 12 14

τιμή τηλεόρασης /τεμάχιο

27

Για να υπολογιστεί η ευθεία θα πρέπει να συμπληρωθεί ο πίνακας που ακολουθεί έτσι

ώστε να μας βοηθήσει να υπολογίσουμε τους εκτιμητές ελαχίστων τετραγώνων.

ΥΧ

75

78

88

90

81

72

75

44 ; = 603

,5

−0,76

0,76Χ (1)

αφού η παραπάνω γραμμική σχέση

υπολογίστηκε για εκατοντάδες ευρώ θα κάνουμε αντικατάσταση στην (1) όπου Χ=8

δηλαδή θα πωληθούν περίπου 10

ροηγούμενο ερώτημα έχει ήδη απαντηθεί ότι για να πωληθούν 10 τεμάχια

16

Page 28: ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ Ι – ΚΕΤΖΑΚΗ ΕΛΕΝΗ

Τμήμα Εμπορίας και Ποιοτικού Ελέγχου Αγροτικών Προϊόντων, Φλώρινα 2010-2011

28

Ασκήσεις κατανόησης:

ΑΣΚΗΣΗ 2

Δίνονται τα παρακάτω ζεύγη τιμών για κάθε ένα από αυτά να βρεθεί η εξίσωση

ελαχίστων τετραγώνων.

(α)

Υ 4 2 5 1 3

Χ 1 2 3 4 5

(β)

Υ 5 3 5 1 4

Χ 2 4 3 1 5

3. ΣΥΝΤΕΛΕΣΤΗΣ ΓΡΑΜΜΙΚΗΣ ΣΥΣΧΕΤΙΣΗΣ

Ο συντελεστής γραμμικής συσχέτισης δύο μεταβλητών Χ, Υ ορίζεται ως εξής

= ∑ (9 − 9)(z − z])=>y∑ (9 − 9)=> y∑ (z − z])=>

Είναι γνωστός και ως συντελεστής συσχέτισης του Pearson

Ο συντελεστής συσχέτισης δεν εκφράζεται σε συγκεκριμένες μονάδες μέτρησης και

ισχύει για αυτόν 11 +≤≤− r

Πιο συγκεκριμένα όταν:

• 10 +<< r , τότε οι Χ, Υ είναι θετικά γραμμικά συσχετισμένες

r > 0 y

x

Page 29: ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ Ι – ΚΕΤΖΑΚΗ ΕΛΕΝΗ

Τμήμα Εμπορίας και Ποιοτικού Ελέγχου Αγροτικών Προϊόντων, Φλώρινα 2010-2011

29

• 01 <<− r , τότε οι Χ, Υ είναι αρνητικά γραμμικά συσχετισμένες

r < 0 y

x

• 1+=r , τότε έχουμε τέλεια θετική γραμμική συσχέτιση και όλα τα σημεία

βρίσκονται πάνω σε μια ευθεία με θετική κλίση

y

x

r = +1

• 1−=r , τότε έχουμε τέλεια αρνητική γραμμική συσχέτιση και όλα τα

σημεία βρίσκονται πάνω σε μια ευθεία με αρνητική κλίση

r = −1 y

x

• 0=r , τότε δεν υπάρχει γραμμική συσχέτιση μεταξύ των μεταβλητών.

Οι μεταβλητές δηλαδή Χ, Υ είναι γραμμικά ασυσχέτιστες

r ≈ 0 y

x

1

9

Page 30: ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ Ι – ΚΕΤΖΑΚΗ ΕΛΕΝΗ

Τμήμα Εμπορίας και Ποιοτικού Ελέγχου Αγροτικών Προϊόντων, Φλώρινα 2010-2011

30

Σε περίπτωση που το 9 ή το z] δεν είναι ακέραιοι αριθμοί τότε δεν είναι εύκολο να

χρησιμοποιηθεί ο τύπος για το r ο οποίος προαναφέρθηκε. Σε αυτήν την περίπτωση

χρησιμοποιούμε τον ακόλουθο τύπο.

= < ∑ 9z − (∑ 9=> )(∑ z=> )=>y< ∑ 9 − (∑ 9=> )=> ∙ y< ∑ z − (∑ z=> )=>

ΑΣΚΗΣΗ 3

Να βρείτε τον συντελεστή συσχέτισης των μεταβλητών Χ και Υ των οποίων οι τιμές

δίνονται στον παρακάτω πίνακα.

Χ Υ

1 5

2 3

3 0

4 -3

5 -5 ; = 15 ; = 0

Λύση

Για να ελέγξουμε ποιόν από τους δύο τύπους, που αφορούν τον συντελεστή

συσχέτισης θα χρησιμοποιήσουμε, θα πρέπει πρώτα να υπολογίσουμε την μέση τιμή

για την μεταβλητή Χ καθώς και την μέση τιμή για την μεταβλητή Υ.

Διαπιστώνουμε ότι 9 = ∑ = = )) = 3 και z] = ∑ = = ") = 0, δηλαδή ότι οι μέσες τιμές

έχουν ακέραιες τιμές. Επομένως θα χρησιμοποιηθεί ο πρώτος τύπος και θα

συμπληρωθεί ο ακόλουθος πίνακας.

Χi Υi Χi-x] Yi-y] (Χi-x])( Yi-y]) (Χi-x])2

( Yi-y])2

1 5 -2 5 -10 4 25

2 3 -1 3 -3 1 9

3 0 0 0 0 0 0

4 -3 1 -3 -3 1 9

5 -5 2 -5 -10 4 25 ∑ =15

∑ =0

∑(6v − 67)=0

∑(v − )]]]=0

∑( − ])( − ])=

-26

∑( − ])=

10

∑( − ])=

68

Τα στοιχεία τα οποία προκύπτουν από την τελευταία σειρά του πίνακα είναι αυτά τα

οποία θα χρησιμοποιηθούν για την εύρεση του συντελεστή γραμμικής συσχέτισης.

Page 31: ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ Ι – ΚΕΤΖΑΚΗ ΕΛΕΝΗ

Τμήμα Εμπορίας και Ποιοτικού Ελέγχου Αγροτικών Προϊόντων, Φλώρινα 2010-2011

31

Κάνοντας αντικατάσταση στον τύπο προκύπτει = ∑ (9 − 9)(z − z])=>y∑ (9 − 9)=> y∑ (z − z])=> = −26√10 ∙ √68 = −0,99

Υπάρχει πολύ έντονη αρνητική γραμμική συσχέτιση μεταξύ των μεταβλητών X και Y.

ΑΣΚΗΣΗ 4

Να βρείτε τον συντελεστή συσχέτισης των μεταβλητών Χ και Υ των οποίων οι τιμές

δίνονται στον παρακάτω πίνακα.

Χ Υ

1 -5

2 -3

3 0

4 3

5 5 ; = 15 ; = 0

Λύση

Για να ελέγξουμε ποιόν από τους δύο τύπους, που αφορούν τον συντελεστή

συσχέτισης θα χρησιμοποιήσουμε, θα πρέπει πρώτα να υπολογίσουμε την μέση τιμή

για την μεταβλητή Χ καθώς και την μέση τιμή για την μεταβλητή Υ.

Διαπιστώνουμε ότι 9 = ∑ = = )) = 3 και z] = ∑ = = ") = 0, δηλαδή ότι οι μέσες τιμές

έχουν ακέραιες τιμές. Επομένως θα χρησιμοποιηθεί ο πρώτος τύπος και θα

συμπληρωθεί ο ακόλουθος πίνακας.

Χi Υi Χi-x] Yi-y] (Χi-x])( Yi-y]) (Χi-x])2

( Yi-y])2

1 -5 -2 -5 10 4 25

2 -3 -1 -3 3 1 9

3 0 0 0 0 0 0

4 3 1 3 3 1 9

5 5 2 5 10 4 25 ∑ =15

∑ =0

∑(6v − 67)=0

∑(v − )]]]=0

∑( − ])( − ])=

26

∑( − ])=

10

∑( − ])=

68

Τα στοιχεία τα οποία προκύπτουν από την τελευταία σειρά του πίνακα είναι αυτά τα

οποία θα χρησιμοποιηθούν για την εύρεση του συντελεστή γραμμικής συσχέτισης.

Page 32: ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ Ι – ΚΕΤΖΑΚΗ ΕΛΕΝΗ

Τμήμα Εμπορίας και Ποιοτικού Ελέγχου Αγροτικών Προϊόντων, Φλώρινα 2010-2011

32

Κάνοντας αντικατάσταση στον τύπο προκύπτει = ∑ (9 − 9)(z − z])=>y∑ (9 − 9)=> y∑ (z − z])=> = 26√10 ∙ √68 = 0,99

Υπάρχει πολύ έντονη θετική γραμμική συσχέτιση μεταξύ των μεταβλητών X και Y.

ΑΣΚΗΣΗ 5

Να βρείτε τον συντελεστή συσχέτισης των μεταβλητών Χ και Υ των οποίων οι τιμές

δίνονται στον παρακάτω πίνακα.

Χ Υ

1 1

3 6

7 12

11 8

15 17

18 14 ; E = 55 ; = 58

Λύση

Αρχικά θα υπολογιστεί η μέση τιμή των μεταβλητών για να αποφασιστεί ποιόν τύπο

που υπολογίζει τον συντελεστή συσχέτισης θα επιλέξουμε 9 = ∑ = = )) = 9,17 και z] = ∑ = = ) = 9.7 Διαπιστώσαμε ότι και οι δύο μέσες τιμές

είναι δεκαδικοί αριθμοί άρα θα χρησιμοποιήσουμε τον ακόλουθο τύπο = < ∑ 9z − (∑ 9=> )(∑ z=> )=>y< ∑ 9 − (∑ 9=> )=> ∙ y< ∑ z − (∑ z=> )=>

Για να γίνει αντικατάσταση στον τύπο θα πρέπει να συμπληρωθεί ο παρακάτω

πίνακας.

Χ Υ Χ2

Υ2 ΧΥ

1 1 1 1 1

3 6 9 36 18

7 12 49 144 84

11 8 121 64 88

15 17 225 289 255

18 14 324 196 252 ; E = 55 ; = 58 ; E = 729 ; = 730 ; = 698

Επομένως θα ισχύει κάνοντας αντικατάσταση στον συντελεστή συσχέτισης

Page 33: ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ Ι – ΚΕΤΖΑΚΗ ΕΛΕΝΗ

Τμήμα Εμπορίας και Ποιοτικού Ελέγχου Αγροτικών Προϊόντων, Φλώρινα 2010-2011

33

= < ∑ 9z − (∑ 9=> )(∑ z=> )=>y< ∑ 9 − (∑ 9=> )=> ∙ y< ∑ z − (∑ z=> )=> =

= 6 ∙ 698 − 55 ∙ 58√4374 − 55 ∙ √6 ∙ 730 − 58 = ⋯ = 0,8

Υπάρχει θετική γραμμική συσχέτιση.

Page 34: ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ Ι – ΚΕΤΖΑΚΗ ΕΛΕΝΗ

Τμήμα Εμπορίας και Ποιοτικού Ελέγχου Αγροτικών Προϊόντων, Φλώρινα 2010-2011

34

ΚΕΦΑΛΑΙΟ 3

ΣΥΝΟΛΑ-ΠΙΘΑΝΟΤΗΤΕΣ

1.ΕΙΣΑΓΩΓΗ

Πείραμα Τύχης, ονομάζεται ένα πείραμα του οποίου εκ των προτέρων δεν

μπορούμε να προβλέψουμε το αποτέλεσμα του, παρόλο που επαναλαμβάνεται κάτω

από τις ίδιες συνθήκες.

Δειγματικός Χώρος είναι όλα τα δυνατά αποτελέσματα τα οποία μπορούν να

εμφανιστούν σε ένα πείραμα τύχης. Ο δειγματικός χώρος συνήθως συμβολίζεται με

ένα κεφαλαίο γράμμα Ω. Αν ω1,ω2,…,ωκ είναι τα δυνατά αποτελέσματα ενός

πειράματος τύχης, τότε ο δειγματικός χώρος του πειράματος θα είναι το σύνολο Ω=

ω1,ω2,…,ωκ.

Ενδεχόμενο ή γεγονός ονομάζεται το σύνολο το οποίο έχει ένα ή περισσότερα

αποτελέσματα ενός πειράματος τύχης. Το γεγονός θα συμβολίζεται επίσης με

κεφαλαίο γράμμα για παράδειγμα Α ή Β κ.λπ. Όταν ένα αποτέλεσμα ω ανήκει σε ένα

γεγονός Α αυτό θα συμβολίζεται στην γλώσσα των συνόλων ω ∈ Α. Ενώ όταν ένα

αποτέλεσμα ω δεν ανήκει σε ένα γεγονός Α, αυτό θα συμβολίζεται ω ∈ Α

Παράδειγμα:

Ας υποθέσουμε ότι το πείραμα τύχης είναι το αποτέλεσμα της ρίψης ενός ζαριού,

επομένως ο δειγματικός χώρος θα είναι Ω=1,2,3,4,5,6 και το Α=1,2,3 θα είναι ένα

ενδεχόμενο ή γεγονός. Θα λέμε ότι το 1 ∈ Α, ενώ το 5 ∈ Α

2. ΠΡΑΞΕΙΣ ΜΕ ΕΝΔΕΧΟΜΕΝΑ

Α τομή Β

Το ενδεχόμενο BA ∩ , που διαβάζεται Α τομή Β και πραγματοποιείται, όταν

πραγματοποιούνται συγχρόνως τα Α και Β.

Α ⋂ Β

Page 35: ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ Ι – ΚΕΤΖΑΚΗ ΕΛΕΝΗ

Τμήμα Εμπορίας και Ποιοτικού Ελέγχου Αγροτικών Προϊόντων, Φλώρινα 2010-2011

35

Α ένωση Β

Το ενδεχόμενο BA ∪ , που διαβάζεται Α ένωση Β και πραγματοποιείται, όταν

πραγματοποιείται ένα τουλάχιστον από τα Α, Β.

Α ⋃ Β

Συμπληρωματικό του Α

Το ενδεχόμενο A′ , που διαβάζεται συμπληρωματικό του Α και πραγματοποιείται,

όταν δεν πραγματοποιείται το Α. Το A′ λέγεται και αντίθετο του Α.

Διαφορά του Β από το Α

Το ενδεχόμενο BA − , που διαβάζεται διαφορά του Β από το Α και πραγματοποιείται,

όταν πραγματοποιείται το Α αλλά όχι το Β. Ισχύει ότι BABA ′∩=− .

Ασυμβίβαστα Γεγονότα

Δύο ενδεχόμενα Α και Β λέγονται ασυμβίβαστα, όταν ∅∅∅∅====∩∩∩∩ BA .

Δύο ασυμβίβαστα ενδεχόμενα λέγονται επίσης ξένα μεταξύ τους ή αμοιβαίως

αποκλειόμενα.

Page 36: ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ Ι – ΚΕΤΖΑΚΗ ΕΛΕΝΗ

Τμήμα Εμπορίας και Ποιοτικού Ελέγχου Αγροτικών Προϊόντων, Φλώρινα 2010-2011

36

ΑΣΚΗΣΗ 1

Ρίχνουμε ένα ζάρι δύο φορές. Να βρείτε τα γεγονότα

(α) Α = Το αποτέλεσμα της 1ης

ρίψης να είναι μικρότερο από το αποτέλεσμα της 2ης

ρίψης

(β) Β = Το άθροισμα των ενδείξεων και στις 2 ρίψεις να είναι περιττός αριθμός

(γ) Γ = Το αποτέλεσμα της 1ης

ρίψης να είναι άρτιος και τις 2ης

ρίψης να είναι

περιττός

(δ) ⋂ , ⋂ , ⋂

Λύση

Το πείραμα τύχης είναι η ρίψη του ζαριού δύο φορές, επομένως τα αποτελέσματα θα

καταγράφονται σε μορφή διατεταγμένων ζευγών ( , ). Στην πρώτη θέση θα γράφουμε

το αποτέλεσμα της πρώτης ρίψης και στην δεύτερη θέση το αποτέλεσμα της δεύτερης

ρίψης. Χρειάζεται προσοχή άλλο είναι το ζεύγος (3,1) και άλλο το (1,3).

(α) Επομένως το γεγονός Α θα είναι

Α = (1,2), (1,3), (1,4), (1,5), (1,6), (2,3), (2,4), (2,5), (2,6), (3,4), (3,5), (3,6), (4,5), (4,6),

(5,6)

(β) Β = (1,2), (1,4), (1,6), (2,1), (2,3), (2,5), (3,2), (3,4), (3,6), (4,1), (4,3), (4,5), (5,2),

(5,4), (5,6), (6,1), (6,3), (6,5)

(γ) Γ= (2,1), (2,3), (2,5), (4,1), (4,3), (4,5), (6,1), (6,3), (6,5)

(δ) ⋂ = (1,2), (1,4), (1,6), (2,3), (2,5), (3,4), (3,6), (4,5), (5,6)

⋂ = (2,3), (2,5)

⋂ = (2,1), (2,3), (2,5), (4,1), (4,3), (4,5), (6,1), (6,3), (6,5)

ΑΣΚΗΣΗ 2

Από τις οικογένειες που έχουν 3 παιδιά διαλέγουμε μία και καταγράφουμε το φύλλο

των παιδιών, με την σειρά που γεννήθηκαν. Να καταγραφεί ο δειγματικός χώρος του

πειράματος.

Λύση

Το πείραμα τύχης είναι η καταγραφή του φύλλου των παιδιών οικογενειών που έχουν

τρία παιδιά με την σειρά που αυτά γεννήθηκαν.

Ας υποθέσουμε ότι με Κ συμβολίζεται το κορίτσι και με Α το αγόρι, επομένως ο

δειγματικός χώρος θα είναι

Ω = (Κ,Κ,Κ), (Κ,Κ,Γ), (Κ,Γ,Κ), (Κ,Γ,Γ), (Γ,Γ,Γ), (Γ,Κ,Κ), (Γ,Κ,Γ), (Γ,Γ,Κ)

ΑΣΚΗΣΗ 3

Ρίχνουμε ένα νόμισμα 4 φορές

(α) Να γράψετε τον δειγματικό χώρο του πειράματος τύχης

Page 37: ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ Ι – ΚΕΤΖΑΚΗ ΕΛΕΝΗ

Τμήμα Εμπορίας και Ποιοτικού Ελέγχου Αγροτικών Προϊόντων, Φλώρινα 2010-2011

37

(β) Να γράψετε τα γεγονότα:

Α = να φέρουμε ακριβώς δύο φορές κορώνα

Β = να φέρουμε τουλάχιστον δύο φορές γράμματα

Γ = να φέρουμε το πολύ δύο φορές κορώνα

Λύση

Το πείραμα τύχης αφορά την ρίψη ενός νομίσματος 4 φορές και την καταγραφή του

αποτελέσματος.

(α) Ας υποθέσουμε ότι το Κ αναφέρεται στην Κορώνα και το Γ στα γράμματα,

επομένως ο δειγματικός χώρος είναι

Ω = (Κ,Κ,Κ,Κ), (Κ,Κ,Κ,Γ), (Κ,Κ,Γ,Κ), (Κ,Κ,Γ,Γ),

(Γ,Κ,Κ,Κ), (Γ,Κ,Κ,Γ), (Γ,Κ,Γ,Κ), (Γ,Κ,Γ,Γ),

(Κ,Γ,Κ,Κ), (Κ,Γ,Κ,Γ), (Κ,Γ,Γ,Κ), (Κ,Γ,Γ,Γ),

(Γ,Γ,Κ,Κ), (Γ,Γ,Κ,Γ), (Γ,Γ,Γ,Κ), (Γ,Γ,Γ,Γ)

(β) Ακριβώς δύο φορές κορώνα θα είναι οι τετράδες οι οποίες αποτελούνται μόνο από

2 φορές το Κ, επομένως θα ισχύει

Α = (Κ,Κ,Γ,Γ), (Γ,Κ,Κ,Γ), (Γ,Κ,Γ,Κ), (Κ,Γ,Κ,Γ), (Κ,Γ,Γ,Κ),(Γ,Γ,Κ,Κ)

Τουλάχιστον δύο φορές γράμματα θα είναι οι τετράδες οι οποίες αποτελούνται από 2

φορές το Γ ή 3 φορές το Γ, ή 4 φορές το Γ. Επομένως

Β = (Κ,Κ,Γ,Γ), (Γ,Κ,Κ,Γ), (Γ,Κ,Γ,Κ), (Γ,Κ,Γ,Γ), (Κ,Γ,Κ,Γ), (Κ,Γ,Γ,Κ), (Κ,Γ,Γ,Γ), (Γ,Γ,Κ,Κ),

(Γ,Γ,Κ,Γ), (Γ,Γ,Γ,Κ), (Γ,Γ,Γ,Γ)

Το πολύ δύο φορές κορώνα θα είναι οι τετράδες οι οποίες δεν έχουν καμία, έχουν μία

ή δύο φορές Κ, επομένως

Γ= (Γ,Γ,Κ,Κ), (Γ,Γ,Κ,Γ), (Γ,Γ,Γ,Κ), (Γ,Γ,Γ,Γ), (Κ,Γ,Κ,Γ), (Κ,Γ,Γ,Κ), (Κ,Γ,Γ,Γ), (Κ,Κ,Γ,Κ), (Κ,Κ,Γ,Γ),

(Γ,Κ,Κ,Γ), (Γ,Κ,Γ,Κ), (Γ,Κ,Γ,Γ)

ΑΣΚΗΣΗ 4

Στο τμήμα ποιοτικού ελέγχου μιας εταιρίας γαλακτοκομικών ελέγχονται τα προϊόντα

με την σειρά που εξέρχονται. Ο έλεγχος σταματάει όταν βρεθούν δύο ελαττωματικά

προϊόντα ή όταν ελεγχθούν τέσσερα προϊόντα. Να βρεθεί ο δειγματικός χώρος του

πειράματος τύχης και να βρείτε τα ενδεχόμενα

Α=ακριβώς δύο προϊόντα να είναι ελαττωματικά

Β=δύο τουλάχιστον μη ελαττωματικά προϊόντα

Γ=το πολύ δύο μη ελαττωματικοί δίσκοι

Λύση

Ας υποθέσουμε ότι με Ε = ελαττωματικό προϊόν και με Κ = μη ελαττωματικό προϊόν,

τότε ο δειγματικός χώρος θα δίνεται ως εξής

Ω= ΚΚΚΚ,ΚΚΚΕ,ΕΚΚΚ,ΚΕΚΚ,ΚΚΕΚ,ΚΚΕΕ,ΕΚΚΕ,ΕΕ,ΚΕΕ,ΕΚΕ

Page 38: ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ Ι – ΚΕΤΖΑΚΗ ΕΛΕΝΗ

Τμήμα Εμπορίας και Ποιοτικού Ελέγχου Αγροτικών Προϊόντων, Φλώρινα 2010-2011

38

Για να υπολογιστεί το γεγονός το οποίο θα περιγράφει ότι έχουμε ακριβώς δύο μη

ελαττωματικά προϊόντα θα αναζητήσουμε τις σειρές οι οποίες περιέχουν ακριβώς 2

φορές το γράμμα Κ, συνεπώς το γεγονός Α θα είναι Α= ΚΚΕΕ,ΕΚΚΕ,ΕΕ,ΚΕΕ,ΕΚΕ

Το γεγονός του οποίου τα στοιχεία αποτελούνται από δύο τουλάχιστον μη

ελαττωματικά στοιχεία είναι αυτό το οποίο έχει δύο Κ ή τρία Κ ή τέσσερα Κ.

Β= ΚΚΚΚ,ΚΚΚΕ,ΕΚΚΚ,ΚΕΚΚ,ΚΚΕΚ,ΚΚΕΕ,ΕΚΚΕ

Το γεγονός του οποίου τα στοιχεία αποτελούνται από το πολύ δύο μη ελαττωματικά

στοιχεία είναι αυτό το οποίο έχει κανένα Κ ή ένα Κ ή δύο Κ.

Γ= ΚΚΕΕ,ΕΚΚΕ,ΕΕ,ΚΕΕ,ΕΚΕ

3. ΟΡΙΣΜΟΣ ΠΙΘΑΝΟΤΗΤΑΣ

Στην ενότητα αυτή θα δοθούν οι δύο ορισμοί της πιθανότητας ο αξιωματικός ορισμός

και ο κλασσικός ορισμός της πιθανότητας.

ΚΛΑΣΣΙΚΟΣ ΟΡΙΣΜΟΣ ΠΙΘΑΝΟΤΗΤΑΣ

Σε ένα πείραμα τύχης με ισοπίθανα αποτελέσματα και Α ένα γεγονός του δειγματικού

χώρου Ω, ορίζεται ως πιθανότητα του γεγονότος Α ο αριθμός

(¡) = ¢£ή¤¥¦ §¨ ©ª¥ϊAώ ¢©­®¢§ώ¯©¨ ¢£ή¤¥¦ §¨ Cª§ώ ¢©­®¢§ώ¯©¨ = °()°(±)

Από τον κλασσικό ορισμό της πιθανότητας προκύπτουν τα ακόλουθα συμπεράσματα

1. (±) = ²(³)²(³) = 1

2. (∅) = "²(³) = 0

3. 0 ≤ () ≤ 1

ΑΞΙΩΜΑΤΙΚΟΣ ΟΡΙΣΜΟΣ ΠΙΘΑΝΟΤΗΤΑΣ

Έστω Ω=ω1,ω2,ω3,…,ων ένας δειγματικός χώρος ο οποίος έχει πεπερασμένο πλήθος

στοιχείων. Σε κάθε γεγονός ωi, αντιστοιχεί ένας πραγματικός αριθμός ο οποίος

συμβολίζεται με P(ωi), έτσι ώστε να ισχύουν 0 ≤ (¨) ≤ 1

(¨) + (¨) + ⋯ + (¨$) = 1

Τον αριθμό (¨) τον ονομάζουμε πιθανότητα του γεγονότος ωi.

Έστω ότι έχουμε ένα γεγονός Α, ως πιθανότητα του γεγονότος Α= ω1,ω2,ω3,…,ωκ ≠ ∅

ορίζεται το άθροισμα () + () + ⋯ + ($), ενώ ως πιθανότητα του αδύνατου

ενδεχομένου (∅) = 0

Page 39: ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ Ι – ΚΕΤΖΑΚΗ ΕΛΕΝΗ

Τμήμα Εμπορίας και Ποιοτικού Ελέγχου Αγροτικών Προϊόντων, Φλώρινα 2010-2011

39

ΑΣΚΗΣΗ 5

Από ένα κουτί με 50 λαμπτήρες οι 45 ανάβουν ενώ οι υπόλοιποι όχι. Ποια η

πιθανότητα η τυχαία επιλογή ενός λαμπτήρα να είναι από αυτούς που δεν άναψαν;

Λύση

Η άσκηση θα λυθεί χρησιμοποιώντας των κλασσικό ορισμό της πιθανότητας. Το

πλήθος των δυνατών περιπτώσεων είναι Ν(Ω)=50. Έστω το γεγονός Α=να γίνει

επιλογή λαμπτήρα ο οποίος δεν ανάβει, το πλήθος των ευνοϊκών περιπτώσεων

δηλαδή των λαμπτήρων οι οποίο δεν ανάβουν Ν(Α)=5, επομένως (¡) = ¢£ή¤¥¦ §¨ ©ª¥ϊAώ ¢©­®¢§ώ¯©¨ ¢£ή¤¥¦ §¨ Cª§ώ ¢©­®¢§ώ¯©¨ = °()°(±) = 550 = 0,1

ΑΣΚΗΣΗ 6

Παίρνουμε στην τύχη έναν από τους αριθμούς 1,2,3,…,25. Να βρεθεί η πιθανότητα

των παρακάτω γεγονότων

Α=ο αριθμός να είναι άρτιος

Β=ο αριθμός να είναι μικρότερος του 10 και μεγαλύτερος του 20

Γ=ο αριθμός να είναι μικρότερος του30

Δ=ο αριθμός να είναι πρώτος

Λύση

Για να λυθεί η συγκεκριμένη άσκηση θα χρησιμοποιηθεί ο κλασσικός ορισμός της

πιθανότητας. Το πλήθος των ευνοϊκών περιπτώσεων είναι °(±) = 25.

Αρχικά θα βρούμε τα σύνολα Α,Β,Γ,Δ και έπειτα θα υπολογίσουμε τις ευνοϊκές

περιπτώσεις για καθένα από αυτά.

Α = 2,4,6,8,10,12,14,16,18,20,22,24

Β = 1,2,3,4,5,6,7,8,9,21,22,23,24,25

Γ = 1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25

Δ = 2,3,5,7,11,13,17,19,23

Επομένως θα ισχύει:

(¡) = ²(m)²(³) = )" = 0,24

() = ²(n)²(³) = #)" = 0,28

Page 40: ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ Ι – ΚΕΤΖΑΚΗ ΕΛΕΝΗ

Τμήμα Εμπορίας και Ποιοτικού Ελέγχου Αγροτικών Προϊόντων, Φλώρινα 2010-2011

40

() = ²(¶)²(³) = )")" = 1

(·) = ²(¸)²(³) = ~)" = 0,18

ΑΣΚΗΣΗ 7

Ένα κουτί περιέχει 2 κόκκινα μπαλάκια, 4 μπλε μπαλάκια και 5 άσπρα. Επιλέγουμε

τυχαία ένα μπαλάκι . Να υπολογιστούν οι πιθανότητες των παρακάτω γεγονότων

Α = το μπαλάκι να είναι κόκκινο

Β = το μπαλάκι να μην είναι κόκκινο

Γ = το μπαλάκι να είναι άσπρο

Δ = το μπαλάκι να είναι μπλε

Ε = το μπαλάκι να μην είναι μπλε και κόκκινο

Λύση

Για να λυθεί η συγκεκριμένη άσκηση θα χρησιμοποιηθεί ο κλασσικός ορισμός της

πιθανότητας. Το πλήθος των ευνοϊκών περιπτώσεων είναι °(±) = 11.

(¡) = ²(m)²(³) = = 0,18

Το γεγονός Β σύμφωνα με το οποίο Β = το μπαλάκι να μην είναι κόκκινο είναι

ισοδύναμο με το γεγονός το μπαλάκι να είναι είτε άσπρο είτε μπλε. Αφού άσπρα ή

μπλε μπαλάκια στο πλήθος τους έχουμε 9. Επομένως

() = ²(n)²(³) = ~ = 0,81

() = ²(¶)²(³) = ) = 0,45

(·) = ²(¸)²(³) = # = 0,36

Το γεγονός Ε σύμφωνα με το οποίο Ε = το μπαλάκι να μην είναι μπλε και κόκκινο

είναι ισοδύναμο με το γεγονός το μπαλάκι να είναι άσπρο. Επομένως

(¹) = () = ²(¶)²(³) = ) = 0,45

Page 41: ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ Ι – ΚΕΤΖΑΚΗ ΕΛΕΝΗ

Τμήμα Εμπορίας και Ποιοτικού Ελέγχου Αγροτικών Προϊόντων, Φλώρινα 2010-2011

41

ΒΑΣΙΚΟΙ ΚΑΝΟΝΕΣ ΠΙΘΑΝΟΤΗΤΩΝ

Απλός Προσθετικός Νόμος

1. Για οποιαδήποτε ασυμβίβαστα μεταξύ τους ενδεχόμενα Α και Β ισχύει:

)()()( BPAPBAP +=∪

ΑΠΟΔΕΙΞΗ

Αν )(AN και )(BN το πλήθος των ευνοϊκών περιπτώσεων των γεγονότων Α και Β

αντίστοιχα, αφού τα Α και Β είναι ασυμβίβαστα, θα έχουμε )()()( BNANBAN +=∪

Επομένως:

)(

)()(

ΩN

BANBAP

∪=∪

)(

)()(

ΩN

BNAN +=

)(

)(

)(

)(

ΩΩ N

BN

N

AN+= )()( BPAP +=

Η ιδιότητα αυτή ισχύει και για περισσότερα από δύο ενδεχόμενα. Έστω ότι έχουμε τα

ενδεχόμενα Α, Β και Γ τα οποία είναι ανά δύο ασυμβίβαστα θα έχουμε )()()()( ΓPBPAPΓBAP ++=∪∪

2. Για το συμπληρωματικό γεγονός A′ του Α θα ισχύει:

)(1)( APAP −=′

ΑΠΟΔΕΙΞΗ

Τα Α και A′ είναι ασυμβίβαστα επομένως ∅=′∩ AA . Σύμφωνα με τον απλό

προσθετικό νόμο θα ισχύει

)()()( APAPAAP ′+=′∪

)()()( APAPP ′+=Ω

)()(1 APAP ′+=

Επομένως )(1)( APAP −=′

Προσθετικός Νόμος

3. Για δύο γεγονότα Α και Β ισχύει

)()()()( BAPBPAPBAP ∩−+=∪

ΑΠΟΔΕΙΞΗ

Για δυο γεγονότα Α και Β ισχύει ότι

Page 42: ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ Ι – ΚΕΤΖΑΚΗ ΕΛΕΝΗ

Τμήμα Εμπορίας και Ποιοτικού Ελέγχου Αγροτικών Προϊόντων, Φλώρινα 2010-2011

42

)()()()( BANBNANBAN ∩−+=∪ (1)

το πλήθος των στοιχείων του BA ∩ υπολογίζεται δυο φορές για αυτό τον λόγο

αφαιρούμε το πλήθος του από την (1). Γνωρίζουμε ότι 0)( ≠ΩN

Οπότε αν διαιρέσουμε τα μέλη της (1) με )(ΩN έχουμε:

)(

)(

)(

)(

)(

)(

)(

)(

ΩΩΩΩ N

BAN

N

BN

N

AN

N

BAN ∩−+=

Από το οποίο προκύπτει ότι

)()()()( BAPBPAPBAP ∩−+=∪

4. Αν BA ⊆ , τότε )()( BPAP ≤

ΑΠΟΔΕΙΞΗ

Αν BA ⊆ τότε θα ισχύει ότι )()( BNAN ≤ Γνωρίζουμε ότι 0)( ≠ΩN αν διαιρέσουμε τα

μέλη της ανισότητας με )(ΩN έχουμε

)(

)(

)(

)(

ΩΩ N

BN

N

AN≤

Από το οποίο προκύπτει )()( BPAP ≤

5. Έστω δύο γεγονότα Α και Β θα ισχύει για αυτά

)()()( BAPAPBAP ∩−=−

ΑΠΟΔΕΙΞΗ

Είναι φανερό ότι τα γεγονότα BA − και BA ∩ είναι ασυμβίβαστα επίσης θα ισχύει ότι

ABABA =∩∪− )()( , οπότε θα προκύπτει

)()()( BAPBAPAP ∩+−= , δηλαδή )()()( BAPAPBAP ∩−=−

Page 43: ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ Ι – ΚΕΤΖΑΚΗ ΕΛΕΝΗ

Τμήμα Εμπορίας και Ποιοτικού Ελέγχου Αγροτικών Προϊόντων, Φλώρινα 2010-2011

43

ΑΣΚΗΣΗ 8

Έστω Α,Β δύο γεγονότα ενός δειγματικού χώρου Ω για τα οποία ισχύει P(A)=0.7 ,

P(B)=0.5 και 4.0)( =∩ BAP

Να υπολογίσετε τις πιθανότητες των γεγονότων

Γ = να πραγματοποιηθεί το Α ή το Β

Δ = να πραγματοποιηθεί μόνο το Α

Ε = να μην πραγματοποιηθεί κανένα από τα Α και Β

Ζ = να πραγματοποιηθεί μόνο το Β

Η = να πραγματοποιηθεί μόνο ένα από τα Α και Β

Λύση

Το γεγονός, Γ = να πραγματοποιηθεί το Α ή το Β = BA ∪ , επομένως P(Γ) = Ρ ( BA ∪ )

Λόγω του προσθετικού νόμου ισχύει η σχέση

)()()()( BAPBPAPBAP ∩−+=∪

Άρα Ρ ( BA ∪ ) = 0.7 + 0.5 – 0.4 = 1.2 – 0.4 =0.8

Οπότε και P(Γ) = 0.8

Το γεγονός, Δ = να πραγματοποιηθεί μόνο το Α = Α – Β, επομένως P(Δ) = P(Α – Β)

Είναι γνωστό ότι )()()( BAPAPBAP ∩−=− , άρα

)( BAP − = 0.7 – 0.4 = 0.3 οπότε P(Δ) = 0.3

Το γεγονός, Ε = να μην πραγματοποιηθεί κανένα από τα Α και Β = ( )′∪ BA ,

επομένως

P(E) = P[ ( )′∪ BA ] = 1 – P ( )BA ∪ = 1 – 0.8 = 0.2

Το γεγονός, Ζ = να πραγματοποιηθεί μόνο το Β = B – A , επομένως P(Z) = P(B – A),

γνωρίζουμε ότι )()()( BAPBPABP ∩−=− = 0,5 - 0,4 = 0,1

Το γεγονός Η = να πραγματοποιηθεί μόνο ένα από τα Α και Β = ( ) ( )U ABBA −−

Άρα P(H) = P ( ) ( )( )U ABBA −− = (τα γεγονότα είναι ασυμβίβαστα, οπότε)

= )( BAP − + )( ABP − = 0.3 + 0.1 = 0.4

Page 44: ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ Ι – ΚΕΤΖΑΚΗ ΕΛΕΝΗ

Τμήμα Εμπορίας και Ποιοτικού Ελέγχου Αγροτικών Προϊόντων, Φλώρινα 2010-2011

44

4. ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ

ΟΡΙΣΜΟΣ

Αν Α και Β είναι δύο γεγονότα ενός πειράματος τύχης και 0)( >BP , τότε

δεσμευμένη πιθανότητα του Α με δεδομένο το Β η οποία συμβολίζεται με

)|( BAP λέγεται ο λόγος )(

)(

BP

BAP ∩

)(

)()|(

BP

BAPBAP

∩=

Με ακριβώς όμοιο τρόπο προκύπτει και ο ορισμός της δεσμευμένης πιθανότητας του

Β με δεδομένο το Α, αλλά θα πρέπει 0)( >AP και θα ισχύει )(

)()|(

AP

BAPABP

∩=

ΑΝΕΞΑΡΤΗΤΑ ΓΕΓΟΝΟΤΑ

ΟΡΙΣΜΟΣ

Τα γεγονότα Α και Β με 0)( >AP και 0)( >BP λέγονται ανεξάρτητα, αν και μόνον αν

ισχύει )()|( APBAP = και )()|( BPABP =

Παρατήρηση:

Δύο ενδεχόμενα Α και Β είναι ανεξάρτητα, αν )()()( BPAPBAP ⋅=∩

Θεώρημα του Bayes

Αν Α και Β είναι δύο γεγονότα ενός πειράματος τύχης και 0)( >BP τότε

( ) ( ))(

|)|(

BP

ABPAPBAP =

Page 45: ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ Ι – ΚΕΤΖΑΚΗ ΕΛΕΝΗ

Τμήμα Εμπορίας και Ποιοτικού Ελέγχου Αγροτικών Προϊόντων, Φλώρινα 2010-2011

45

ΑΣΚΗΣΗ 9

Έστω δύο γεγονότα Α και Β του ίδιου δειγματικού χώρου τέτοια ώστε 2

1)( =AP ,

4

1)( =BP και

5

4)|( =BAP . Να υπολογιστούν οι πιθανότητες )( BAP ∩ και )|( ABP

Λύση

Είναι γνωστό ότι )(

)()|(

BP

BAPBAP

∩= επομένως από την σχέση αυτή θα προκύπτει

( ) ( )5

1

5

4

4

1|)( =⋅=⋅=∩ BAPBPBAP

Για να υπολογιστεί η πιθανότητα )|( ABP , υπάρχουν δύο τρόποι είτε θα βασιστούμε

στον ορισμό είτε στον τύπο του Bayes και τα δύο είναι σωστά.

Σύμφωνα λοιπόν με τον τύπο του Bayes ισχύει ( ) ( )

)(

|)|(

BP

ABPAPBAP = , επομένως

( ) ( )5

2

2

15

1

2

15

4

4

1

)(

|)|( ==

==AP

BAPBPABP

Page 46: ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ Ι – ΚΕΤΖΑΚΗ ΕΛΕΝΗ

Τμήμα Εμπορίας και Ποιοτικού Ελέγχου Αγροτικών Προϊόντων, Φλώρινα 2010-2011

46

ΚΕΦΑΛΑΙΟ 3

ΠΙΘΑΝΟΤΗΤΕΣ –ΣΥΝΔΙΑΣΤΙΚΗ

1. ΕΙΣΑΓΩΓΗ

Στην συγκεκριμένη ενότητα θα αναφερθούμε σε ασκήσεις οι οποίες αφορούν τον

υπολογισμό της πιθανότητας όμως χρησιμοποιούν ορισμένες αρχές οι οποίες

προέρχονται από την συνδυαστική.

2. ΒΑΣΙΚΕΣ ΑΡΧΕΣ ΣΥΝΔΙΑΣΤΙΚΗΣ

ΔΙΑΤΑΞΕΙΣ

Όταν έχουμε n αντικείμενα και τοποθετούμε στην σειρά r από αυτά, τότε έχουμε

μία διάταξη των r αντικειμένων. Το πλήθος των διαφορετικών διατάξεων r

αντικειμένων από τα n, συμβολίζεται με

(<) = <(< − 1) … (< − + 1)

Παράδειγμα:

Ας υποθέσουμε ότι έχουμε 4 ψηφία τα 1,2,3,4 , αν θέλουμε να υπολογίσουμε

πόσους διαφορετικούς διψήφιους αριθμούς μπορούμε να φτιάξουμε από τα 4 αυτά

ψηφία θα υπολογίσουμε το πλήθος των διαφορετικών διατάξεων των 2 αντικειμένων

από τα 4. Οπότε (4) =12 διαφορετικοί διψήφιοι μπορούν να φτιαχτούν αν

επιλεχθούν 2 από τα 4 ψηφία.

ΜΕΤΑΘΕΣΕΙΣ

Αν σε μία διάταξη πάρουμε και τα n αντικείμενα του πληθυσμού, τότε θα λέμε ότι

έχουμε μία μετάθεση και το πλήθος τους θα είναι (<)= = <(< − 1) … 2 ∙ 1 = <!

Παράδειγμα:

Ας υποθέσουμε ότι έχουμε 3 ψηφία τα 2,3,4 και θέλουμε να υπολογίσουμε πόσους

διαφορετικούς τριψήφιους αριθμούς μπορούμε να φτιάξουμε από τα 3 αυτά ψηφία

θα υπολογίσουμε το πλήθος των διαφορετικών μεταθέσεων των 3 αντικειμένων το

οποίο είναι 3!=6 επομένως υπάρχουν έξι διαφορετικοί τρόποι για να διατάξουμε τρεις

αριθμούς.

ΔΙΑΤΑΞΕΙΣ ΜΕ ΕΠΑΝΑΛΗΨΗ

Όταν καθένα από τα n αντικείμενα μπορεί να επαναληφθεί όσες φορές θέλουμε,

τότε έχουμε διατάξεις με επανάληψη r αντικειμένων από τα n. Το πλήθος τους είναι < = < ∙ < ∙ < ⋯ <¼½½¾½½¿ÀÁÂÃέÅ

Page 47: ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ Ι – ΚΕΤΖΑΚΗ ΕΛΕΝΗ

Τμήμα Εμπορίας και Ποιοτικού Ελέγχου Αγροτικών Προϊόντων, Φλώρινα 2010-2011

47

Παράδειγμα:

Μια στήλη του ΠΡΟΠΟ είναι μία 13άδα στην οποία σε κάθε θέση τις έχουμε 3

επιλογές 1,2,Χ. Πρόκειται για μια διάταξη με επανάληψη. Το πλήθος των

διαφορετικών στηλών που μπορούν να πραγματοποιηθούν είναι 3& = 1594323

διαφορετικές στήλες.

ΣΥΝΔΙΑΣΜΟΙ

Αν από τα n αντικείμενα πάρουμε r χωρίς να μας ενδιαφέρει η διάταξη αλλά μόνο

ποια αντικείμενα πήραμε, τότε έχουμε τους συνδυασμούς των n αντικειμένων ανά r .

Το πλήθος τους συμβολίζεται με F<G και είναι

F<G = <(< − 1) ⋯ (< − + 1)! = <!! (< − )!

Παράδειγμα:

Το πλήθος των διαφορετικών εξάδων που μπορούμε να προκύψουν στο ΛΟΤΤΟ

είναι F496 G

ΜΕΤΑΘΕΣΕΙΣ ΜΕ ΟΜΟΙΑ ΑΝΤΙΚΕΙΜΕΝΑ

Αν από τα n αντικείμενα δεν είναι όλα διαφορετικά αλλά υπάρχουν μόνο κ

διαφορετικά αντικείμενα τα ¨,¨,¨&, ⋯ ¨ έτσι ώστε να υπάρχουν αντικείμενα ¨, αντικείμενα ¨, …, αντικείμενα ¨ και ισχύει + + ⋯ + Æ = <. Το πλήθος

των διαφορετικών μεταθέσεων των n αντικειμένων είναι <!! ! … Æ!

Παράδειγμα:

Ας υποθέσουμε ότι έχουμε τους αριθμούς 2,4,4 από τους αριθμούς αυτούς οι δύο

επαναλαμβάνονται επομένως το πλήθος των τριψήφιων αριθμών που μπορούμε να

φτιαχτούν είναι το πλήθος το οποίο προκύπτει από τις μετατάξεις ομοίων

αντικειμένων. Επομένως &!!! = 3 είναι το πλήθος των διαφορετικών τριάδων οι

οποίες μπορούν να φτιαχτούν από τους παραπάνω αριθμούς.

ΑΣΚΗΣΗ 1

Δύο φίλοι ρίχνουν ζάρια. Ο Α ρίχνει 3 ζάρια ταυτόχρονα και ο Β ρίχνει 4 ζάρια

ταυτόχρονα

(α) Ποια η πιθανότητα να φέρει ο Α άθροισμα 9;

(β) Ποια η πιθανότητα να φέρει ο Β άθροισμα 12;

(γ) Ο Α παίζει μέχρι να φέρει άθροισμα 9 για πρώτη φορά. Ποια η πιθανότητα να

σταματήσει στο τρίτο παιχνίδι;

(δ) Ο Β παίζει 3 παιχνίδια. Ποια η πιθανότητα να φέρει άθροισμα 12 μία φορά;

Λύση

Page 48: ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ Ι – ΚΕΤΖΑΚΗ ΕΛΕΝΗ

Τμήμα Εμπορίας και Ποιοτικού Ελέγχου Αγροτικών Προϊόντων, Φλώρινα 2010-2011

48

Θεωρούμε τα γεγονότα :

Α= Ο Α να φέρει άθροισμα 9 με 3 ζάρια

Β= Ο Β να φέρει άθροισμα 12 με 4 ζάρια

Το σύνολο των δυνατών περιπτώσεων προκύπτει ως διατάξεις με επανάληψη και

για τους δύο παίκτες έτσι για τον Α είναι 63, ενώ το σύνολο των δυνατών

περιπτώσεων για τον Β είναι 64.

(α) Για να βρεθεί το πλήθος των ευνοϊκών περιπτώσεων να φέρει ο παίκτης Α

άθροισμα 9 με τρία ζάρια, αρχικά θα γράψουμε ποιες είναι η δυνατές τριάδες και

στην συνέχεια θα δούμε κάθε τριάδα με πόσους διαφορετικούς τρόπους μπορεί να

γραφεί χρησιμοποιώντας μεταθέσεις ομοίων αντικειμένων.

Επομένως

(1,6,2) που μπορεί να γραφεί με &!!!! = 6 διαφορετικούς τρόπους

(1,5,3) που μπορεί να γραφεί με &!!!! = 6 διαφορετικούς τρόπους

(1,4,4) που μπορεί να γραφεί με &!!! = 3 διαφορετικούς τρόπους

(2,5,5) που μπορεί να γραφεί με &!!! = 3 διαφορετικούς τρόπους

(2,4,3) που μπορεί να γραφεί με &!!!! = 6 διαφορετικούς τρόπους

(3,3,3) που μπορεί να γραφεί με &!&! = 1 διαφορετικό τρόπο

Για να βρούμε το πλήθος των ευνοϊκών περιπτώσεων αρκεί να αθροίσουμε τους

διαφορετικούς τρόπους που μπορεί να γραφεί κάθε τριάδα οι οποίοι θα είναι 25

Επομένως η πιθανότητα να πραγματοποιηθεί το γεγονός Α είναι (¡) = 256& = 0.12

(β) Εργαζόμαστε όπως και στο προηγούμενο ερώτημα για να βρούμε το πλήθος των

ευνοϊκών περιπτώσεων.

Επομένως θα γράψουμε αρχικά τις τετράδες και έπειτα θα υπολογίσουμε τους

διαφορετικούς τρόπους με τους οποίους μπορεί να προκύψει κάθε μία τετράδα.

(1,1,5,5) που μπορεί να γραφεί με #!!! = 6 διαφορετικούς τρόπους

(1,1,4,6) που μπορεί να γραφεί με #!!!! = 12 διαφορετικούς τρόπους

(1,2,3,6) που μπορεί να γραφεί με #!!!!! = 24 διαφορετικούς τρόπους

Page 49: ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ Ι – ΚΕΤΖΑΚΗ ΕΛΕΝΗ

Τμήμα Εμπορίας και Ποιοτικού Ελέγχου Αγροτικών Προϊόντων, Φλώρινα 2010-2011

49

(1,2,4,5) που μπορεί να γραφεί με #!!!!! = 24 διαφορετικούς τρόπους

(1,3,4,4) που μπορεί να γραφεί με #!!!! = 12 διαφορετικούς τρόπους

(1,3,5,3) που μπορεί να γραφεί με #!!!! = 12 διαφορετικούς τρόπους

(2,2,6,2) που μπορεί να γραφεί με #!&!! = 4 διαφορετικούς τρόπους

(2,2,5,3) που μπορεί να γραφεί με #!!!! = 12 διαφορετικούς τρόπους

(2,2,4,4) που μπορεί να γραφεί με #!!! = 6 διαφορετικούς τρόπους

(2,3,4,3) που μπορεί να γραφεί με #!!!! = 12 διαφορετικούς τρόπους

(3,3,3,3) που μπορεί να γραφεί με #!#! = 1 διαφορετικούς τρόπους

Για να βρούμε το πλήθος των ευνοϊκών περιπτώσεων αρκεί να αθροίσουμε τους

διαφορετικούς τρόπους που μπορεί να γραφεί κάθε τριάδα οι οποίοι θα είναι 125

Επομένως η πιθανότητα να πραγματοποιηθεί το γεγονός Α είναι (¡) = 1256# = 0.09

(γ) Έστω το γεγονός Ακ =Ο Α φέρνει άθροισμα 9 στο κ παιχνίδι

Το αποτέλεσμα του κάθε παιχνιδιού είναι ανεξάρτητο από τα άλλα παιχνίδια,

δηλαδή τα γεγονότα Α1,Α2,… είναι ανεξάρτητα.

Το γεγονός Κ να σταματήσει στο τρίτο παιχνίδι είναι να φέρει άθροισμα 9 στο τρίτο

παιχνίδι και να μην φέρει στα προηγούμενα. Δηλαδή Κ = Ç ⋂ Ç ⋂ &. Αφού τα

γεγονότα είναι μεταξύ τους ανεξάρτητα επομένως θα ισχύει (È) = ( Ç ⋂ Ç ⋂ &) = ( Ç) (Ç) (&) = (1 − 0.12) ∙ 0.09 = 0.093

(δ) Έστω το γεγονός Βκ =Ο Β φέρνει άθροισμα 12 στο κ παιχνίδι

Σε περίπτωση που παίζονται 3 παιχνίδια για να κερδίσει ένα από αυτά θα πρέπει ή να

κερδίσει το πρώτο παιχνίδι και να χάσει τα άλλα δύο, ή να κερδίσει το δεύτερο

παιχνίδι και να χάσει τα άλλα δύο ή να κερδίσει το τρίτο παιχνίδι και να χάσει τα άλλα

δύο.

Έστω Β3,1 =Ο Β φέρνει άθροισμα 12 σε 1 από τα 3 παιχνίδια. Επομένως &, = (′&′) ⋃(′&′) ⋃(′′&)

Επομένως

&, = (′&′) ⋃(′&′) ⋃(′′&) = 3 ∙ 0.09 ∙ 0.91 = 0.22

Page 50: ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ Ι – ΚΕΤΖΑΚΗ ΕΛΕΝΗ

Τμήμα Εμπορίας και Ποιοτικού Ελέγχου Αγροτικών Προϊόντων, Φλώρινα 2010-2011

50

ΑΣΚΗΣΗ 2

Ρίχνουμε 3 ζάρια μια φορά. Να βρεθεί

(α) Η πιθανότητα να φέρουμε άθροισμα 7

(β) Ποίο είναι πιθανότερο να φέρουμε άθροισμα 9 ή 11;

Λύση

Αρχικά θα υπολογιστεί το πλήθος των στοιχείων του δειγματικού χώρου, το πείραμα

τύχης το οποίο αφορά τον δειγματικό χώρο είναι διατάξεις επανάληψη επομένως το

πλήθος τους είναι 63.

Έστω τα γεγονότα Α = τα 3 ζάρια να έχουν άθροισμα 7

Β = τα 3 ζάρια να έχουν άθροισμα 9

Γ = τα 3 ζάρια να έχουν άθροισμα 11

Το γεγονός Α μπορεί να προκύψει από τις ακόλουθες τριάδες

(1,1,5) που μπορεί να γραφεί με &!!! = 3 διαφορετικούς τρόπους

(1,2,4) που μπορεί να γραφεί με &!!!! = 6 διαφορετικούς τρόπους

(1,3,3) που μπορεί να γραφεί με &!!! = 3 διαφορετικούς τρόπους

(2,2,3) που μπορεί να γραφεί με &!!! = 3 διαφορετικούς τρόπους

Επομένως (¡) = &33&3&V = )V = 0.07

Το γεγονός B μπορεί να προκύψει από τις ακόλουθες τριάδες

(1,2,6) που μπορεί να γραφεί με &!!!! = 6 διαφορετικούς τρόπους

(1,3,5) που μπορεί να γραφεί με &!!!! = 6 διαφορετικούς τρόπους

(1,4,4) που μπορεί να γραφεί με &!!! = 3 διαφορετικούς τρόπους

(2,2,5) που μπορεί να γραφεί με &!!! = 3 διαφορετικούς τρόπους

(2,3,4) που μπορεί να γραφεί με &!!!! = 6 διαφορετικούς τρόπους

(3,3,3) που μπορεί να γραφεί με &!&! = 1 διαφορετικό τρόπο

Επομένως (Ê) = 33&3&33V = )V = 0.12

Το γεγονός Γ μπορεί να προκύψει από τις ακόλουθες τριάδες

(1,4,6) που μπορεί να γραφεί με &!!!! = 6 διαφορετικούς τρόπους

(1,5,5) που μπορεί να γραφεί με &!!! = 3 διαφορετικούς τρόπους

(2,3,6) που μπορεί να γραφεί με &!!!! = 6 διαφορετικούς τρόπους

(2,4,5) που μπορεί να γραφεί με &!!!! = 6 διαφορετικούς τρόπους

Page 51: ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗ Ι – ΚΕΤΖΑΚΗ ΕΛΕΝΗ

Τμήμα Εμπορίας και Ποιοτικού Ελέγχου Αγροτικών Προϊόντων, Φλώρινα 2010-2011

51

(3,4,4) που μπορεί να γραφεί με &!!! = 3 διαφορετικούς τρόπους

(3,5,3) που μπορεί να γραφεί με &!!! = 3 διαφορετικούς τρόπους

Επομένως () = 3&333&3&V = YV = 0.125

Διαπιστώνουμε ότι () > ()

ΑΣΚΗΣΗ 3

Σε έναν λαβύρινθο υπάρχουν 4 διασταυρώσεις και σε κάθε διασταύρωση υπάρχουν

τρεις κατευθύνσεις, αριστερά, δεξιά και ευθεία. Υπάρχει μόνο μία σωστή διαδρομή

για την έξοδο. Ένας ποντικός διαλέγει κάθε κατεύθυνση με την ίδια πιθανότητα. Ποια

η πιθανότητα να βρει την σωστή έξοδο;

Λύση

Έστω Αi =ο ποντικός βρίσκει τη σωστή κατεύθυνση στην i-διασταύρωση, όπου

i=1,2,3,4

A=ο ποντικός βρίσκει την έξοδο

Η απόφαση που παίρνει ο ποντικός σε κάθε διασταύρωση είναι ανεξάρτητη από τις

άλλες. Οπότε θα ισχύει

(¡) = (¡¡¡&) = (¡) (¡) (¡&) = F&G# = 0.0123

ΑΣΚΗΣΗ 4

Στα 150 ποντίκια ενός εργαστηρίου τα 20 είναι μαύρα. Παίρνουμε 4 ποντίκια ποια η

πιθανότητα να πάρουμε μαύρο;

(α) Με επανάθεση

(β) Χωρίς επανάθεση

Λύση

(α) Στην περίπτωση που παίρνουμε τα ποντίκια με επανάθεση εφαρμόζουμε

διατάξεις.

Για να υπολογιστεί η πιθανότητα θα πάρουμε 20 από τα 150 ποντίκια με όλους τους

δυνατός τρόπου, επομένως = ")" F&)G& = 0.075

(β)Στην περίπτωση που παίρνουμε τα ποντίκια χωρίς επανάθεση εφαρμόζουμε

συνδυασμούς. = F" GF&"& GF)"# G = 0.353