introduction to statistics: descriptive statistics
TRANSCRIPT
สถิติพื้นฐาน
1
ความหมายของสถิติ
‣สถิติ (Statistics) การศึกษาวิธีการในการจัดการสารสนเทศเชิงปริมาณ (Study of methods handling quantitative information)
‣ เปนสาขาหนึ่งในคณิตศาสตรประยุกต
2
ประเภทของสถิติ
สถิติ
สถิติบรรยาย(Descriptive Statistics )
สถิติอางอิง(Inferential Statistics)
•การแจกแจงความถี่•การวัดแนวโนมเขาสูสวนกลาง•การวัดการกระจาย
•การทดสอบสมมติฐาน•การประมาณคา
3
สถิติบรรยายและสถิติอางอิง
จุดหมายของสถิติบรรยาย
‣ การนับ (counting)
‣ การวัด (measuring)
‣ การจัดเรียงนำเสนอในรูปตาราง(tabulating)
‣ การจัดอันดับ (Ordering)
‣ การหาความเห็นพอง (taking of censuses)
‣ การบรรยาย (Describing)
จุดหมายของสถิติอางอิง
‣ ใชทฤษฎีความนาจะเปน
(theories of probability)
4
สถิติบรรยาย
T สถิติบรรยาย (descriptive statistics) เปนเครื่องมือในการบรรยาย (describe)
หรือสรุป (summarize) หรือลด (reduce)
ขอมูลปริมาณมาก
5
ระดับของขอมูล
มาตรนามบัญญัติ (Nominal Scale)
มาตรจัดอันดับ (Ordinal Scale)
มาตรอันตรภาค (Interval Scale)
มาตรอัตราสวน (Ratio Scale)
6
‣ T การแจกแจงความถี่
‣ T การวัดแนวโนมเขาสูสวนกลาง
‣ T การวัดการกระจาย
‣ T การวัดความสัมพันธ
สถิติพรรณนา (Descriptive Statistics)
7
‣ การแจกแจงความถี่
‣ การวัดแนวโนมเขาสูสวนกลาง ‣ การวัดการกระจาย
‣ การวัดความสัมพันธ
ความถี่ รอยละ
ฐานนิยม มัธยฐาน คาเฉลี่ย พิสัย สวนเบี่ยงเบนควอไทต ความแปรปรวนสวนเบี่ยงเบนมาตรฐานสัมประสิทธิ์การกระจาย
สถิติพรรณนา (Descriptive Statistics)
8
ความถี่ (frequency)• เปนรอยขีดแทนจำนวนครั้งที่ตัวเลขปรากฏในกลุม
คะแนนที่กำหนด
• ใชเมื่อตองการเห็นภาพคะแนนของกลุมตัวอยางทั้งหมดมากกวาการเห็นตัวเลขเพียงคาเดียว (range, cluster)
• เหมาะกับขอมูลที่อยูในรูปนามบัญญัติ
• แสดงเปนตาราง กราฟ
1. การแจกแจงความถี่
9
รอยละ (Percentage)• เปนสัดสวนรอยขีดในกลุมคะแนนที่กำหนดเทียบกับจำนวน
กลุมตัวอยาง
• มีประโยชนมากกวาการแจกแจงความถี่เมื่อ
• การแจกแจงความถี่ไมเปนระบบ (จำนวนคนที่อยูในแตละกลุมคะแนนไมเทากัน)
• ใชในการเปรียบเทียบกลุมตัวอยางสองกลุมที่มีจำนวนไมเทากัน
• มักใชคูกับการแจกแจงความถี่
1. การแจกแจงความถี่
10
0
2
4
6
8
10
12
14
0 1 2 3 4 5 6 7 8 9 10 11 12 13
11
• เปนสถิติบรรยายการเฉลี่ยหรือคะแนนที่เปนตัวแทนคะแนนทั้งหมด
• เปนสถิติที่ใชกันมากทั้งในการวิจัยและการนำเสนอขอมูลเชิงปริมาณ
2. การวัดแนวโนมเขาสูสวนกลาง (Central Tendency)
12
1. ฐานนิยม (Mode) - เหมาะกับขอมูลที่มีมาตรการวัดนามบัญญัติ
- เปนขอมูลที่มีความถี่สูงสุด
เชน คะแนนสอบของนักศึกษา 10 คนเปนดังนี้
4 5 10 6 7 8 9 7 6 5
ฐานนิยม คือ ..... เพราะมีความถี่มากที่สุด
2. การวัดแนวโนมเขาสูสวนกลาง
13
2. มัธยฐาน (Median) - ใชกับขอมูลที่อยูในมาตราจัดอันดับขึ้นไป
Position of Median = N+1
- เปนคาที่อยูกึ่งกลางเมื่อขอมูลเรียงลำดับแลว
(เปอรเซนไทลที่ 50) เชน
ขอมูล 4 5 10 6 7 8 9 7 6 5
เรียงลำดับขอมูล 4 5 5 6 6 7 7 8 9 10
มัธยฐาน คือ (6+7)/2 = 6.5
2. การวัดแนวโนมเขาสูสวนกลาง
2
14
3. คาเฉลี่ย (Mean) - ใชกับขอมูลที่อยูในมาตรอันตรภาค- เปนผลที่ไดจากผลรวมคะแนนทั้งหมดของกลุมตัวอยาง หารดวยจำนวนกลุมตัวอยาง
X = x1 + x2 + x3 +... + xn
ขอมูล 4 5 10 6 7 8 9 7 6 5 คะแนนเฉลี่ยเทากับ 6.7
2. การวัดแนวโนมเขาสูสวนกลาง
N
15
ขอสังเกต- ปกตินิยมใชชนิดการวัดแนวโนมเขาสูสวนกลางใหตรงตาม
มาตรของตัวแปร
- การหาคาเฉลี่ยเปนวิธีที่นิยมที่สุด
- การแจกแจงเปนโคงปกติ mean, median, mode เปนตัวเดียวกัน
- นิยมใช median มากกวา mean เมื่อคา mean และ mode ตางกันมาก
(มีคะแนนที่เปน out liner)
2. การวัดแนวโนมเขาสูสวนกลาง
16
- มีความจำเปนเนื่องจากการวัดแนวโนมเขาสูสวนกลาง
บอกแตคาตัวแทน มิได ชี้ใหเห็นความตางระหวางคะแนนที่ได
- เปนเรื่องของความตางระหวางคะแนน
3. การวัดการกระจาย (variability)
17
1. พิสัย (Range)
- เปนความตางระหวางคาสูงสุด กับ คาต่ำสุด
Range = Max - Min
เชน 4 5 10 6 7 8 9 7 6 5
เรียงขอมูล 4 5 5 6 6 7 7 8 9 10
คาสูงสุดคือ ... คาต่ำสุดคือ ... พิสัยคือ ...
3. การวัดการกระจาย (variability)
18
2. สวนเบี่ยงเบนควอไทล (Semi-interquatile)
- เปนครึ่งหนึ่งของความตางระหวางควอไทลที่ 3 และควอไทลที่ 1 หรือใชสมการ Q = (Q3-Q1)/2
เชน 4 5 10 6 7 8 9 7 6 5
4 5 5 6 6 7 7
ควอไทลที่ 1 คือ ... ควอไทลที่ 3 คือ ...
สวนเบี่ยงเบนควอไทลคือ ...
3. การวัดการกระจาย (variability)
19
3. ความแปรปรวน (Variance)
- เปนดัชนีสะทอนใหเห็นระดับการกระจายของกลุมคะแนน (ไมมีขอบจำกัด)
- เปนคาเฉลี่ยของผลรวมกำลังสองของความเบี่ยงเบน
หรือใชสมการ
ความแปรปรวนคือ ...
3. การวัดการกระจาย (variability)
20
4. สวนเบี่ยงเบนมาตรฐาน (Standard Deviation)
- เปนรากที่สองของความแปรปรวน
สวนเบี่ยงเบนมาตรฐานคือ ...
3. การวัดการกระจาย (variability)
21
5. สัมประสิทธิ์การกระจาย (Coefficient of Variation)
- สามารถนำไปใชในการเปรียบเทียบลักษณะการกระจายของขอมูลสองชุด
- ใชเมื่อผลการวิเคราะหพบวา คาเฉลี่ยเลขคณิต และมัธยฐาน ของขอมูลสองชุดมีคาแตกตางกันมาก
3. การวัดการกระจาย (variability)
22
5. สัมประสิทธิ์การกระจาย (Coefficient of Variation)
CV = S.D/Mean
3. การวัดการกระจาย (variability)
23
- เพื่ออธิบายถึงความสัมพันธระหวางตัวแปรที่เลือกศึกษาวาสัมพันธกันในทิศทางใด
ตัวอยางเชน
สหสัมพันธอันดับ (Spearman Rank Correlation)
สหสัมพันธแบบเพียรสัน (Pearson’s Product Moment coefficient of Correlation)
4. การวัดความสัมพันธ
24
สถิติอางอิง (Inferential Statistics)T T สถิติอางอิงเปนวิธีการในการแกปญหาที่จะพยายาม
อาง (infer) คุณสมบัติของกลุมขอมูลจากกลุมตัวอยางไปยังประชากร
T T จุดหมายของสถิติอางอิงมีจุดหมายเพื่อทำนายหรือประมาณลักษณะของประชากรจากขอมูลลักษณะของ กลุมตัวอยาง
25
สถิติประเภทนี้ แบงไดเปน 2 ลักษณะ คือ
T T การประมาณคา (โปรแกรมคอมพิวเตอร)
T T การทดสอบสมมติฐาน (ใชเปนสวนใหญ)
เชน t-test, Z-test, ANOVA
chi-square
สถิติอางอิง (Inferential Statistics)
26
ความสัมพันธระหวางสถิติบรรยายและสถิติอางอิง
‣ เราใชสถิติภาคบรรยาย หรือสถิติของกลุมตัวอยางในการขยาย (generalized) ไปยังประชากรทั้งหมดภายใตขอบความคลาดเคลื่อน (margin of error) ที่กำหนด
‣ ใชสถิติอางอิงในการตรวจสอบสมมติฐานที่แสดงความสัมพันธระหวางตัวแปรในการวิจัย
‣ ยอมรับหรือปฏิเสธสมมติฐานที่ไดรับการตรวจสอบ และสรุปผลเกี่ยวกับประชากร
27