regression chap2

33
บทที่ 2 การวิเคราะห์การถดถอยเชิงเส้นอย่างง่าย การวิเคราะห์การถดถอยเชิงเส้นอย่างง่าย (simple linear regression analysis) เป็ น การวิเคราะห์การถดถอยของตัวแปรอิสระ1 ตัวและตัวแปรตาม 1 ตัวโดยตัวแปรทั ้งสอง มีความสัมพันธ์เชิงเส้นตรงกันอาจเป็นความสัมพันธ์ตามกันหรือผกผันก็ได้ รูปแบบการวิเคราะห์นี เป็นรูปแบบพื ้นฐานที่ง่ายที่สุดของการวิเคราะห์การถดถอยโดยมีตัวแบบการถดถอยคือ Y i = 0 + 1 X i + i (2.1) โดย Y i = ค่าของตัวแปรตามในลาดับทีi 0 และ 1 = พารามิเตอร์ที่ไม่ทราบค่า X i = ค่าคงที่ของตัวแปรอิสระในลาดับทีi i = ความคลาดเคลื่อน (random error) ในลาดับทีi ความคลาดเคลื่อนมีข้อกาหนดว่าต้องเป็นตัวแปรสุ่มที่มีการแจกแจงแบบปกติโดยมีค่าเฉลี่ย หรือ E( i ) เท่ากับ 0 และความแปรปรวนหรือ 2 ( i ) เท่ากับ 2 และความคลาดเคลื่อนแต่ละค่ามี ความเป็นอิสระต่อกัน เนื่องจาก i และ j ไม่มีความสัมพันธ์กันดังนั ้นอาจกล่าวได้ว่า ความแปรปรวนร่วม (covariance) มีค่าเท่ากับ 0 หรือ ( i , j ) เมื่อ i j จากข้อตกลงของ ความคลาดเคลื่อนดังกล่าวส่งผลให้ตัวแปรตาม Y แต่ละค่ามีความเป็นอิสระต่อกันและมี การแจกแจงแบบปกติที่มีค่าเฉลี่ยเท่ากับ 0 + 1 X i และความแปรปรวนเท่ากับ 2 หรือ ความแปรปรวนของความคลาดเคลื่อนนั่นเองหากเขียนในรูปแบบสัญลักษณ์ทางสถิติจะได้ว่า Y i ~ NID( 0 + 1 X i , 2 ) (Montgomery & Peck, 1992, p. 10-11) ค่าพารามิเตอร์ 0 และ 1 เรียกว่าสัมประสิทธิ ์ การถดถอย (regression coefficient) โดยค่า 1 คือความชันของสมการถดถอยที่บอกให้ทราบถึงอัตราการเปลี่ยนแปลงของค่าเฉลี่ยของ การแจกแจงของตัวแปร Y เมื่อตัวแปรอิสระ X มีค่าเพิ่มขึ ้น 1 หน่วยในขณะที 0 คือจุดตัดแกน Y ของสมการถดถอยหรือเป็นค่าเฉลี่ยของการแจกแจงของตัวแปรตาม Y เมื่อตัวแปรอิสระ X มีค่า เท่ากับ 0 การตีความ 0 นั ้นหากข ้อมูลที่นามาศึกษามิได้ครอบคลุมค่า 0 แล้วไม่สมควรที่จะตีความ ค่า 0

Upload: mang-cheteh

Post on 10-Apr-2016

48 views

Category:

Documents


2 download

DESCRIPTION

-

TRANSCRIPT

Page 1: regression chap2

บทท 2 การวเคราะหการถดถอยเชงเสนอยางงาย

การวเคราะหการถดถอยเชงเสนอยางงาย (simple linear regression analysis) เปน

การว เคราะหการถดถอยของตวแปรอสระ1 ตวและตวแปรตาม 1 ตวโดยตวแปรท งสอง มความสมพนธเชงเสนตรงกนอาจเปนความสมพนธตามกนหรอผกผนกได รปแบบการวเคราะหนเปนรปแบบพนฐานทงายทสดของการวเคราะหการถดถอยโดยมตวแบบการถดถอยคอ

Yi = 0 + 1Xi + i (2.1)

โดย Yi = คาของตวแปรตามในล าดบท i 0 และ 1 = พารามเตอรทไมทราบคา Xi = คาคงทของตวแปรอสระในล าดบท i i = ความคลาดเคลอน (random error) ในล าดบท i

ความคลาดเคลอนมขอก าหนดวาตองเปนตวแปรสมทมการแจกแจงแบบปกตโดยมคาเฉลยหรอ E(i) เทากบ 0 และความแปรปรวนหรอ 2(i ) เทากบ

2 และความคลาดเคลอนแตละคามความเปนอสระตอกน เ นองจาก i และ j ไม มความสมพนธกนดงน นอาจกลาวไดวา ความแปรปรวนรวม (covariance) มคาเทากบ 0 หรอ (i, j) เมอ i ≠ j จากขอตกลงของ ความคลาดเคลอนดงกลาวสงผลใหตวแปรตาม Y แตละคามความเปนอสระตอกนและม การแจกแจงแบบปกตทมคาเฉลยเทากบ 0 + 1Xi และความแปรปรวนเทากบ2 หรอ ความแปรปรวนของความคลาดเคลอนนนเองหากเขยนในรปแบบสญลกษณทางสถตจะไดวา Yi ~ NID(0 + 1Xi,

2) (Montgomery & Peck, 1992, p. 10-11) คาพารามเตอร 0 และ 1 เรยกวาสมประสทธการถดถอย (regression coefficient)

โดยคา 1 คอความชนของสมการถดถอยทบอกใหทราบถงอตราการเปลยนแปลงของคาเฉลยของการแจกแจงของตวแปร Y เมอตวแปรอสระ X มคาเพมขน 1 หนวยในขณะท 0 คอจดตดแกน Y ของสมการถดถอยหรอเปนคาเฉลยของการแจกแจงของตวแปรตาม Y เมอตวแปรอสระ X มคาเทากบ 0 การตความ 0 นนหากขอมลทน ามาศกษามไดครอบคลมคา 0 แลวไมสมควรทจะตความคา 0

Page 2: regression chap2

10

Hair et al (2010, p 176) กลาววาขนาดตวอยางทเพยงพอในการวเคราะหสมการถดถอยเชงเสนอยางงายนนเทากบ 20 ขอมล

2.1 การประมาณคาพารามเตอรโดยวธก าลงสองนอยทสด การวเคราะหการถดถอยเชงเสนอยางงายเปนการสรางสมการถดถอยหรอสรางตวแบบของ

ประชากรโดยตวแบบทสรางขนแสดงไดดงสมการ (2.1) เนองจากในสมการดงกลาวนกวจย ไมทราบคาพารามเตอร 0 และ 1 จงตองใชขอมลทไดจากตวอยางหรอขอมลทไดเกบรวบรวมมาเพอประมาณคาของพารามเตอรทงสองเพอใชในพยากรณคาของตวแปรตามหรอ Y คาพยากรณนเรยก fitted value โดยคาพยากรณสามารถเขยนไดดงน

ii XY 10ˆˆˆ (2.2)

โดยท 0 และ 1 คอคาประมาณของพารามเตอร 0 และ 1 ตามล าดบ ในการประมาณคาพารามเตอร 0 และ 1 นนมดวยกนหลายวธแตวธทเปนทนยมคอ

วธก าลงสองนอยทสด (ordinary least square estimation) หลกการของวธนคอ การประมาณคาพารามเตอรใหคาผลรวมก าลงสองของสวนเหลอ (residual) ทนอยทสด สวนเหลอ (ei) คอ คาความแตกตางระหวางคาจรงของตวแปรตาม Y กบคาพยากรณทไดจากสมการถดถอย ( Y ) ทระดบเดยวกนของคาของตวแปรอสระ X หรอสามารถเขยนไดดงน

ei = Yi - iY = Yi - (0 + 1Xi) (2.3)

ความคลาดเคลอน () เปนคาทไดจากประชากรแตสวนเหลอ (e) เปนความคลาดเคลอนทไดจากตวอยาง

2.1.1 ตวประมาณคาพารามเตอร 0 และ 1 ก าหนดให Q เปนคาผลรวมก าลงสองของความคลาดเคลอนทนอยทสดหรอ

n

i

ii XYQ1

2

10 (2.4)

ในการค านวณเพอใหไดคา Q ทนอยทสดนนตองหาอนพนธยอยเทยบกบคา 0 และ 1 (Abraham & Ledolter, 2006, p.28-29) โดยสามารถเขยนสมการทงสองไดดงน

n

i

ii XYQ

1

10

0

2

และ

Page 3: regression chap2

11

i

n

i

ii XXYQ

1

10

1

2

จากนนก าหนดใหสมการทงสองมคาเทากบ 0 จะไดคาประมาณของ 0 และ 1 โดยใช b0 และ b1 แทนคาประมาณดงกลาวตามล าดบดงน

021

10

n

i

ii XbbY

และ

021

10

i

n

i

ii XXbbY

โดยการหารทงสองสมการดวย 2 จากนนกระจายผลบวกและยายขางจะไดสมการปกต (normal equation) ดงสมการ (2.5) และ (2.6)

n

i

i

n

i

i YXbnb11

10 (2.5)

และ

n

i

ii

n

i

i

n

i

i YXXbXb11

21

1

0 (2.6)

จากการแกสมการปกตทงสองจะได XbYb 10 (2.7) และ

xx

xy

n

i

i

i

n

i

i

S

S

XX

XXY

b

1

2

11

)(

)(

(2.8)

โดย n

X

XXXS

n

i

in

i

i

n

i

ixx

2

1

1

2

1

2)(

(2.9)

และ

n

YX

YXXXYS

n

i

i

n

i

in

i

iii

n

i

ixy

11

11

)( (2.10)

Page 4: regression chap2

12

ตวอยางท 2.1 จากขอมลในตวอยางท 1.1 จงสรางสมการถดถอยโดยวธก าลงสองนอยทสด วธท า จากขอมลจะสามารถค านวณคา b0 และ b1 ดงน

n

X

XS

n

i

in

i

ixx

2

1

1

2

= 7,733.41 - 13

)41.299( 2

= 837.54

และ

n

YX

YXS

n

i

i

n

i

in

i

iixy

11

1

= 62,978.59 - 13

50.435,241.299 = 6,885.28

ดงนนจากสมการ (2.6) และ (2.7) จะได

22.854.837

28.885,61

xx

xy

S

Sb

และ XbYb 10 = 187.35 - 8.22 × 23.03 = -1.99 ดงนนสมการถดถอยคอ ii XY 22.899.1ˆ

60

110

160

210

260

310

0 5 10 15 20 25 30 35 40

คาใชจาย

ยอดขาย XY 22.899.1ˆ

xy 22.899.1ˆ

y

y e

Page 5: regression chap2

13

จากสมการถดถอยทไดสามารถอธบายความหมายของคา b0 และ b1 ไดโดย b1 เทากบ 8.22 หมายถงเมอคาใชจายในการโฆษณาเพมขน 1 ลานบาทจะท าใหยอดขายเฉลยเพมขน 8.22 ลานบาท ส าหรบการอธบายความหมายของ b0 นนไมสมควรจะตความเนองจากคาของขอมลไมครอบคลมคาใชจายในการโฆษณาเทากบ 0 หรอเมอไมมการโฆษณานนเอง คาพยากรณของ Y หรอ Y ท X แตละคาแสดงดงคอลมนท 3 ของตารางขางลางและสวนเหลอ (e) ไดดงคอลมนท 4 เมอมคาใชจายในการโฆษณา 10.01 ลานบาทแลวจะมยอดขายเฉลย 80.30 ลานบาทหรอ 30.8001.1022.899.1ˆ y และมคาคลาดเคลอนเทากบ y - y หรอ 77.60 – 80.30 = - 2.70

Xi Yi iY ei 10.01 77.60 80.30 -2.70 14.75 114.90 119.26 -4.36 17.94 141.40 145.49 -4.09 23.93 190.80 194.73 -3.93 29.61 239.90 241.43 -1.53 35.18 270.00 287.22 -17.22 33.50 280.00 273.41 6.59 12.45 100.50 100.36 0.14 20.04 180.40 162.75 17.65 18.60 145.00 150.92 -5.92 30.00 210.00 244.63 -34.63 32.00 300.00 261.07 38.93 21.40 185.00 173.93 11.07

41.299ix 50.435,2iy 50.435,2ˆiy 00.0ie

หากใชโปรแกรม MINITABชวยในการค านวณสามารถท าไดดงน 1. เลอก “Stat” ทเมนบาร 2. เลอก “Regression” 3. เลอก “Regression…” 4. ระบตวแปรตามใน “Response:” และตวแปรอสระใน “Predictors:”

Page 6: regression chap2

14

5. หากตองการใหทดสอบขอตกลงใหเลอกเขาไประบท “Options” 6. หากตองการใหเกบคาคลาดเคลอนและชนดตางๆ และคาพยากรณใหเขาไประบท “Storage” 7. หากตองการใหแสดงผลลพธตางๆ เชน ตาราง ANOVA และคาสมประสทธการตดสนใจ (R2) เปนตนใหเขาไประบท “Results” 8. หากตองการใหแสดงกราฟชนดตางๆ ใหเขาไประบท “Graphs” จากนนคลก “OK” ดงภาพท 2.1

ภาพท 2.1 หนาจอการวเคราะหการถดถอย จากตวอยางท 2.1 หากใชโปรแกรม MINITAB ชวยในการค านวณแลวจะไดผลลพธ ดงภาพท 2.2 โดยในหนาตาง “Session” แสดงสมการถดถอยในบรรทดแรกและสวนถดมาแสดง คา b0 และ b1 พรอมทงการทดสอบและคา p-value (จะอธบายในล าดบตอๆ ไป) สวนถดมาเปนตาราง ANOVA (จะอธบายในล าดบตอๆ ไป) อกทงแสดงคาทโปรแกรมสงสยวาจะเปน คาทผดปกต (outlier) ส าหรบในหนาตาง “Worksheet” แสดงคาสวนเหลอ (Res1) และคาพยากรณ (FITS1)

Page 7: regression chap2

15

ภาพท 2.2 หนาจอผลลพธของการวเคราะหการถดถอย

2.1.2 คณสมบตของตวประมาณคา b0 และ b1

โดยทฤษฎของเกาส-มารคอฟ (Guass-Markov theorem) จะไดวาตวประมาณคา b0 และ b1 ทไดจากวธก าลงสองนอยทสดเปนตวประมาณคาทไมเอนเอยง (unbiased) หรอ E(b0) = 0 และ E(b1) = 1 และมความแปรปรวนนอยทสดในบรรดาตวประมาณคาเชงเสนทไมเอนเอยง (unbiased linear estimator) หรออาจเรยกตวประมาณคาทงสองตวนวา best linear unbiased estimator (BLUE) โดยท best หมายถงการทมความแปรปรวนทนอยทสดโดยคาความแปรปรวนของ b0 และ b1 มคาดงน

xxS

X

nbV

22

0

1)( (2.11)

และ

xxS

bV2

1)(

(2.12)

โดย 2 = ความแปรปรวนของความคลาดเคลอน ()

Page 8: regression chap2

16

2.1.3 การประมาณคาความแปรปรวน เนองจากคาความแปรปรวน (2) เปนคาทไมทราบคาจงตองท าการประมาณคา 2 โดยใชคาเฉลยก าลงสองความคลาดเคลอน (mean square error หรอ MSE) การค านวณหาคา MSE เรมจากการหาผลรวมก าลงสองความคลาดเคลอน (error sum of squares หรอ SSE) ท าไดดงน

n

i

ii

n

i

i YYeSSE1

2

1

2 )ˆ( (2.13)

หรอสามารถเขยน SSE ในรปของ Syy และ Sxy ดงน

SSE = Syy – b1Sxy (2.14)

โดยท n

Y

YS

n

i

in

i

iyy

2

1

1

2

และ n

YX

YXS

n

i

i

n

i

in

i

iixy

11

1

ในการค านวณคาความแปรปรวนของตวอยางท าโดยการหารดวยองศาเสร โดยองศาเสรของ SSE เทากบ n - 2 เนองจากการสญเสยองศาเสรไป 2 คาในการประมาณคาพารามเตอร 0 และ 1 ดวย b0 และ b1 ดงนน

2ˆ 2

n

SSEMSE (2.15)

นอกจากนพบวา MSE เปนตวประมาณคาทไมเอนเอยงของ 2 ส าหรบตวประมาณคาของสวนเบยงเบนมาตรฐานของความคลาดเคลอน () แลวสามารถใช MSE เปนตวประมาณคา หนงสอบางเลมอาจเรยกคา MSE วาคาความคลาดเคลอนมาตรฐานของการถดถอย (standard error of regression) ซงจะงายในการตความมากกวาความแปรปรวนเนองจากมหนวยเดยวกนกบ คาของตวแปรตาม Y ตวอยางท 2.2 จากตวอยางท 2.1 จงประมาณคาของ 2 วธท า เนองจากตวประมาณคาของ 2 คอ MSE สามารถค านวณไดดงน

n

Y

YS

n

i

in

i

iyy

2

1

1

2

Page 9: regression chap2

17

13

)50.435,2(79.468,516

2

= 60,187.23

Sxy = 6,885.28 (จากตวอยาง 2.1) ดงนน SSE = Syy – b1Sxy = 60,187.23 – 8.22 × 6,885.28 = 3584.26 เนองจาก SSE มองศาเสรเทากบ 13 – 2 = 11 ดงนน

2

n

SSEMSE

= 84.325213

26.3584

และคาคลาดเคลอนมาตรฐานของการถดถอย ( MSE ) เทากบ 05.1884.325 ลานบาท สามารถอธบายความหมายของ MSE ไดโดยพจารณาทคาใชจาย (X) เทากบ 10.01 ลานบาทแลวพบวาคาเฉลยของการแจกแจงของยอดขายมคาประมาณ 80.30 ลานบาท เมอพจารณาความแปรผนของยอดขายทคาใชจายเทากบ 10.01 ลานบาทแลวพบวาความแปรผนของยอดขายนคอนขางมาก (18.05 ลานบาท) เมอเทยบกบคาเฉลยของยอดขายคอ 80.30 ลานบาท หากพจารณาทหนา “Session” ของ output ในตวอยางท 2.1 จะเหนวาคาองศาเสร SSE และ MSE จะอยในบรรทดท 2 (Residual error) ของตาราง ANOVA และคา MSE คอคา S ทอยระหวางสวนของคาประมาณ b0 และ b1 กบตาราง ANOVA

2.1.4 คณสมบตของคาพยากรณและสวนเหลอ คาพยากรณ ( Y ) และสวนเหลอ (e) ทไดจากวธก าลงสองนอยทสดนนมคณสมบตดงน

(1) ผลรวมของสวนเหลอเทากบ 0

0)ˆ(11

n

i

i

n

i

ii eYY

คณสมบตนมาจากสมการปกต (2.5) ดงในคอลมนท 4 ของตารางในตวอยาง 2.1 แตบางครงจะพบวาผลรวมอาจไมเทากบ 0.00 ทงนอาจเนองมาจากการปดเศษกได

(2) ผลรวมของคาจรง Y เทากบผลรวมของคาพยากรณ Y

n

i

i

n

i

i YY11

ˆ

จากคอลมนท 2 และ 3 ของตารางในตวอยางท 2.1 จะเหนวาผลรวมของทงสองเทากน

Page 10: regression chap2

18

(3) ผลรวมของสวนเหลอก าลงสอง (

n

i

ie1

2 ) โดยวธนมคานอยทสดเมอเปรยบเทยบกบ

คาทไดจากวธอนๆ (4) เสนถดถอยจะลากผานจดทเปนคากลาง YX , เสมอ (5) ผลรวมของสวนเหลอทถวงน าหนกดวยคา X จะมคาเทากบ 0

01

n

i

iieX

(6) ผลรวมของสวนเหลอทถวงน าหนกดวยคาพยากรณจะมคาเทากบ 0

1

n

i

iieY

2.1.5 ตวแบบถดถอยทลบออกดวยคากลาง ตวแบบถดถอยนสามารถท าไดงายๆ โดยการหกลบคาตวแปรอสระออกดวยคาเฉลยของตวแปรอสระหรอ )( ii XX คา X ชนดนเรยก centered X สมการถดถอยแสดงไดโดยการเพมคา X1 และ - X1 เขาไปในสมการถดถอยดงน ii XXXY 1110 )( iXXX )()( 1110

iXX )( 110 (2.16)

โดย X100 หลงจากประมาณคาพารามเตอรพบวาจดเรมตนของขอมลในตวแบบนจะอยทคาเฉลย YX , สามารถแสดงไดโดยพจารณาจากสมการ (2.7) ดงน YXbXbYXbbb 11100 )( (2.17)

xx

xy

n

i

i

n

i

ii

S

S

XX

XXY

b

1

2

11

)(

)(

(2.18)

จากสมการ (2.17) จะเหนวาจดตดแกน Y จะอยทคาเฉลยของ Y และยงพบอกวาคาความชน (b1) ไมเปลยนแปลงดงนนคาพยากรณสามารถเขยนไดดงน )(ˆ

1 XXbYY ii (2.19) คาพยากรณทไดโดยวธนจะเทากบคาพยากรณโดยวธทกลาวมาแลวแตอาจแตกตางกนไดเลกนอยเนองจากการปดเศษ ขอดของวธนคอสมการปกตค านวณไดงายกวาสมการ (2.7)

Page 11: regression chap2

19

เพราะคา b0 คอคาเฉลยของตวแปรตามนนเอง นอกจากนคา b0 และ b1 เปนอสระตอกนหรอ COV( b0, b1) = 0 ท าใหการค านวณชวงความเชอมนของคาคาดหวงของ Y งายขน ตวอยาง 2.3 จากขอมลในตวอยาง 2.1 จงสรางสมการถดถอยโดยการลบออกดวยคากลาง วธท า จากตวอยางท 2.1 พบวา x = 23.03, y = 187.35 และ b1 = 8.22 ดงนนสมการถดถอยคอ )(ˆ

1 XXbYY ii )03.23(22.835.187 X

พจารณาคาพยากรณของขอมลแรก, x = 10.01 จะได )03.2301.10(22.835.187ˆ y = 80.33 พบวามคาใกลเคยงกบคาทไดในตวอยาง 2.1 (80.30) คาทไดแตกตางกนเลกนอยเนองจากการปดเศษ

2.2 การอนมานของตวประมาณคาของสมการถดถอย ในหวขอ 2.1 ไดกลาวถงการประมาณคาพารามเตอร 0 และ1 แบบจดโดยใชสมการ (2.7) และ (2.8) บางครงนกวจยอาจสนใจในการอนมานคาหรอตองการประมาณคาแบบชวงและทดสอบสมมตฐานของคาพารามเตอรทงสอง

2.2.1 การประมาณคาแบบชวงของตวประมาณคาของสมการถดถอย ในหวขอนจะกลาวถงการสรางชวงความเชอมนหรอการประมาณคาแบบชวงของคาพารามเตอร 0 และ1

2.2.1.1 การแจกแจงของตวประมาณคา b0 และb1 การสรางชวงความเชอมนของ ตวประมาณคานนจ าเปนตองทราบถงการแจกแจงของตวประมาณคาทงสองกอนเพอใหเขาใจ การอนมานไดดขน การใชวธก าลงสองนอยทสดในการสรางสมการถดถอยมขอตกลงวา คาคลาดเคลอนตองมการแจกแจงแบบปกต จากขอตกลงนตวแปรตาม Y และคาประมาณ b0 และb1 มการแจกแจงแบบปกต

b0 มคาเฉลยเทากบ 0 และมความแปรปรวนเทากบ

xxS

X

n

22 1

หรอสามารถเขยนได

ในรป

xxS

X

nNb

22

00

1,~ จะเหนวา b0 เปนตวประมาณคาทไมเอนเอยง (unbiased

Page 12: regression chap2

20

estimator) เนองจากคาเฉลยมคาเทากบคาพารามเตอร นอกจากนหากพจารณาคาความแปรปรวนจะเหนวาคาความแปรปรวนของคาประมาณนขนกบขนาดของขอมล (n) ทน ามาสรางสมการถดถอยและขอบเขตของตวแปรอสระ X โดยความแปรปรวนของคาประมาณ b0 จะลดลงเมอขนาดตวอยางมากขนเมอก าหนดใหขอบเขตของ X คงทและความแปรปรวนของคาประมาณ b0 จะลดลงเมอขอบเขตของ X มากขนเมอก าหนดใหขนาดตวอยางคงท

b1 มคาเฉลยเทากบ 1 และมความแปรปรวนเทากบ xxS

2 หรอสามารถเขยนไดในรป

xxSNb

2

11 ,~

จะเหนวา b1 เปนตวประมาณคาทไมเอนเอยงเชนเดยวกบ b0 แตคาความ

แปรปรวนของ b1 ไมขนกบขนาดของตวอยางแตขนอยกบขอบเขตของตวแปรอสระ X ในการค านวณคาความแปรปรวนของคาประมาณ b0 และb1 นนตองมการประมาณคา

2 โดยใชคา MSE ดงนนความแปรปรวนของคาประมาณ b0 และb1 คอ

S2(b0) =

xxS

X

nMSE

21 (2.20)

และ

S2(b1) =xxS

MSE (2.21)

หากน าคาความแปรปรวนของตวประมาณคาท งสองมาถอดรากจะไดคาความคลาดเคลอนมาตรฐาน (standard error) ของ b0 และb1 หรอ se(b0) และ se(b1) คาความแปรปรวนหรอ คาคลาดเคลอนมาตรฐานจะบอกถงความถกตองแมนย าในการประมาณคาทงสอง

2.2.1.2 ชวงความเชอมนของตวประมาณคา b0 และb1 ชวงความเชอมนของตวประมาณคา จะบอกถงคณภาพของตวประมาณคา ตวประมาณคาทดควรมชวงความเชอมนทแคบ เนองจาก b0

และb1 มการแจกแจงแบบปกตดงนนหากน าคาประมาณแตละคามาลบดวยคาเฉลยและหารดวยสวนเบยงเบนมาตรฐานแลวจะไดการแจกแจงททมองศาเสรเทากบ n – 2 ดงน

22

00 ~

1

n

xx

t

S

X

nMSE

b

และ

211 ~

n

xx

t

S

MSE

b

Page 13: regression chap2

21

ดงนนชวงความเชอมน 100(1- )% ของ 0 คอ

xx

n

xx

nS

X

nMSEtb

S

X

nMSEtb

2

2,2/00

2

2,2/0

11 (2.22)

และชวงความเชอมน 100(1- )% ของ 1 คอ

xx

n

xx

nS

MSEtb

S

MSEtb 2,2/112,2/1 (2.23)

การอธบายความหมายของชวงความเ ชอมนท งสองสามารถอธบายไดดง น คอ หากสมตวอยาง 100 ครงโดยใหมขนาดเทาเดมทกครงและทคา X ชดเดยวกนแลวน ามาสรางชวง ความเชอมน 95% ของคา 0 แลวพบวา 95 ชวงใน 100 ชวงทไดครอบคลมคาทแทจรงของ 0 ในกรณของ 1 สามารถอธบายไดเชนเดยวกน

ตวอยางท 2.4 จากขอมลในตวอยาง 2.1 จงสรางชวงความเชอมน 95% ของคา 0 และ 1 วธท า ความคลาดเคลอนมาตรฐานของ 0 เทากบ

se(b0) =

xzS

X

nMSE

21

54.837

03.23

13

184.325

2

= 15.21

และความคลาดเคลอนมาตรฐานของ 1 เทากบ

se(b1) = xxS

MSE

54.837

84.325 = 0.624

คา t ไดจากตารางท 1 ในภาคผนวกโดย t / 2, n - 2 = t0.025, 13 = 2.201 ดงนนชวงความเชอมน 95% ของ 0 เทากบ

xx

n

xx

nS

X

nMSEtb

S

X

nMSEtb

2

2,2/00

2

2,2/0

11

21.15201.299.121.15201.299.1 0 -35.472 < 0 < 31.492 และชวงความเชอมน 95% ของ 1 เทากบ

Page 14: regression chap2

22

xx

n

xx

nS

MSEtb

S

MSEtb 2,2/112,2/1

624.0201.222.8624.0201.222.8 1 6.847 < 1 < 9.593

ดงนนเชอมนได 95% วายอดขายเฉลยมคาเพมขนอยระหวาง 6.847 และ 9.593 ลานบาทเมอเพมคาใชจายในการโฆษณาขน 1 ลานบาท แตเนองจากในโจทยนอาจไมเหมาะสมทจะตความหมายของชวงความเชอมนของ 0 เนองจากขอมลมไดครอบคลมคา x ทเทากบ 0 หรอมไดครอบคลมเมอไมมการโฆษณาเกดขนแตแสดงใหดในทนเพอเปนตวอยางในการค านวณเทานน

2.2.2 การทดสอบสมมตฐานของคาพารามเตอร 0 และ1 นอกเหนอจากการสรางชวงความเชอมนของคาพารามเตอรแลวการทดสอบสมมตฐานของคาพารามเตอร 0 และ1 จากหวขอ 2.2.1.2 กลาววา (b0 - 0)/ se(b0) และ (b1 - 1)/ se(b1) มการแจกแจงแบบ t มองศาเสรเทากบ n – 2

การทดสอบสมมตฐานของคา 0 และ1 กบคาใดๆ (00 และ10) สามารถทดสอบไดทงหางเดยวและสองหาง การทดสอบท าขนเพอใหทราบวาคาพารามเตอรทงสองมคาแตกตางจากคาทสนใจหรอไม โดยในกรณของ 0 จะทดสอบวาทคา x = 0 แลวคา y มคาเทากบคาทสนใจ (00) หรอไมและในกรณของ 1 เปนการทดสอบวาคาความชนเทากบคาทสนใจ (10) หรอไม โดยมขนตอนดงน

(1) ตงสมมตฐาน กรณของ 0

H0: 0 = 00 H1: 0 ≠ 00 (กรณทดสอบสองหาง)

หรอ H1: 0 < 00 (กรณทดสอบหางซาย) หรอ H1: 0 > 00 (กรณทดสอบหางขวา)

กรณของ 1 H0: 1 = 10 H1: 1 ≠ 10 (กรณทดสอบสองหาง)

หรอ H1: 1 < 10 (กรณทดสอบหางซาย) หรอ H1: 1 > 10 (กรณทดสอบหางขวา)

(2) ก าหนดระดบนยส าคญ ()

Page 15: regression chap2

23

การก าหนดระดบนยส าคญเปนการก าหนดโอกาสในการตดสนใจผดพลาดแบบท 1 (3) คาวกฤต (critical value) คาวกฤตของทง 0 และ1 จะเหมอนกน ในกรณของการทดสอบสองหางแลวคาวกฤต

ของการทดสอบทงสองคอ t/ 2, n – 2 ส าหรบกรณของการทดสอบหางซายคาวกฤตคอ - t, n – 2 และ

กรณของการทดสอบหางขวาคาวกฤตคอ t, n – 2 โดยทคาวกฤตไดจากการเปดตารางสถต t ในภาคผนวก (4) คาสถต กรณของ 0

xxS

X

nMSE

bt

2

00

1

)( (2.24)

กรณของ 1

xxS

MSE

bt

)( 11 (2.25)

(5) เปรยบเทยบคาสถตกบคาวกฤตและท าการตดสนใจ กรณการทดสอบสองหาง

หาก | t | < t/ 2, n – 2 แลวไมปฏเสธสมมตฐานหลก (H0)

หาก | t | > t/ 2, n – 2 แลวปฏเสธสมมตฐานหลก (H0)

กรณการทดสอบหางซาย

หาก t > - t, n – 2 แลวไมปฏเสธสมมตฐานหลก (H0)

หาก t < -t, n – 2 แลวปฏเสธสมมตฐานหลก (H0) กรณการทดสอบหางขวา

หาก t < t, n – 2 แลวไมปฏเสธสมมตฐานหลก (H0)

หาก t > t, n – 2 แลวปฏเสธสมมตฐานหลก (H0)

หมายเหต

1. สวนใหญมกจะไมทดสอบคา0 เนองจากสวนใหญนกวจยไมไดเกบขอมลทครอบคลมคา 0

Page 16: regression chap2

24

2. หากท าการทดสอบ1 เทยบกบคา 0 แลวเปนการทดสอบวาตวแปร X และ Y มความสมพนธเชงเสนตรงกนหรอไม หากปฏเสธสมมตฐานหลกแสดงวาตวแปรท งสอง มความสมพนธเชงเสนตรงกน หรอสามารถกลาวไดอกแบบหนงวาตวแปร X สามารถอธบายความแปรผนในตวแปร Y ได

3. หากนกวจยทราบคาความแปรปรวนของประชากร (2) แลวสมการ (2.24) และ (2.25) จะมการแจกแจงแบบปกตมาตรฐาน (Z) ไมใชการแจกแจงแบบ t และแทนคา MSE ในสมการ ทงสองดวย 2 และเปดตาราง Z แทนตาราง t นอกจากนหากขนาดตวอยางใหญแลวสามารถใชการแจกแจงแบบ Z ได

4. นอกจากการตดสนใจโดยการเปรยบเทยบจากคาสถตแลวยงสามารถใชคา p-value ในการตดสนใจไดอกดวย โปรแกรมทางสถตสวนใหญจะแสดงคา p-value บางครงเรยกคา p-value วา observed level of significance

5. คา p-value คอ คาความนาจะเปนทไดคาสถตภายใตสมมตฐานหลก ในการตดสนใจสามารถท าไดโดยการเปรยบเทยบคา p-value กบระดบนยส าคญ () หาก p-value < แลวจะปฏเสธสมมตฐานหลกและหาก p-value > แลวจะไมปฏเสธสมมตฐานหลก เชน หากคา p-value มคา 0.40 เมอคา t = 2.561 แสดงวาโอกาสทจะไดคาสถตเทากบ 2.561 นนมสงถง 40% หากสมมตฐานหลกเปนจรง ดงนนหากก าหนด = 0.05 แลวจะไมปฏเสธสมมตฐานหลก เปนตน

6. การเปรยบเทยบคา p-value กบคา จะเหมอนกนทงการทดสอบสองหางและหางเดยว 7. หากคา p-value มคาต ากวา 0.000 แลวโปรแกรมสถตสวนใหญจะแสดงคา p-value เปน

0.000

ตวอยาง 2.5 จากขอมลในตวอยาง 2.1 จงทดสอบวา (1) 1 = 9 หรอไมและ (2) ตวแปรทงสองมความสมพนธกนเชงเสนตรงหรอไมโดยทดสอบทระดบนยส าคญ 0.05 วธท า (1) เนองจาก 10 = 9 และเปนการทดสอบสองหางดงนนสมมตฐานคอ

H0 : 1 = 9

H1 : 1 ≠ 9

ทระดบนยส าคญ () 0.05 และ n = 13 ดงนนคาวกฤตคอ t/ 2, n – 2 = t0.025, 11 = 2.201 ดงนนคาสถต t คอ

Page 17: regression chap2

25

xxS

MSE

bt

)( 11

251.1

54.837

84.325

)922.8(

เมอเปรยบเทยบคาสถตกบคาวกฤตพบวา | -1.251 | < 2.201 จงไมปฏเสธสมมตฐานหลก (H0) นนคอคาความชนของสมการถดถอยนเทากบ 9 ทระดบนยส าคญ 0.05 (2) เนองจากตองการทดสอบวาตวแปรทงสองมความสมพนธเชงเสนตรงกนหรอไมคอการทดสอบวา 1 = 0 หรอไม ดงนนสมมตฐานคอ

H0 : 1 = 0

H1 : 1 ≠ 0 คาวกฤตจะเทากบคาวกฤตในขอ (1) คอ 2.201 ดงนนคาสถต t คอ

xxS

MSE

bt 1

179.13

54.837

84.325

22.8

เมอเปรยบเทยบคาสถตกบคาวกฤตพบวา | 13.179 | > 2.201 จงปฏเสธสมมตฐานหลก (H0) นนคอตวแปรทงสองมความสมพนธเชงเสนตรงกนทระดบนยส าคญ 0.05 หมายเหต หากเปรยบเทยบคาสถตทไดจาก (2) กบผลลพธจาก MINITAB ในตวอยาง 2.1 โดยดจากบรรทดท 5 คอลมนท 4 นอกจากน MINITAB ยงแสดงคา p-value ในคอลมนสดทายอกดวย โดย p-value = 0.000 < (0.05)

Page 18: regression chap2

26

2.2.3 การประมาณคาแบบชวงของตวพยากรณ นอกจากตวประมาณคาของพารามเตอรท งสองแลวบางครงนกวจยอาจสนใจ

ตวประมาณคาอนๆ เชน คาคาดหวงของตวแปรตามหรอคาพยากรณ เปนตน ตวประมาณคาทจะกลาวถงในทนคอ (1) ตวประมาณคาพยากรณของคาคาดหวงของ Y หรอคาเฉลยของ Y (mean response) หรอ E(y|x0) เมอ x = x0 หรอเมอ x มคาใดๆ ทอยในชวงของขอมลทสนใจ (2) ตวประมาณคาพยากรณของ Y จ านวน 1 คาเมอ x = x0 โดยท x0 คอคาทไมไดอยขอมลและ (3) ตวประมาณคาเฉลยของคาพยากรณของ Y จ านวน m คา ตวประมาณคาพยากรณทงสามจะเขยนไดในรปของ 0100

ˆ xbby ความแตกตางระหวางคาพยากรณของคาคาดหวงกบคาพยากรณของ Y คอคาพยากรณของคาคาดหวงเปนการพยากรณคาเฉลยของการแจกแจงของ Y ท x0 เชน คาพยากรณของยอดขายโดยเฉลยทคาใชจายเทากบ 8 ลานบาท เปนตน แตคาพยากรณของคา Y เปนการพยากรณคาของขอมลแตละตว เชน คาพยากรณของยอดขายทคาใชจายเทากบ 8 ลานบาท เปนตน หากท าการพยากรณ ณ คา x ใดทมากกวา 1 ครงแลวจะเปนการพยากรณจ านวน m ครงเมอ m มคามากกวา 1 ซงคาทไดเปนคาเฉลยของคาพยากรณและโดยทฤษฎแลวเมอ m มากขนเรอยแลวการพยากรณคาเฉลยนจะเขาสการพยากรณคาคาดหวง

2.2.3.1 การแจกแจงของตวประมาณคาพยากรณ ตวประมาณคาพยากรณกเชนเดยวกบตวประมาณคาพารามเตอรทมการแจกแจงแบบปกตแตมคาเฉลยและความแปรปรวนทแตกตางกนดงน

ตวประมาณคาพยากรณของคาคาดหวงของ Y หรอ E(y|x0) มคาเฉลยเทากบ

X10 และความแปรปรวนเทากบ

xxS

Xx

n

2

02 1 หรอสามารถเขยนไดในรป

xxS

Xx

nXNy

2

02100

1,~ˆ

ตวประมาณคาพยากรณของ Y จ านวน 1 คามคาเฉลยเทากบ X10 และความ

แปรปรวนเทากบ

xxS

Xx

n

2

02 11 หรอสามารถเขยนไดในรป

xxS

Xx

nXNy

2

02100

11,~ˆ เมอพจารณาความแปรปรวนพบวาความแปรปรวน

ของตวประมาณคาพยากรณของ Y นนมคามากกวาตวประมาณคาพยากรณของคาคาดหวงของ Y

Page 19: regression chap2

27

ตวประมาณคาเฉลยของคาพยากรณของ Y จ านวน m คามคาเฉลยเทากบ

X10 และความแปรปรวนเทากบ

xxS

Xx

nm

2

02 11 หรอสามารถเขยนไดในรป

xxS

Xx

nmXNy

2

02100

11,~ˆ จะเหนวาความแปรปรวนนจะลดลงเมอจ านวนคา

พยากรณมากขนทคาท X หนงๆ นอกจากนหากจ านวนทพยากรณมากๆ (m เขาใกลคาอนนต) แลวความแปรปรวนนจะเขาใกลความแปรปรวนของตวประมาณคาคาดหวงทงนคาคาดหวงคอคาเฉลยนนเอง

จะเหนวาตวประมาณคาพยากรณท งสามเปนตวประมาณคาทไม เอนเอยงเนองจากมคาเฉลยเทากบ X10 นอกจากนเมอคา X ทตองการพยากรณเขาใกลคาเฉลย ( X ) คาความแปรปรวนของตวประมาณคาพยากรณจะลดลงและจะมคานอยสดเมอท าการพยากรณทคาเฉลยเนองจากคา 0)( 2 xx นอกจากนยงพบวาหากท าการพยากรณท x0 = 0 แลวคาความแปรปรวนของตวประมาณคาพยากรณของคาคาดหวงจะกลายเปนคาความแปรปรวนของ b0 นนเองดงในสมการ (2.10) ทงนเนองจากเมอพจารณาสมการ 0100

ˆ xbby ท x0 = 0 แลวจะได

00ˆ by

2.2.3.2 ชวงความเชอมนของตวประมาณคาพยากรณ เนองจากตวประมาณคา

ทงสามมการแจกแจงแบบปกตดงนนการสรางชวงความเชอมนจะคลายกบการสรางชวงความเชอมนของคาพารามเตอรโดยใชการแจกแจงแบบ t ชวยในการสรางชวงและใช MSE ในการประมาณคาของ 2 ดงน ชวงความเชอมน 100(1- )% ของคาคาดหวงของ Y หรอ Y0 คอ

xx

n

xx

nS

Xx

nMSEtyy

S

Xx

nMSEty

20

2,2/00

20

2,2/0

)(1ˆ

)(1ˆ

(2.26)

ชวงความเชอมน 100(1- )% ของคา Y ใหม ณ x0 ทไมไดอยในขอมลจ านวน 1 คาหรอ Y0 คอ

0

20

2,2/0

)(11ˆ y

S

Xx

nMSEty

xx

n

xx

nS

Xx

nMSEty

20

2,2/0

)(11ˆ

(2.27)

ชวงความเชอมน 100(1- )% ของคาเฉลยของคา Y ใหม ณ x0 ทไมไดอยในขอมลจ านวน m คาหรอ Y0 คอ

Page 20: regression chap2

28

xx

n

xx

nS

Xx

nmMSEtyy

S

Xx

nmMSEty

20

2,2/00

20

2,2/0

)(11ˆ

)(11ˆ

(2.28) ตวอยาง 2.6 จากขอมลในตวอยาง 2.1 จงสรางชวงความเชอมนของยอดขายทระดบความเชอมน 95% ของ (1) คาคาดหวงทคาใชจายเทากบ 12 ลานบาท (2) คาใชจายเทากบ 12 ลานบาทโดยพยากรณเพยงคาเดยว และ (3) คาใชจายเทากบ 12 ลานบาทโดยพยากรณจ านวน 10 คา วธท า (1) เมอ x0 = 12 แลว 0100

ˆ xbby = -1.99 + 8.22 × 12 = 96.65 ทระดบความเชอมน 95% จะมคา t/ 2, n – 2 = t0.025, 11 = 2.201 (t จากตาราง) และชวงความเชอมนของคาคาดหวงของยอดขายทคาใชจาย 12 ลานบาทคอ

xx

n

xx

nS

Xx

nMSEtyy

S

Xx

nMSEty

20

2,2/00

20

2,2/0

)(1ˆ

)(1ˆ

54.837

)03.2312(

13

184.325201.265.96

54.837

)03.2312(

13

184.325201.265.96

2

0

2

y

77.923 < y0 < 115.377

ดงนนเชอมนได 95% วายอดขายเฉลยทไดจะอยระหวาง 77.923 กบ 115.377 ลานบาทหากใชคาใชจายในการโฆษณาเทากบ 12 ลานบาท (2) จาก (1) ท x0 = 12 แลว 0y = 96.65 และ t0.025, 11 = 2.201 และชวงความเชอมนของยอดขายทคาใชจาย 12 ลานบาทคอ

xx

n

xx

nS

Xx

nMSEtyy

S

Xx

nMSEty

20

2,2/00

20

2,2/0

)(11ˆ

)(11ˆ

54.837

)03.2312(

13

1184.325201.265.96

54.837

)03.2312(

13

1184.325201.265.96

2

0

2

y

52.727 < y0 < 140.573 ดงนนเชอมนได 95%วายอดขายทไดจะอยระหวาง 52.727 กบ 140.573 ลานบาทหากใชคาใชจายในการโฆษณาเทากบ 12 ลานบาท (3) จาก (1) ท x0 = 12 แลว 0y = 96.65 และ t0.025, 11 = 2.201 และชวงความเชอมนของยอดขายเฉลยทคาใชจาย 12 ลานบาทโดยใชคาพยากรณ 10 คาคอ

Page 21: regression chap2

29

xx

n

xx

nS

Xx

nmMSEtyy

S

Xx

nmMSEty

20

2,2/00

20

2,2/0

)(11ˆ

)(11ˆ

54.837

)03.2312(

13

1

10

184.325201.265.96

54.837

)03.2312(

13

1

10

184.325201.265.96

2

0

2

y

74.099 < y0 < 119.201

ดงนนเชอมนได 95%วายอดขายเฉลยทไดจะอยระหวาง 74.099 กบ 119.201 ลานบาทหากใชคาใชจายในการโฆษณาเทากบ 12 ลานบาทโดยท าการพยากรณ 10 คา หมายเหต หากเปรยบเทยบชวงความเชอมนทงสามแบบจะเหนวาชวงความเชอมนของคาคาดหวงจะแคบสดและชวงความเชอมนของการพยากรณเพยงคาเดยวจะกวางสดทงนเนองจากการพยากรณแบบคาคาดหวงเปนการพยากรณจ านวนมากแลวค านวณคาเฉลยดงนนความถกตองจงมากกวา ท าใหชวงแคบกวาทงสองแบบ

2.3 การวเคราะหความแปรปรวน ในการทดสอบสมมตฐานของการวเคราะหการถดถอยนนสามารถใชการวเคราะหความแปรปรวน (ANOVA) เขามาชวยไดและมประโยชนอยางมากในการวเคราะหการถดถอยพห (multiple regression analysis) การวเคราะหความแปรปรวนในทนเปนการทดสอบสมมตฐานวาคาความชน (1) มคาเทากบ 0 หรอไมหรออกนยหนงคอตวแปรอสระสามารถใชพยากรณตวแปรตามหรอไม

2.3.1 ผลรวมก าลงสอง การวเคราะหความแปรปรวนมาจากแบงความแปรผนของ Y ออกเปนสองสวนคอ

ความแปรผนทอธบายไดโดย X กบความแปรผนทไมทราบสาเหต หากตวแปร X กบ Y มความสมพนธกนแลวความแปรผนของ Y ควรจะประกอบดวยความแปรผนท X สามารถอธบายไดเปนสวนใหญ ความแปรผนของ Y เปนความแตกตางระหวางคาสงเกตแตละคากบคาเฉลย ( YYi ) ซงสามารถแบงไดเปนความแตกตางระหวางคาพยากรณแตละคากบคาเฉลย )ˆ( YYi

หรอเปนความแปรผนทอธบายโดย X กบความแตกตางระหวางคาสงเกตกบคาพยากรณ )ˆ( ii YY

หรอความแปรผนทไมทราบสาเหตหรอไมสามารถอธบายไดโดย X สามารถเขยนไดดงน YYi = )ˆ( YYi + )ˆ( ii YY หากยกก าลงสองแตละพจนและหาผลรวมแลวจะได

Page 22: regression chap2

30

)(1

n

i

i YY =

n

i

i YY1

)ˆ( +

n

i

ii YY1

)ˆ( +

n

i

iii YYYY1

)ˆ)(ˆ(2 (2.29)

พจารณาพจนสดทายของสมการจะได

n

i

ii

n

i

iii

n

i

iii YYYYYYYYYY111

)ˆ(2)ˆ(ˆ2)ˆ)(ˆ(2

n

i

i

n

i

ii eYeY11

2ˆ2

= 0 จากคณสมบตขอ 1 และขอ 6 ของคาคลาดเคลอนและคาพยากรณจะไดวาผลรวมของคาคลาดเคลอนเทากบ 0 และผลรวมของคาคลาดเคลอนทถวงน าหนกดวยคาพยากรณเทากบ 0 ดงนน

)(1

n

i

i YY =

n

i

i YY1

)ˆ( +

n

i

ii YY1

)ˆ( (2.30)

หรอ SST = SSR + SSE โดยท SST คอผลรวมก าลงสองทงหมด (total sum of squares) หรอคา Syy เปนการวดความแปรผนในคาสงเกตทงหมด หากคาสงเกตทกคาเทากนหมดแลว SST = 0 ดงนนเมอคาสงเกตมคาแตกตางกนมากคา SST จะใหญขน SSR คอผลรวมก าลงสองถดถอย (regression sum of squares) เปนการวดความแปรผนในคาสงเกตทสามารถอธบายไดโดยสมการถดถอย หากคา SSR ใหญขนเมอเทยบกบ SST แสดงวาสมการถดถอยสามารถอธบายความแปรผนในคาสงเกตไดด SSE คอผลรวมก าลงสองความคลาดเคลอน (error sum of squares) เปนการวดความแปรผนทไมสามารถอธบายไดโดยสมการถดถอยหรอตวแปร X หากสมการถดถอยสามารถอธบายคาสงเกตไดดคาพยากรณทกคาจะมคาเทากบคาสงเกตท าให SSE = 0

จากสมการ (2.30) และ (2.14) จะสามารถค านวณหา SSR ไดดงน SSR = b1Sxy (2.31)

2.3.2 องศาเสร ในท านองเดยวกนกบผลรวมก าลงสองพบวาองศาเสรทงหมดสามารถแบงไดเปน

สองสวนคอ องศาเสรของสมการถดถอยและองศาเสรของความคลาดเคลอน องศาเสรทงหมดเปนองศาเสรของ SST โดยมคาเทากบ n – 1 การสญเสยความเปนอสระ 1 คาเนองจากขอก าหนดทวา

ผลรวมของคาความแตกตางระหวางคาสงเกตกบคาเฉลยหรอ

n

i

i YY1

)( เทากบ 0 องศาเสรของ

SSE เทากบ n - 2 การสญเสยความเปนอสระไป 2 คาเนองจากการประมาณคา 0 และ 1 ส าหรบองศาเสรของ SSR เทากบ 1 เนองจากองศาเสรรวมของ SSR กบ SSE ตองเทากบ SST ดงน

Page 23: regression chap2

31

n – 1 = 1 + (n - 2)

2.3.3 คาเฉลยก าลงสอง คาเฉลยก าลงสอง (mean square) เกดจากการน าเอาผลรวมก าลงสองมาหารดวยองศาเสร ในการวเคราะหความแปรปรวนจะใชคาเฉลยก าลงสองเฉพาะคาเฉลยก าลงสอง ถดถอยและความคลาดเคลอน

คาเฉลยก าลงสองถดถอย (regression mean square หรอ MSR) ค านวณไดจากการหารผลรวมก าลงสองถดถอยดวยองศาเสรดงน

MSR = 1

SSR = SSR (2.32)

คาเฉลยก าลงสองความคลาดเคลอน (error mean square หรอ MSE) ค านวณไดจากการหารผลรวมก าลงสองความคลาดเคลอนดวยองศาเสรดงน

MSE = 2n

SSE (2.33)

เนองจาก MSR และ MSE ตางเปนตวแปรสมดงนนตวแปรสมทงสองมคาคาดหวงดงน E(MSR) = xxS2

1

2 และ E(MSE) = 2

2.3.4 คาสถต F การวเคราะหความแปรปรวนในทนเปนการทดสอบสมมตฐานวาคาความชน (1)

มคาเทากบ 0 หรอไมหรอ H0: 1 = 0 และ H1:1 ≠ 0 จะเหนวาเปนการทดสอบเชนเดยวกบการทดสอบโดยใชการทดสอบแบบ t ในหวขอ 2.2.2 แตสถตทใชคอ F โดยมวธค านวณดงน

MSE

MSRF (2.34)

การทดสอบสมมตฐานท าโดยเปรยบเทยบกบคา F จากตารางท 2 ในภาคผนวกทองศา

เสรเทากบ 1 และ n – 2 หากคา F ทค านวณไดมคานอยกวาหรอเทากบคา F จากตารางแลวจะ ไมปฏเสธสมมตฐานหลก ความแปรผนทอธบายไดโดย X จะมคาไมแตกตางจากความแปรผน ทอธบายไมไดแตหากคา F ทค านวณไดมคามากกวาคา F จากตารางแลวจะปฏเสธสมมตฐานหลกแสดงวา X สามารถอธบายตวแปร Y ไดดดงนนความแปรผนทอธบายไดโดย X จะมคาสงกวาความแปรผนทอธบายไมไดมาก ผลทไดจากการทดสอบ F จะสอดคลองกบผลทไดจากการทดสอบ t

Page 24: regression chap2

32

และเมอยกก าลงสองคาสถต t จะมคาเทากบสถต F แตสถต t นนสามารถทดสอบสองหางหรอหางเดยวกไดในขณะท F ใชทดสอบไดเฉพาะสองหางเทานน

การเพมอ านาจการทดสอบของสถต F นนท าไดโดยการเพมขนาดตวอยางหรอขยายพสยของคาของตวแปรอสระใหกวางขนหรอการลดความแปรปรวนของสวนเหลอลง (Weisberg, 2005, p. 31)

การน าเสนอคาสถตตางๆ ของการวเคราะหความแปรปรวนทไดกลาวมาแลว สวนใหญจะน าเสนอในรปของของตารางเพอใหงายแกการอานคาดงน

Source of variation SS df MS F

Regression SSR = b1Sxy 1 MSR = SSR MSE

MSRF

Error SSE = SST – SSR n – 2 MSE = 2n

SSE

Total SST = Syy n – 1

ตวอยาง 2.7 จากขอมลในตวอยาง 2.1 จงทดสอบคาความชนโดยใชสถต F ทระดบความเชอมน 95% และสรางตารางวเคราะหความแปรปรวน วธท า เนองจากการทดสอบสมมตฐานโดยใช F นนเปนการทดสอบสองหางดงนนสมมตฐานคอ H0: 1 = 0 H1: 1 ≠ 0

จากตวอยางท 2.1 จะได SST = 60,187.23 (Syy จากตวอยาง 2.1) SSR = b1Sxy = 8.22 × 6,885.28 = 56,597.00

ดงนน SSE = SST - SSR = 60,187.23 - 56,597.00 = 3,590.23 MSR = SSR / 1 = 56,597.00

MSE = 2n

SSE

Page 25: regression chap2

33

11

23.590,3 = 326.38

F = MSE

MSR

38.326

00.597,56 = 173.41

เนองจากคาวกฤต F0.05,(1,11) = 4.54 ซงนอยกวาคา F ทค านวณได (173.41) ดงนนจงปฏเสธสมมตฐานหลกและสรปวาความชนไมเทากบ 0 หรอตวแปรทงสองมความสมพนธเชงเสนตรงกน ทระดบนยส าคญ 0.05

ตารางวเคราะหความแปรปรวนคอ Source of variation SS df MS F

Regression 56,597.00 1 56,597.00 173.41 Error 3,590.23 11 326.38 Total 60,187.23 12 หมายเหต หากเปรยบเทยบตารางวเคราะหความแปรปรวนทไดจากการค านวณดวยมอกบผลลพธจาก MINITAB ในตวอยาง 2.1 พบวาคาตางๆ แตกตางกนเลกนอยทงนอาจเนองมาจากการปดเศษในการค านวณนอกจากน MINITAB ยงแสดงคา p-value ในคอลมนสดทายอกดวย โดย p-value = 0.000 < (0.05)

2.4 สมประสทธการตดสนใจ SST เปนการวดความแปรผนในคาสงเกต Y โดยไมค านงถงตวแปร X และ SSE เปนการวดความแปรผนทเหลอใน Y จากการน าสมการถดถอยมาใชซงไดมาจากการน าความแปรผนทงหมดใน Y มาหกลบออกดวยความแปรผนทอธบายดวยสมการถดถอย บางครงนกวจยอาจตองการทราบวาสดสวนของความแปรผนทอธบายไดโดยสมการถดถอยตอความแปรผนทงหมดเปนเทาใด

Page 26: regression chap2

34

นกวจยสามารถใชสมประสทธการตดสนใจ (coefficient of determination) หรอใชตวยอวา R2 ในการวดสดสวนของความแปรผน สตรทใชในการค านวณสมประสทธการตดสนใจคอ

SST

SSE

SST

SSRR 12 (2.35)

เนองจากคา R2 เปนคาสดสวนดงนนจงมคาไดตงแต 0 ถง 1 เทานน หากคา R2 ทไดมคาต าหรอเขาใกล 0 แสดงวาสมการถดถอยหรอตวแปร X มความสามารถต าในการอธบายความแปรผนใน Y หรอความถกตองในการพยากรณทจะต า เมอคา R2 เขาใกล 1 แสดงวาความแปรผนใน Y เกอบทงหมดสามารถอธบายไดโดยตวแปร X หรอสมการถดถอยมความถกตองในการพยากรณตวแปร Y ไดด ผอานอาจมค าถามวาคา R2 ควรจะมคาเทาไรจงจะถอวาด ? ค าตอบของค าถามนคอขนอยกบธรรมชาตของสงทศกษา หากเปนงานวจยทางสงคมศาสตรแลวบางครงการไดคา R2 ประมาณ 0.60 หรอ 0.70 อาจถอวาสงมากแตทางวทยาศาสตรอาจถอวายงคอนขางต าท งนในงานวจยท า งสงคมศาสตรหรองานวจยทเกยวของกบพฤตกรรมของมนษยนนมความแปรผนและมปจจยทเกยวของคอนขางมากจงยากแกการพยากรณ ตวอยางของการอธบายความหมายของ R2 เชน R2 = 0.80 หมายถง สามารถใชตวแปร X ในการอธบายความแปรผนในตวแปร Y ได 80% เปนตน ขอควรระวงในการใช R2 มดงน (1) คา R2 ทสงไมไดหมายความวาสมการถดถอยจะพยากรณตวแปร Y ไดดเสมอไปทงนขนอยกบขอบเขตของการพยากรณและขอบเขตของขอมลทน ามาสรางสมการถดถอยบางครงในขอบเขตทท าการศกษานนตวแปรทงสองมความสมพนธกนเชงเสนตรงแตนอกขอบเขตทศกษาความสมพนธอาจไมเปนเสนตรงกไดดงภาพท 2.3 ขอบเขตในการศกษาอยระหวาง 1 ถง 7 และความสมพนธในชวงดงกลาวเปนเสนตรงแตกลบลดลงหลงจากคา x เทากบ 7 ดงนนหากท าการพยากรณนอกเหนอขอบเขตทศกษาหรอท าการพยากรณในชวงตงแต 8 ขนไปแลวคาทพยากรณไดจะไมตรงกบสภาพความเปนจรงและนกวจยไมมโอกาสทราบไดเนองจากไมไดท าการศกษาในชวง x ทมากกวา 7 ขนไป

Page 27: regression chap2

35

0

2

4

6

8

10

12

14

16

0 2 4 6 8 10 12

x

y

ภาพท 2.3 ความสมพนธทเปนเสนตรงในชวงแรก

(2) บางครงสมการทมคา R2 เขาใกล 0 ไมไดหมายความวาตวแปรทงสองไมมความสมพนธกนแตอาจมความสมพนธเชงเสนโคงกได หากใชตวแบบทไมเปนเชงเสนมาพยากรณจะมความเหมาะสมมากกวาสมการถดถอยเชงเสนดงภาพท 2.4

0

2

4

6

8

10

12

14

16

0 2 4 6 8

x

y

ภาพท 2.4 ความสมพนธแบบเสนโคง

(3) เนองจากคาคาดหวงของคา R2 เทากบ 22

1

21

xx

xx

Sb

Sb ดงนนเมอขอบเขตของคา X กวาง

ขนหรอ Sxx ใหญขนจะท าใหคา R2 สงขนดวย แตหากขอบเขตของ X กวางมากจนเกนความจ าเปน

จะท าใหผลทไดใชน าไปใชประโยชนไดไมเทาทควร

Page 28: regression chap2

36

(4) คา R2 เปนคาทไดจากการใชขอมลชดทท าการศกษา หากขอมลทเกบไดแตละครงแตกตางกนคา R2 จะแตกตางกนไป นกวจยบางทานอาจพยายามทจะปรบเปลยนสมการถดถอยเพอใหมคา R2 สงขนแตสมการถดถอยทไดอาจเหมาะสมกบขอมลชดใดชดหนงเทานน บางครงจะพบวานกวจยแบงขอมลบางสวนเพอใชทดสอบวาสมการถดถอยทไดยงคงเหมาะสมกบขอมล อกชดหรอไม

(5) คา R2 ไมไดแสดงถงความสมพนธเชงเสนตรงเสมอไป ในกรณของสมการถดถอยท ไมเปนเชงเสนแลวคา R2 ทไดไมไดแสดงถงความสมพนธทเปนเชงเสนแตแสดงถงสดสวนของความแปรผนทตวแปร X สามารถอธบายได

(6) คา R2 ขนกบขนาดตวอยาง กลาวคอ เมอขนาดตวอยางยงนอยจะยงท าใหคา R2 สงขน (Cohen et al, 2003, p. 83)

2.5 สมประสทธสหสมพนธ คาสมประสทธสหสมพนธ (coefficient of correlation) หรอยอวา r เปนคาทแสดงถงความสมพนธเชงเสนตรงระหวางตวแปรสองตว ความสมพนธระหวางคาสมประสทธสหสมพนธและสมประสทธการตดสนใจคอ 2Rr (2.36) คา r มขอบเขตตงแต -1 ถง 1 หาก r มคาเขาใกล -1 แสดงวาตวแปรทงสองมความสมพนธเชงเสนตรงแบบผกผนกนกลาวคอเมอตวแปรหนงมคามากขนอกตวแปรหนงจะมคาลดลง แตหาก r มคาเขาใกล 1 แสดงวาตวแปรทงสองมความสมพนธเชงเสนตรงแบบตามกนกลาวคอเมอตวแปรหนงมคามากขนอกตวแปรหนงจะมคาเพมขนดวยแตหาก r มคาเทากบ 0 แลวแสดงวาตวแปร ทงสองไมมความสมพนธเชงเสนตรงกน หากค านวณคา r จาก R2 แลวจะตองพจารณาเครองหมายของ b1 เปนหลก หาก b1 มเครองหมายเปนบวกคา r จะมเครองหมายเปนบวกเชนกน หาก b1 มเครองหมายเปนลบคา r จะมเครองหมายเปนลบ โดยคาทงสองมความสมพนธกนดงน

rS

Sb

xx

yy

2

1

(2.37)

นอกจากนสามารถค านวณคา r ไดโดยตรงจากสตร

Page 29: regression chap2

37

n

i

i

n

i

i

n

i

ii

YYXX

YYXX

r

1

2

1

2

1

)()(

))((

(2.38)

ตวอยาง 2.8 จากขอมลในตวอยาง 2.1 จงค านวณคาสมประสทธการตดสนใจและสมประสทธสหสมพนธ วธท า

สมประสทธการตดสนใจเทากบ SST

SSRR 2

23.187,60

00.597,56 = 0.94

ดงนนคาใชจายในการโฆษณาสามารถอธบายความแปรผนของยอดขายไดถง 94% หรอความแปรผนของยอดขายทไมไดมาจากการโฆษณามเพยง 6% เทานน สมประสทธสหสมพนธเทากบ 2Rr 94.0 = 0.97 เนองจากคา b1 ในตวอยางท 2.1 มคาเปนบวกดงนนคา r จงมคาเปนบวกดวยและคาใชจายในการโฆษณากบยอดขายมความสมพนธเชงเสนตรงกนอยางมาก หมายเหต หากเปรยบเทยบคาสมประสทธการตดสนใจทไดจากการค านวณดวยมอกบผลลพธจาก MINITAB ในตวอยาง 2.1 ในบรรทดท 6 ในรปของ R-Sq พบวาคาทไดจะเทากน นอกจากนผลลพธทไดจาก MINITAB ยงแสดงคา R-Sq(adj) ซงจะอธบายในบทท 5

2.6 สมการถดถอยผานจดก าเนด ทผานมานนเปนการกลาวถงสมการถดถอยทมคาตวแปรทงสองไมผานจดก าเนดหรอจดท (x,y) = (0,0) แตในบางกรณธรรมชาตของขอมลจ าเปนตองเรมจากจดก าเนดซงจะพบไดมากใน

Page 30: regression chap2

38

กรณของการทดลองทางเคม เชน การเกดปฏกรยาของสารบางชนดจะไมเกดขนหากไมม ตวเรงปฏก รย า เ มอ เพมป รมาณของตว เ ร งปฏก รย ากจะท า ใหมอ ตราการเกดปฏก ร ย าเพม ขน เ ปนตน เนองจากขอมลมการผานจดก าเนดดงนนตวแบบจะไมมจดตดแกน Y หรอ0 โดยมตวแบบคอ Yi = 1Xi + (2.39) ดงนนสมการปกตจงมเพยงสมการเดยวคอสมการของ 1 ดงน

n

i

ii

n

i

i XYXb11

21 (2.40)

และตวประมาณคาของ 1 คอ

n

i

i

n

i

ii

X

XY

b

1

2

11 (2.41)

ตวประมาณคา b1 นเชนเดยวกบในตวแบบทผานมาคอเปนตวประมาณคาทไมเอนเอยงคอคาเฉลย

เทากบ 1 แตมคาความแปรปรวนเทากบ

n

i

iX1

2

2

สมการถดถอยทไดคอ ii XbY 1

ˆ (2.42) และมตวประมาณคาของ 2 คอ

11

)ˆ(

ˆ 1 1

12

1

2

2

n

XYbY

n

YY

MSE

n

i

n

i

iii

n

i

ii

(2.43)

โดยมองศาเสรเทากบ n - 1 เนองจากมการประมาณคาพารามเตอรเพยง 1 คาเดยวเทานน การทดสอบคาพารามเตอรมเพยงคาเดยวคอ 1 และใชสถต t ทมองศาเสรเทากบ n – 1 โดยในกรณของการทดสอบ H1: 1 ≠ 0 สามารถค านวณไดดงน

n

i

iX

MSE

bt

1

2

1 ~ 1,2/ nt (2.44)

การค านวณคาสมประสทธการตดสนใจใชสตรดงน

n

i

i

n

i

i

Y

Y

R

1

2

1

2

2

ˆ

(2.45)

Page 31: regression chap2

39

ตวอยาง 2.9 ในการศกษาเวลาทใชในการผลต (X) กบผลผลตทได (Y) มขอมลดงน เวลา (นาท) 3.8 1.5 12.0 9.0 6.4 1.0 10.6 15.5 ปรมาณผลผลต (ตน) 8.0 4.3 29.1 21.5 15.9 3.4 25.0 34.7 จงสรางสมการถดถอยและค านวณคาสมประสทธการตดสนใจ วธท า เนองจากขอมลชนดนเปนขอมลทมจดเรมตนทจดก าเนด หากไมมการผลตจะไมมผลผลตดงนนสมการถดถอยจงเปนสมการถดถอยผานจดก าเนด จากขอมลจะได

n

i

i

n

i

ii

X

XY

b

1

2

11

34.226.636

56.487,1

ดงนนสมการถดถอยคอ ii XY 34.2ˆ จากสมการถดถอยจะไดคา

n

i

i

n

i

i

Y

Y

R

1

2

1

2

2

ˆ

998.001.485,3

88.477,3

หมายเหต

หากสรางสมการถดถอยแบบปกตจะไดสมการถดถอยดงน ii XY 26.2878.0ˆ แตเมอทดสอบสมมตฐาน H0: 0 = 0 จะพบวาคา p-value = 0.200 แสดงวาขอมลชนดน ไมจ าเปนตองมจดตดแกนและสมการถดถอยผานจดก าเนดนเหมาะกบขอมลชนดนมากกวาสมการถดถอยแบบปกต

สรป การวเคราะหการถดถอยเชงเสนอยางงายใชในการวเคราะหขอมลทมตวแปรอสระ 1 ตวและตวแปรตาม 1 ตวโดยตวแปรทงสองมความสมพนธเชงเสนตรงกน การสรางสมการถดถอยใช

Page 32: regression chap2

40

วธก าลงสองนอยทสดในการประมาณคาพารามเตอร 0 และ 1 ในการทดสอบคาพารามเตอร ทงสองสามารถท าไดโดยการใชการทดสอบ t และในการทดสอบวาพารามเตอรทงสองหรอสมการถดถอยสามารถพยากรณตวแปรตามหรอไมท าไดโดยการวเคราะหความแปรปรวน สมประสทธการตดสนใจเปนสถตอกตวหนงทใชชวยในการตรวจสอบความสามารถในการพยากรณตวแปรตามของสมการถดถอยทได

ค าถามทายบท 2.1 จากขอมลขางลางจงใชวธก าลงสองนอยทสดในการสรางสมการถดถอย X: 21 13 20 25 19 24 16 13 Y: 13 6 12 7 19 10 24 19 2.2 จากขอมลในขอ 2.1 จงทดสอบคาพารามเตอรโดยใชสถต t และ F ทระดบนยส าคญ 0.10 2.3 จากขอมลในขอ 2.1 จงค านวณสมประสทธการตดสนใจ 2.4 รานขายคอมพวเตอรตองการทราบวาจ านวนตวแทนขายมผลตอยอดขายคอมพวเตอรหรอไม

โดยรานคาเกบขอมลในแตละเดอนดงน เดอนท จ านวนเครอง จ านวนตวแทน 1 21 6 2 17 6 3 10 4 4 5 2 5 11 3 6 12 4 จากขอมลขางตนจงสรางสมการถดถอยโดยใชวธก าลงสองนอยทสด 2.5 จากขอมลในขอ 2.4 จงวาดแผนภาพกระจายระหวางตวแปรทงสองและวาดเสนถดถอยทไดจาก

สมการในขอ 2.4 พรอมทงอธบายความสมพนธระหวางตวแปรทงสองจากแผนภาพกระจายและพจารณาวา เสนถดถอยทไดสอดคลองกบขอมลสวนใหญหรอไม

2.6 จากขอมลในขอ 2.4 จงค านวณคาพยากรณและสวนเหลอทจ านวนตวแทนแตละคา 2.7 จากขอมลในขอ 2.4 จงหาสมประสทธการตดสนใจพรอมทงอธบายคาทได 2.8 จงใชโปรแกรม MINITAB สรางสมการถดถอยของขอมลในขอ 2.4

Page 33: regression chap2

41

2.9 ขอมลขางลางคอเกรดเฉลยสะสมกบคะแนนสอบวชาคณตศาสตรของนกศกษากลมหนง เกรดเฉลยสะสม 56 54 52 58 52 62 66 63 คะแนน 3.18 3.45 3.68 2.55 2.07 3.41 3.18 2.79 จงสรางสมการถดถอยเพอพยากรณคะแนนสอบ 2.10 จากขอมลในขอ 2.9 จงหาสมประสทธการตดสนใจพรอมทงอธบายคาทได 2.11 จากขอมลในขอ 2.9 จงทดสอบวาสมการถดถอยทไดเหมาะสมกบขอมลชดนหรอไมทระดบ

นยส าคญ 0.05 โดยใชสถต F 2.12 จากผลลพธทไดขางลางจงทดสอบวาตวแปรอสระ X สามารถพยากรณตวแปรตาม Y ได

หรอไมทระดบนยส าคญ 0.05

The regression equation is

y = - 92.8 + 0.273 x

Predictor Coef SE Coef T P

Constant -92.81 40.11 -2.31 0.043

x 0.27275 0.06977 3.91 0.003

S = 10.83 R-Sq = 60.4% R-Sq(adj) = 56.5%

Analysis of Variance

Source DF SS MS F P

Regression 1 1791.0 1791.0 15.28 0.003

Residual Error 10 1172.0 117.2

Total 11 2963.0

2.13 จากขอมลความดนเลอดและอาย อาย 63 61 45 53 60 42 58 62 47 56 ความดน 161 217 130 148 162 144 152 140 135 122

จงวาดแผนภาพกระจายระหวางอายกบความดนพรอมทงอธบายความสมพนธทได 2.14 จากขอมลในขอ 2.13 จงสรางสมการถดถอยและค านวณคาสมประสทธการตดสนใจพรอม

ทงเปรยบเทยบคาสมประสทธการตดสนใจทไดกบแผนภาพกระจายในขอ 2.13