บทที่ 4 - faculty of science, khon kaen universitysc.kku.ac.th/userfiles/chapter 6 316...
TRANSCRIPT
บทท่ี 6ตัวอยา่งสุม่ และการแจกแจงของตัวสถิติ
(Random Sample and Sampling Distribution)6.1 ตัวอยา่งสุม่จากประชากร
เราทราบความหมายของประชากรและตัวอยา่งแล้วในบทที่ 1 ดังได้กล่าวแล้ววา่ จุดประสงค์ที่สำาคัญในการศึกษาวชิาสถิติของเราก็คือ พยายามที่จะอธบิายลักษณะ หรอืคณุสมบติับางประการของประชากร (เป็นต้นวา่ ค่าเฉล่ียของประชากร ความแปรปรวนของประชากร 2) โดยอาศัยขอ้มูลจากตัวอยา่ง ดังนัน้จงึมคีวามส ำาคัญในการเลือกตัวอยา่งเพื่อใชเ้ป ็นตัวแทนที่ด ีของประชากร หากเลือกตัวอยา่งไมเ่หมาะสมอาจทำาใหก้ารสรุปผลเกี่ยวกับประชากรทำาได้ไมด่ี หรอืคลาดเคลื่อนได้ ตัวอยา่งเชน่ ผู้จดัการฝ่ายการตลาดต้องการสำารวจความนิยมในสนิค้าชนิดหนึ่งของบรษัิท เป็นการไมถ่กูต้องที่เขาจะถามความเหน็จากคนที่อยูร่อบตัวเขา หรอืถามจากเพื่อนบา้นของเขา เพื่อที่จะใหไ้ด้ตัวอยา่งท่ีใช้เป็นตัวแทนที่ดีของประชากร เราควรเลือกตัวอยา่งโดยวธิีการสุม่ กล่าวคือ จะไมเ่ลือกหน่วยตัวอยา่งหน่วยใดโดยจงใจ หรอืใชค้วามรูส้กึเกี่ยวกับหน่วยตัวอยา่งนัน้ ในที่นี้จะอธบิายความหมายของตัวอยา่งส ุม่ (Random Sample) ซ ึ่งถือวา่เป็นตัวแทนของประชากร ถ้าผู้เรยีนเขา้ใจความหมายของตัวอยา่งสุม่ดีแล้ว เชื่อวา่การเรยีนวชิาสถิติต่อจากนี้จะไม่เป็นไปด้วยความอึดอัด
นิยามที่ 6.1 ให ้ X เป็นตัวแปรสุม่ ที่มฟีงัก์ชนัหนาแน่นความน ่าจะ เป ็น (Probability density function ซ ึ่งเขยีนยอ่วา่ p.d.f) f(x) และให ้ X1, X2, . . ., Xn เป็นตัวแปรส ุม่ n ตัว เรากล่าววา่ X1, X2, . . ., Xn เป ็นตัวอยา่งสุม่ขนาด n จากประชากรที่มี p.d.f f(x) ถ้า X1, X2, . . ., Xn แต่ละตัวเป ็นอิสระก ันและมกีารแจกแจงเ ห ม อื น ก ัน (independent and identical distribution เขยีนยอ่วา่ iid) และเหมอืนกับประชากร คือ f(x) เราขยายความนิยามที่ 6.1 ได ้ด ังน ี้ เราอธบิายประชากรด้วย p.d.f f(x) การแจกแจงของ X ซึ่งม ีp.d.f f(x) เรยีกวา่การแจกแจงของประชากร X1, X2, . . ., Xn
แต่ละตัวมกีารแจกแจงเหมอืนประชากร นัน่คือ Xi, i =1, 2, . . ., n มกีารแจกแจงหรอืมฟีงัก์ชนัหนาแน่นความน่าจะเป็น f(xi), i = 1, 2, . . ., n
- 2 - ถ้ากำาหนดให ้ f(x1, x2, . . ., xn) เป็นฟงัก์ชนัหนาแน่นความน่าจะเป ็นรว่ม (joint probability density function หรอื joint p.d.f) ของ X1, X2, . . ., Xn แล้ว โดยทฤษฎีสถิติ เราสามารถเขยีน f(x1, x2, . . ., xn) = f1(x1). f2(x2) . . . fn(xn) แสดงถึงความเป็นอิสระกัน = f(x1). f(x2) . . . f(xn) เพราะวา่ f = fi , i = 1, 2, . . ., nในนิยามที่ 6.1 อาจกล่าวได้วา่ ตัวอยา่งสุม่ขนาด n จากประชากรที่มี p.d.f f(x) ก็คือ เซตของตัวแปรสุม่ n ตัวที่
แต่ละตัวเป็นอิสระกันและมกีารแจกแจงเหมอืนประชากรคือ f(x) นัน่เอง
นิยามท่ี 6.2 เรากล่าววา่ ตัวอยา่งขนาด n จากประชากรท่ีมขีนาด N เป็นตัวอยา่งสุม่ขนาด n ถ้าแต่ละตัวอยา่งที่เป็นไปได้ทัง้หมด มโีอกาสท่ีจะถกูเลือกเท่ากัน ในที่น ี้จะมตี ัวอยา่งที่เป ็นไปได ้ท ัง้หมด =
ตัวอยา่ง และแต่ละตัวอยา่งมโีอกาสถกูเลือกเท่ากัน
คือ
จะเหน็วา่นิยามที่ 6.1 และ 6.2 ต่างก็เป็นนิยามของตัวอยา่งสุม่ นิยามที่ 6.2 ระบุขนาดของประชากรคือ N ดังนัน้จงึไมส่ามารถใชน้ิยามนี้กับประชากรที่มจี ำานวนอนันต ์(Infinite Population) ในขณะที่ น ิยามที่ 6.1 ไมส่นใจหรอืระบุขนาดของประชากร แต่สนใจการแจกแจงของประชากร โดยอธบิายประชากร และความหมายของตัวอยา่งสุม่ด้วยตัวแปรสุม่ นิยามที่ 6.1 นี้จงึใชไ้ด้กับประชากรที่มีจ ำานวนจ ำาก ัด (Finite Population) และประชากรท ี่ม ีจ ำานวนอนันต์ น ิยามที่ 6.1 นี้เป ็นน ิยามที่เป ็นทางการ (formal)หรอืนิยามในเชงิทฤษฎีสถิติของคำาวา่ ตัวอยา่งสุม่ ในขณะที่นิยามที่ 6.2 จะเป็นนิยามของตัวอยา่งสุม่ในวชิาการสำารวจด้วยตัวอยา่ง (Sample Surveys) หรอืวชิาเทคนิคการสุม่ตัวอยา่ง (Sampling Techniques) ซึ่งใหค้วามสำาคัญกับหน่วยตัวอยา่งในประชากรมากกวา่การแจกแจงของประชากร อน่ึง บางท่านอาจถามวา่ เป็นการสุม่แบบใสคื่น (With Replacement) ห ร อื ไ ม ใ่ ส ค่ ืน (Without
Replacement) จะเหน็วา่ นิยามที่ 6.1 เป็นการสุม่แบบใส่คืน นิยามท่ี 6.2 เป็นการสุม่แบบไมใ่สคื่น
- 3 -ตัวอยา่งที่ 6.1 สมมติวา่ประชากรมขีนาด N = 4 ซึ่งได้แก่ตัวเลข 1, 2, 3, และ 4 ตัวอยา่งสุม่ขนาด n = 2 อธบิายได้ดังน้ี
ก. โดยนิยามท่ี 6.2 จะได้วา่มตัีวอยา่งท่ีเป็นไปได้ทัง้หมดเท่ากับ = = 6 ตัวอยา่งดังนี้คือ (1, 2) (1, 3) (1, 4) (2, 3) (2, 4) (3, 4) แต่ละตัวอยา่งมโีอกาส หรอืความน่าจะเป็นท่ีจะถกูเลือกเท่ากันคือ ในทางปฏิบตัิเราได้ตัวอยา่งขนาด n = 2 ขา้งต้นด้วยวธิจีบัฉลาก หรอืใชต้ารางเลขสุม่ เป็นต้น
ข. โดยนิยามท่ี 6.1 ให ้ X เป็นตัวแปรที่เราสนใจศึกษา ในที่นี้ X คือตัวเลข 1, 2, 3, และ 4 และแต่ละตัวมโีอกาสถกูเลือกเท่ากันคือ = 0.25 ดังนัน้ การแจกแจงของ X หรอืการแจกแจงของประชากรจงึเป็น
X 1 2 3 4 f(x) 0.25 0.25 0.25 0.25 นัน่คือ X มคี่าที่เป็นไปได้ทัง้หมด 4 ค่าคือ 1, 2, 3, และ 4 แต่ละค่ามโีอกาสถกูเลือกเท่ากันคือ 0.25 ในทางสถิติเรยีกการแจกแจงแบบนี้วา่ การแจกแจงแบบเอกรูป
ชนิดไมต่่อเนื่อง (Discrete Uniform Distribution) ซึ่งเราศึกษาแล้วในบทที่ 4 จงึกล่าวได ้วา่ ประชากรมกีารแจกแจงแบบเอกรูปชนิดไมต่่อเน่ือง ให ้ X1 และ X2 เป็นตัวแปรสุม่ 2 ตัว โดยท่ี X1 หมายถึง การเลือกหน่วยตัวอยา่งครัง้ท่ีหน่ึง และ X2 หมายถึง การเลือกหน่วยตัวอยา่งครัง้ท่ีสอง X1 และ X2 จะเป็นตัวอยา่งสุม่ขนาด n = 2 ก็ต่อเมื่อ X1 และ X2 เป็นตัวแปรสุม่ที่มคีณุสมบตัิ (หรอือธบิายตัวแปรสุม่ทัง้ 2 ตัว) ดังนี้
- 4 - 1. X1 เป็นการเลือกหน่วยตัวอยา่งคร ัง้ที่หนึ่ง ค่าที่เป็นไปได้ทัง้หมดของ X1 คือ 1, 2, 3, และ 4 และมโีอกาสที่จะได้แต่ละตัวเลขเท่ากันคือ 0.25 2. X2 เป็นการเลือกหน่วยตัวอยา่งคร ัง้ที่สอง ค่าที่เป็นไปได้ทัง้หมดของ X2 คือ 1, 2, 3, และ 4 และมโีอกาสที่จะได้แต่ละตัวเลขเท่ากันคือ 0.25 จะเหน็วา่ ทัง้ X1 และ X2 ต่างก็เป็นตัวแปรสุม่ที่เป็นอิสระกัน และมกีารแจกแจงเหมอืนกัน คือมกีารแจกแจงเหมอืนกับ X หรอืเหมอืนกับการแจกแจงของประชากร ดังนัน้ X1 และ X2 จงึเป็นตัวอยา่งสุม่ขนาด n = 2 จากประชากรท่ีมี p.d.f f(x) ดังแสดงขา้งต้น จะเหน็วา่ ตัวอยา่งสุม่ขนาด n = 2 ที่ได้โดยนิยามที่ 6.2 และนิยามที่ 6.1 มขีอ้แตกต่างกันดังนี้คือ โดยนิยามที ่
6.2 หน่วยตัวอยา่งไมม่โีอกาสที่จะถกูเลือกซำ้า หรอืท่ีเรยีกกันวา่เป็นการสุม่แบบไมใ่สค่ืน ในขณะที่ โดยนิยามที่ 6.1 หน่วยตัวอยา่งมโีอกาสที่จะถกูเลือกซำ้า หรอืท่ีเรยีกกันวา่เป็นการสุม่แบบใสค่ืน ทัง้นี้ เพราะถ้าไมใ่สคื่น การแจกแจงของ X2 จะไม่เหมอืนกับการแจกแจงของ X1 อยา่งไรก็ตาม ในทางปฏิบตัิ การได้มาของตัวอยา่งสุม่ขนาด n = 2 โดยนิยามที่ 4.1 เราก็ใชว้ธิเีดียวกับนิยามท ี่ 6.2 ขา้งต้นคือ ด้วยวธิจีบัฉลาก หรอืใชต้ารางเลขสุม่ เป็นต้น และโดยทัว่ไปแล้วประชากรจะมขีนาดใหญ่เมื่อเทียบกับขนาดของตัวอยา่ง ในทางปฏิบตัิเราจงึนิยมใชแ้บบไมใ่สค่ืน โดยถือวา่ การแจกแจงของ X2 (ซึ่งเปลี่ยนไปไมม่ากนัก) เหมอืนกับการแจกแจงของ X1 ในกรณีที่ n 2 ก็อธบิายในทำานองเดียวกัน พจิารณาการแจกแจงของ X ขา้งต้น หากเราไมท่ราบมาก่อนวา่ N = 4 เราสามารถอธบิายการแจกแจงของ X ดังนี้ X มคี่าที่เป็นไปได้ทัง้หมด 4 ค่าคือ 1, 2, 3, และ 4 หรอืคิดเป็นรอ้ยละซึ่งเท่ากันคือ 25 กล่าวคือ ถ้าประชากรมีขนาด 100 ก็จะมคี่า 1, 2, 3, และ 4 จำานวนเท่ากันคือ 25 ถ้าประชากรมขีนาด 1000 ก ็จะมคี ่า 1, 2, 3, และ 4 จำานวนเท่ากันคือ 250 หรอืประชากรมขีนาด 10000 หรอื 100000 ก็จะมคี ่า 1, 2, 3, และ 4 จ ำานวนเท ่าก ันค ือ 2500 หรอื 25000 ตามลำาดับ จะเหน็วา่แต่ละกรณีคิดเป็นรอ้ยละได้เท่ากันคือ 25 หรอืประชากรท่ีมจีำานวนอนันต์ ค่าท่ี
เป็นไปได้ทัง้หมด 4 ค่าของ X คือ 1, 2, 3, และ 4 คิดเป็นรอ้ยละได้เท่ากันคือ 25
- 5 - ดังได ้กล่าวในตอนต้นวา่ น ิยามที่ 6.1 นี้ใชไ้ด ้ก ับประชากรท่ีมจีำานวนจำากัด และประชากรท่ีมจีำานวนอนันต์ และในทางสถิติโดยเฉพาะอยา่งย ิง่ในทฤษฎีสถิต ิจะอธบิายลักษณะของประชากรด้วยวธินีี้ กล่าวคือ อธบิายลักษณะประชากรด้วยการแจกแจง หรอือธบิายด้วย f(x) เชน่กล่าววา่ ตัวอยา่งเป็นตัวอยา่งสุม่จากประชากรที่มกีารแจกแจงแบบปกติ และสมมติวา่ทราบค่าเฉล่ียเท่ากับ 50 และความแปรปรวนเท่ากับ 100 ซึ่งเรานิยมเขยีนแทนด้วย N(50, 100) ในกรณีนี้ จะถือวา่ประชากรเป็นประชากรที่มจีำานวนอนันต์ ซึ่งในทางปฏิบตัิจรงิอาจเป็นประชากรที่มจี ำานวนจำากัดแต่มขีนาดใหญ่มากจนต้องถือวา่เป็นประชากรท่ีมจีำานวนอนันต์ เป็นต้น ถึงจุดนี้ทกุท่านต้องทราบแล้ววา่ เราใชต้ัวแปรสุม่ X อธบิายเรื่องที่เราสนใจศึกษา และ p.d.f ของ X คือ f(x) ก ็คือการแจกแจงของประชากร ในทางสถิติโดยมากแล้วจะพบวา่ f(x) ขึ้นอยูก่ับค่าคงที่ค่าหนึ่ง หรอืมากกวา่หนึ่งค่า ซึ่งเราเรยีกวา่ พารามเิตอรข์องการแจกแจง (Parameter of distribution) หรอืเรยีกสัน้ๆวา่ พารามเิตอร ์เราจงึนิยมเขยีน p.d.f ของ X เป็น f(x; ) เพื่อแสดงใหเ้หน็วา่ การแจกแจงความน่าจะเป็นของ X ขึ้นอยูก่ ับพารามเิตอร ์ ตัวอยา่งเชน่
ก.X มกีารแจกแจงแบบแบรน์ูลลี จะมพีารามเิตอร ์1 ตัว เราเขยีน p.d.f ของ X เป็น
f(x; p) = pxq1- x , x = 0, 1ในท่ีน้ี แสดงวา่ p เป็นพารามเิตอรข์อง X
ข.X มกีารแจกแจงแบบปัวสซ์ง จะมพีารามเิตอร ์1 ตัวเชน่กัน เราเขยีน p.d.f ของ
X เป็น
f(x; ) = ex!x , x = 0, 1, 2, . . .
ในท่ีน้ี แสดงวา่ เป็นพารามเิตอรข์อง Xค.X มกีารแจกแจงแบบปกติ จะมพีารามเิตอร ์2 ตัว เรา
เขยีน p.d.f ของ X เป็น
f(x; , 2) = 12 2 e
12 (x - )22 , - < x < แสดงวา่ และ 2 เป็นพารามเิตอรข์อง X
- 6 - พารามเิตอรม์คีวามสำาคัญมากในทางสถิติเพราะจะเป็นต ัวบอกหรอือธบิายล ักษณะของ X หรอืล ักษณะของประชากรนัน่เอง ถ้าเราทราบค่าพารามเิตอรเ์ราก็สามารถอธบิายลักษณะของ X หรอืลักษณะของประชากรได้ทัง้หมด อยา่งไรก็ตาม โดยทัว่ไปแล้วเรามกัไมท่ราบค่าพารามเิตอร์ จงึเป็นงานหรอืหน้าที่ของนักสถิติ หรอืนักวจิยัที่จะต้องหาวธิทีี่จะประมาณค่าของพารามเิตอรโ์ดยใชตั้วอยา่งสุม่ (ตามนิยามท่ี 6.1) จากประชากร ซึ่งจะได้ศึกษากันในบทท่ี 7
6.2 การแจกแจงของตัวสถิติต่างๆ
นิยามที่ 6.3 (Statistic หรอืตัวสถิติ หรอืสถิติ) เราเรยีกฟงัก์ชนัของตัวแปรสุม่ หรอืตัวอยา่งสุม่ X1, X2, . . ., Xn ท ี่ไมเ่กี่ยวขอ้งกับพารามเิตอรท่ี์ไมท่ราบค่าวา่ ตัวสถิติ
ตัวอยา่งเชน่ ให ้X1, X2, . . ., Xn เป็นตัวอยา่งสุม่ขนาด n จากประชากรท่ีมี p.d.f f(x; ) เราทราบวา่ = เป็นค่าเฉลี่ยของตัวอยา่ง (Sample mean) S2 = เป ็นความแปรปรวนของตัวอยา่ง (Sample variance)ต่างก็เป็นฟงัก์ชนัของตัวอยา่งสุม่ X1, X2, . . ., Xn ดังนัน้
และ S2 จงึเป็นตัวสถิติ จะเหน็วา่ บรรดาตัวสถิติทัง้หลายจะต้องเป็นตัวแปรสุม่ด้วย เพราะ ตัวอยา่งสุม่ X1, X2, . . ., Xn เป็นตัวแปรสุม่ ดังนัน้ ตัวสถิติต้องมกีารแจกแจง (Distribution) ซ ึ่งบางตัวเราทราบดีวา่มกีารแจกแจง หรอืม ีp.d.f เป็นอยา่งไร การแจกแจงของตัวสถิติในทางวชิาการนิยมเรยีกวา่ Sampling distribution เชน่ การแจกแจงของ เราเรยีกวา่ Sampling distribution ของ เป็นต้น เมื่อตัวสถิติเป็นตัวแปรสุม่ เราจงึสามารถหา ค่าเฉลี่ย (นัน่คือ Expectation) ความแปรปรวน หรอืสว่นเบีย่งเบนมาตรฐาน (Standard deviation) ของตัวสถิตินัน้ๆ
ได้ สว่นเบีย่งเบนมาตรฐานของตัวสถิติ ในทางวชิาการเรานิยมเรยีกวา่ ความคลาดเคลื่อนมาตรฐาน (Standard error) หรอื เข ยีนยอ่ว า่ S.E ท ำา ไม เราจ งึน ิยม เร ยีกความคลาดเคล่ือนมาตรฐานจะได้อธบิายต่อไป
- 7 - 6.2.1 Sampling distribution ของ
ทฤษฎีท่ี 6.1 ให ้ X1, X2, . . ., Xn เป็นตัวอยา่งสุม่ขนาด n จากประชากรที่มคี่าเฉลี่ย (นัน่คือ E(X) = ) และความแปรปรวน 2 (นัน่คือ V(X) = 2 )กำาหนดให ้ = และ S2 = เราสามารถพสิจูน์ได้วา่ E( ) = และ E(S2) = 2 ซ ึ่งเราเรยีก และ S2 วา่เป็นตัวประมาณที่ไมเ่อนเอียง (Unbiased estimator) ของ และ 2 ตามลำาดับ
ทฤษฎีท่ี 6.2 ให ้ X1, X2, . . ., Xn เป็นตัวอยา่งสุม่ขนาด n จากประชากรที่มกีารแจกแจงแบบปกติที่มคี่าเฉลี่ย และความแปรปรวน 2 นัน่คือ X N(, 2) แล้ว N(, ) ทำาใหไ้ด้ Z = N(0, 1) . . . (6.1)
ทฤษฎีท่ี 6.3 (Central Limit Theorem) ให ้ X1, X2, . . ., Xn เป็นตัวอยา่งสุม่ขนาด n จากประชากรใดๆ ที่มคี่าเฉลี่ย และความแปรปรวน 2 เมื่อ n มขีนาดใหญ่ ( n
30 ) แล้ว N(, ) โดยประมาณ
ทำาใหไ้ด้ Z = N(0, 1) โดยประมาณ . . . (6.2)
- 8 -ตัวอยา่งที่ 6.2 สมมติวา่ อายุการใชง้านของหลอดไฟชนิดหนึ่งมกีารแจกแจงแบบปกติที่มคี่าเฉลี่ยเท่ากับ 800 ชัว่โมง และสว่นเบีย่งเบนมาตรฐานเท่ากับ 40 ชัว่โมง สุม่หลอดไฟมา 16 หลอด จงหาความน่าจะเป็นที่หลอดไฟ 16 หลอดนัน้จะมอีายุการใชง้านเฉล่ียน้อยกวา่ 775 ชัว่โมง
ให ้ X เป็นอายุการใชง้านของหลอดไฟในที่น ี้ เราม ี = 800 ช ัว่โมง และ = 40 ช ัว่โมง จงึสามารถเขยีน X N(800, 402) โดยทฤษฎีที่ 6.2 ทำาใหไ้ด้ N(, ) นัน่คือ
N(800, 102) ให ้ เป็นอายุการใชง้านเฉล่ียของหลอดไฟ 16 หลอด
ในท่ีน้ี เราต้องการหา P( 775)เพราะวา่ P( 775) = P( ) = P(Z -2.50) = 0.0062ตัวอยา่งที่ 6.3 ตัวอยา่งสุม่ขนาด n = 75 ถกูส ุม่จากประชากรท ี่มคี ่า เฉล ี่ย เท ่าก ับ 110 และสว่นเบ ีย่ง เบน
มาตรฐานเท่าก ับ 5 จงหาความน่าจะเป ็นที่ค ่าเฉลี่ยของตัวอยา่งจะอยูร่ะหวา่ง 109 ถึง 111 ในท่ีน้ี เราต้องการหา P(109 111)เพราะวา่ n มขีนาดใหญ่ โดย Central Limit Theorem จะได้ N(, ) โดยประมาณนัน่คือ N(110, ) โดยประมาณทำาใหไ้ด้
- 9 - P(109 111) = P( ) = P( -1.73 Z 1.73) = 0.9164 6.2.2 Sampling Distribution ของ -
ทฤษฎีที่ 6.4 ให ้ X1, X2, . . ., เป็นตัวอยา่งสุม่ขนาด n1 จากประชากรที่ 1 ที่มกีารแจกแจงแบบปกติที่มคี่าเฉลี่ย 1 และความแปรปรวน นัน่คือ N(1, ) และให ้X1, X2, . . ., เป็นตัวอยา่งสุม่ขนาด n2 จากประชากรที่ 2 ที่มกีารแจกแจงแบบปกติที่มคี่าเฉลี่ย 2 และความแปรปรวน นัน่คือ N(2, ) และตัวอยา่งสุม่ทัง้สองเป็นอิสระกันเราแยกพจิารณาดังต่อไปนี้
ก. ทราบค่า 1 และ 2
จากทฤษฎีที่ 6.2 เราทราบวา่ N(1, ) และ
N(2, ) ตามลำาดับ
เราสามารถแสดงได้วา่ - N(1 - 2 , + )
- 10 -
ทำาใหไ้ด้ Z = N(0, 1) . . .
(6.3) ถ้า n1 และ n2 มขีนาดใหญ่ ( n1 และ n2 30 ) เราไมจ่ำาเป็นต้องสมมติวา่ประชากรมกีารแจกแจงแบบปกติ โดย Central Limit Theorem เราได้วา่
N(1, ) และ N(2, ) โดยประมาณ
ทำาใหไ้ด้ - N(1 - 2 , + )
และ Z = N(0, 1) โดยประมาณ
. . . (6.4)
ข. ไมท่ราบค่า 1 และ 2 แต่ทราบวา่ 1 = 2 = และ n1, n2 < 30ในกรณีนี้ เราประมาณ ด้วย (Pooled Sample Variance) โดยท่ี
=
และ และ เป็นความแปรปรวนของตัวอยา่งจากประชากรท่ี 1 และ 2 ตามลำาดับ
- 11 -
ทำาใหไ้ด้ t = . . . (6.5)
มกีารแจกแจงแบบที ( t Distribution) ที่มอีงศาแหง่ความอิสระ (Degree of Freedom)
= n1 + n2 - 2
ค. ไมท่ราบค่า 1 และ 2 และ n1, n2 ≥ 30เราประมาณความแปรปรวนของประชากรที่ 1 และ 2 ด้วยความแปรปรวนของตัวอยา่ง คือ และ ตามลำาดับ ในกรณีนี้ เราไมจ่ ำาเป็นต้องสมมติวา่ประชากรมกีารแจกแจงแบบปกติ โดย Central Limit Theorem เราได้วา่
Z = N(0, 1) โดยประมาณ
. . . (6.6) ง. ไมท่ราบค่า 1 และ 2 และ n1, n2 < 30เชน่เดียวกับขอ้ ค. เราประมาณความแปรปรวนของประชากรที่ 1 และ 2 ด้วยความแปรปรวนของตัวอยา่ง คือ และ
ตามลำาดับ จะได้วา่
t = . . .
(6.7)มกีารแจกแจงแบบที ท่ีมอีงศาแหง่ความอิสระ
= โดยที่ = และ =
- 12 - 6.2.3 Sampling Distribution ข อ งสดัสว่นของตัวอยา่ง ความหมายของสดัสว่น (Proportion) สมมติวา่กล่องใบหนึ่งบรรจุลกูบอลสขีาว 40 ลกู ลกูบอลสแีดง 60 ลกู และใหล้กูบอลทัง้ 100 ลกูประกอบเป็นประชากร ถ้าเราสนใจสขีองลกูบอล จะได้วา่ประชากรนี้มีสองลักษณะคือ สขีาว และสแีดง ถ้าเราสนใจลกูบอลสขีาว สดัสว่นของลกูบอลสขีาวคือ
= 0.40 สดัสว่นน ี้เรยีกวา่ สดัสว่นของประชากร (Population Proportion) เขยีนแทนด้วย ในที่น ี้ = 0.40 ซ ึ่งเป็นค่าคงที่ จงึเป ็นพารามเิตอรตั์วหน่ึงท่ีเราสนใจศึกษา
สมมติวา่ตัวอยา่งสุม่ขนาด n = 10 จากประชากรนี ้และตัวอยา่งที่ได้ประกอบด้วยลกูบอลสขีาว 6 ลกู และสแีดง 4 ลกู ให ้ เป็นสดัสว่นของลกูบอลสขีาวในตัวอยา่ง จะได้ = = 0.60เ ร า เ ร ยี ก ว า่ ส ดั ส ว่ น ข อ ง ต ัว อ ย า่ ง (Sample Proportion) เขยีนเป็นกรณีทัว่ไปได้ดังนี้ = โดยที่ X เป็นจำานวนหน่วยตัวอยา่งที่มีลักษณะท่ีเราสนใจศึกษาจะเหน็วา่ เป็นตัวสถิติเชน่เดียวกับ การแจกแจงของ หรอื Sampling distribution ของ เป็นดังน้ี
ทฤษฎีที่ 6.5 ให ้ X1, X2, . . ., Xn เป็นตัวอยา่งสุม่ขนาด n จากประชากร ที่มสีดัสว่นของประชากรเท่ากับ และให ้
เป็นสดัสว่นของตัวอยา่ง จะได้วา่
E( ) = และ V( ) = เมื่อ n มขีนาดใหญ่ โดย Central Limit Theorem เราได้วา่
N( , ) โดยประมาณ
- 13 -
ทำาใหไ้ด้ Z = N(0, 1) โดยประมาณ .
. . (6.8)
ตัวอยา่งที่ 6.3 ฝ่ายกิจการนักศึกษาระบุวา่มนีักศึกษากู้ยมืเงินฉกุเฉิน 60% สมมติวา่เราเลือกนักศึกษาเป็นตัวอยา่งสุม่จำานวน 150 คน จงหาความน่าจะเป็นท่ีสดัสว่นตัวอยา่งในเรื่องน้ีจะน้อยกวา่ 0.52 ในที่น ี้เราม ี n = 150, = 0.60 และ = 0.40ต้องการหา P( < 0.52)โดยทฤษฎีท ี่ 6.5 จะได ้ N(0.60, 0.0016) โดยประมาณ ทำาใหไ้ด้
P( < 0.52) = P( < ) = P(Z < -2.00) = 0.0228 6.2.4 Sampling Distribution ของผลต่างสดัสว่นของตัวอยา่ง - ให ้ และ เป็นสดัสว่นของประชากรที่ 1 และ 2 ตามลำาดับ n1 เป็นขนาดของตัวอยา่งสุม่ที่สุม่มาจากประชากรที่ 1 และม ี เป็นจำานวนหน่วยตัวอยา่งที่มีลักษณะท่ีเราสนใจ และ n2 เป็นขนาดของตัวอยา่งสุม่ที่สุม่มาจากประชากรที่ 1 และม ี เป็นจำานวนหน่วยตัวอยา่งที่มลีักษณะท่ีเราสนใจ
= และ = เป็นสดัสว่นของ
ตัวอยา่งจากประชากรที่ 1 และ 2 ตามลำาดับ และสดัสว่นทัง้สองเป็นอิสระกัน เม ื่อ n1 และ n2 มขีนาดใหญ ่ Sampling Distribution - คือ
- N( - , + ) โดยประมาณ
ทำาใหไ้ด้
- 14 -
Z = N(0, 1) โดยประมาณ
เราแยกพจิารณาดังน้ี
ก. ความแปรปรวนของ - คือ +
ถ้าไมท่ราบค่าเราประมาณด้วย + ทำาใหไ้ด้
Z = N(0, 1) โดยประมาณ
. . . (6.9) ข. ถ้า = = และไมท่ราบค่า เราประมาณ ด้วย
=
ทำาใหไ้ด้
Z = N(0, 1) โดยประมาณ .
. . (6.10)
- 15 – 6.2.5 Sampling Distribution ข อ ง
ทฤษฎีท่ี 6.6 ให ้ X1, X2, . . ., Xn เป็นตัวอยา่งสุม่ขนาด n จากประชากรที่มกีารแจกแจงแบบปกติที่มคี่าเฉลี่ย และความแปรปรวน 2 นัน่คือ X N(, 2) แล้ว
จะมกีารแจกแจงแบบไคกำาลังสอง (Chi-square distribution) ที่มอีงศาแหง่ความอิสระ เท่ากับ = n – 1 ในที่นี้จะเขยีนแทนด้วยสญัลักษณ์ 2 =
2() . . . (6.11)