یرایرهش رتکد یاقآ یرامآ لیلحت هوزج Æحªص ·Ãا...

44
جزوهل آماری تحلیسه اول جل صفحه1 اری دکتر شهری آقای منابع:- ستنتاجیر ا آما- کتر علی مدنی آقای د- د آماربر کار منصوری عادل آذر و دوم آقای دکتر جلد سرفصل:- ی نمونه ای توزیع هاری و نمونه گی- ن های آماری تخمی- آزمونهای فر ض- ریانسلیز وا آنا- همبستگیگرسیون و ر- امتری آمار ناپارستاد:میل ا ای نشانی[email protected]

Upload: others

Post on 17-Aug-2020

9 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: یرایرهش رتکد یاقآ یرامآ لیلحت هوزج Æحªص ·Ãا Æسºجfreecontent.atiyehsanat.com/Download/Stat-Shahriyari... · 2016. 10. 5. · یرامآ لیلحت

آقای دکتر شهریاری 1 صفحهجلسه اول تحلیل آماریجزوه

منابع:

آقای دکتر علی مدنی -آمار استنتاجی -

جلد دوم آقای دکتر عادل آذر و منصوری –کاربرد آمار -

سرفصل:

نمونه گیری و توزیع های نمونه ای -

تخمین های آماری -

ضآزمونهای فر -

آنالیز واریانس -

و رگرسیونهمبستگی -

آمار ناپارامتری -

نشانی ایمیل استاد:

[email protected]

Page 2: یرایرهش رتکد یاقآ یرامآ لیلحت هوزج Æحªص ·Ãا Æسºجfreecontent.atiyehsanat.com/Download/Stat-Shahriyari... · 2016. 10. 5. · یرامآ لیلحت

آقای دکتر شهریاری 2 صفحهجلسه اول تحلیل آماریجزوه

و )دستیابی به کل جامعه هزینه بر آمار توصیفی: کلیه جامعه آماری در دست بوده و قابل محاسبه و سرشماری است.

گردد.(برخی موارد آزمون موجب تخریب می زمانبر بوده و در

استنتاجی: مبتنی بر نمونه گیری و تعمیم نتیجه به جامعه است.آمار استنباطی یا

(:Samplingنمونه گیری )

توان نمونه را به جامعه تعمیم داد. در تصادفی بودن باید شانس برابری ه شرط مهمی است که ب ،بودن انتخابهاتصادفی

جامعه تعمیم پیدا نکرده و اریب بوده و یا دارای برای انتخاب همه وجود داشته باشد. در صورت غیر تصادفی بودن، نمونه به

باشد.( میbiasتورش )

روشهای نمونه گیری مبتنی بر انتخاب تصادفی:

روش نمونه گیری تصادفی ساده

o قرعه کشی

o ًبصورت تصادفی بوده و بر اساس تعداد ارقام جامعه، جدول اعداد تصادفی )در این جدول اولین عدد کاملا

گیرد.(تعداد ستونها مد نظر قرار می

)روش نمونه گیری سیستماتیک )منظم

باشد داریم: 022و تعداد نمونه مدنظر 0222به عنوان مثال اگر تعداد جامعه

2000 ÷ 100 = 20 ،کنیمانتخاب می 02تا 0دد دلخواه بین در ابتدا یک ع

تصادفی مدنظر را تولید کنیم،تا اضافه نموده تا اعداد 02در مرحله بعد به عدد پیشین

15, 35, 55, 75, …

روش نمونه گیری گروهی

o )... / گروه بندی بر اساس تجانس: )زن و مرد / تحصیلات

رعایت نسبت هر گروه جامعه در نمونه. مثال:

N=600 , n=80

دهاواحتعداد کارکنان کل خدمات تولید اداری مالی

Nk 180 228 133 59 600

Pk 180/600=30% 38% 22% 10% 100%

nk 80*30%=24 30 18 8 80

Page 3: یرایرهش رتکد یاقآ یرامآ لیلحت هوزج Æحªص ·Ãا Æسºجfreecontent.atiyehsanat.com/Download/Stat-Shahriyari... · 2016. 10. 5. · یرامآ لیلحت

آقای دکتر شهریاری 3 صفحهجلسه دوم تحلیل آماریجزوه

استنتاج آماری:

نتیجه گیری یا قضاوت نسبت به خصوصیات تمامی اعضای یک جامعه آماری بر اساس مطالعه ست که در افرآیند ذهنی

ای از جامعه اصلی است( ی که زیر مجموعهفنتایج بدست آمده از مشاهده بر روی تعداد معدودی از اعضای آن )نمونه تصاد

گیرد.با رعایت شرایط تصادفی بودن انتخاب اعضا صورت می

شدن و ورود به زیر جامعه، احتمالی یکسان دارند.انتخاب تصادفی، انتخابی است که در آن تمام اعضای جامعه برای انتخاب

های مشاهده شده و نمایان یافته نمونههر یک از نامیم.ای میرا متغیر نمونه 𝑋1و 𝑋2و ... و 𝑋𝑛هر یک از کمیتهای

گیری تصادفی فرض در این است که نمونه انتخاب شده به جامعه بر نمونهدر دهند.نشان می 𝑥𝑖)واقعیت یافته( را با

ه نسبت تعداد نمونه ( بNاگر حجم جامعه ) ها یکی از ویژگیهای مهم انتخاب تصادفی است.𝑋𝑖استقلال آزمایش گردد.می

(n( به اندازه کافی بزرگ باشد )𝑛

𝑁≤ شوند.( عملاً آزمایشها مستقل از یکدیگر فرض می0.05

شود که خود یک متغیر تصادفی است.برای استنباط پارامتر جامعه از آماره استفاده می

𝐹1(𝑛) = 𝑋1 + 𝑋2 + ⋯ + 𝑋𝑛

𝐹2(𝑛) =∑ 𝑋𝑖

𝑛

𝐹3(𝑛) =∑(𝑋𝑖 − �̅�)2

𝑛 − 1

تایی که بطور مکرر از جامعه آماری انتخاب شده nهای تصادفی بر اساس نمونهیک آماره، تابعی است که تابع احتمال

یری مکرر گنامند. در حقیقت توزیع آماره نشانگر رفتار آن نمونه در نمونهگیری میتابع را توزیع نمونهگردد. این حاصل می

است.

خواهیم میانگین و واریانس آن را حساب کنیم.است، می مثال: فرض کنید جامعه ای با پنج عضو در دست

𝑋: {6, 9, 12, 15, 18} 𝐹(𝑥) = 0.2

𝜇𝑥 =∑ 𝑋𝑖

𝑛=

60

5= 12

𝜎𝑥2 =

∑(𝑋𝑖 − 𝜇𝑥)2

𝑁=

90

5= 18

�̅� : میانگین نمونه =∑ 𝑥𝑖

𝑛

𝑠𝑥 : واریانس نمونه2 =

∑(𝑥𝑖−𝜇𝑥)2

𝑛−1

�̅� 𝑭(�̅�) 𝒎𝒅 𝑭(𝒎𝒅)

𝒔𝒙 )میانه( �̅� md نمونه𝟐

6 9 12 9 9 9

6 9 15 10 9 21

6 9 18 11 9 39

6 12 15 11 12 21

6 12 18 12 12 36

6 15 18 13 15 39

9 12 15 12 12 9

9 12 18 13 12 21

9 15 18 14 15 21

12 15 18 15 15 9

Page 4: یرایرهش رتکد یاقآ یرامآ لیلحت هوزج Æحªص ·Ãا Æسºجfreecontent.atiyehsanat.com/Download/Stat-Shahriyari... · 2016. 10. 5. · یرامآ لیلحت

آقای دکتر شهریاری 4 صفحهجلسه دوم تحلیل آماریجزوه

9 0.1 9 0.3

10 0.1 10 0

11 0.2 11 0

12 0.2 12 0.4

13 0.2 13 0

14 0.1 14 0

15 0.1 15 0.3

𝜇�̅� = ∑ 𝑋𝑖𝐹𝑖 = 9 × 0.1 + 10 × 0.1 + 11 × 0.2 + 12 × 0.2 + 13 × 0.2 + 14 × 0.1 + 15 × 0.1 = 12

عدد× امید ریاضی = احتمال

𝐸(𝑥) = ∑ 𝑋𝑖𝐹𝑖 (𝑥)

𝜎�̅�2 = 𝐸(�̅�2) − 𝜇�̅�

2 ⇒

[92 × 0.1 + 102 × 0.1 + 112 × 0.2 + 122 × 0.2 + 132 × 0.2 + 142 × 0.1 + 152 × 0.1] − 122 = 3

شود.محاسبه می 𝑚𝑑، میانگین و واریانس توزیع 𝑚𝑑و �̅�به منظور مقایسه

𝜇𝑚𝑑 = ∑ 𝑋𝑖𝐹𝑖 = 9 × 0.3 + 12 × 0.4 + 15 × 0.3 = 12

𝜎𝑚𝑑2 = [92 × 0.3 + 122 × 0.4 + 152 × 0.3] − 122 = 149.4 − 144 = 5.4

تخمین زننده برای هستند. بر اساس میانگین هر دو 21هر دو مساوی 𝜇𝑚𝑑و 𝜇�̅�تفسیر: بنابر این مشخص شده که

𝜎�̅�در حالیکه رسند،استنباط میانگین جامعه مناسب به نظر می𝜎𝑚𝑑کوچکتر از 2

است. با این توصیف چون پراکندگی 2

دارد. 𝑚𝑑ویژگی مطلوبتری نسبت به �̅�است، پس آماره 𝑚𝑑پراکندگی توزیع کمتر از �̅�توزیع

ویژگیهای تخمین زن مطلوب:

𝐸(𝜃)یکی از ویژگیهای تخمین زن، نااریب بودن است. هر موقع امید ریاضی تخمین زن شما با مقدار پارامتر = 𝜃 برابر

، نااریب است.باشد

𝑚𝑑به �̅�در مثال قبل:کارایی نسبی

𝜎𝑚𝑑2

𝜎�̅�2 =

5.4

3= 1.8

واریانس کمتری داشته باشد کاراتر است.در تخمین، توزیعی که ( کاراتر است.𝑚𝑑از میانه ) 2.1به میزان �̅�درنتیجه

0

0.1

0.2

0.3

9 10 11 12 13 14 15

x barتوزیع

Page 5: یرایرهش رتکد یاقآ یرامآ لیلحت هوزج Æحªص ·Ãا Æسºجfreecontent.atiyehsanat.com/Download/Stat-Shahriyari... · 2016. 10. 5. · یرامآ لیلحت

آقای دکتر شهریاری 5 صفحهجلسه دوم تحلیل آماریجزوه

میزان اریب بودن:

= میزان اریب بودن 𝐸(𝜃) − 𝜃

𝑀𝑆𝐸 خطای مجذور میانگین = 𝜎�̂�2 + 2(اریب)

باشد.کمتر بود، بهترین تخمین زن می MSEبرای دو تخمین نا اریب کارایی یا حداقل واریانس، هر کدام

شود. بر اساس این می (21و21، میزان اریب و فاصله )21میانگین در یکی اگر یکی اریب و دیگری نا اریب باشد، مثلا

کمتری داشته باشد، بهترین تخمین زن است. MSEکنیم و هرکدام فرمول محاسبه می

یکی از مهمترین ویژگیهای تخمین زن نا اریب بودن آن است:

اریب است. هر موقع امیدریاضی تخمین زن با خود پارامتر برابر باشد، یعنی نا -2

𝐸(𝜃) = 𝜃

کارایی یا حداقل واریانس: آنکه کمترین انحراف را داشته باشد، کاراتر است. یعنی برای دو تخمین نا اریب آنکه -1

واریانس کمتری داشته باشد کارایی بیشتری دارد.

زن بهتری کمتری داشته باشد، تخمین MSEاگر یکی آماره اریب و یک آماره نا اریب داشته باشیم هر کدام که -3

است.

𝑀𝑆𝐸 = 𝜎�̂�2 + 2(اریب)

Page 6: یرایرهش رتکد یاقآ یرامآ لیلحت هوزج Æحªص ·Ãا Æسºجfreecontent.atiyehsanat.com/Download/Stat-Shahriyari... · 2016. 10. 5. · یرامآ لیلحت

آقای دکتر شهریاری 6 صفحهجلسه سوم تحلیل آماریجزوه

معرفی برخی توابع نمونه ای:

، یعنی:توزیع شده باشد )xVar =(2σو واریانس )μ)= xEدر جامعه ای که با قانون نرمال و امید ریاضی Xاگر

𝑋~ℕ(𝜇 , 𝜎2)

:مجموعتابع

n+…+X2+X1)=Xn,…,x2,x1f(xای تعریف گردد مانند: نمونهمتغیرهای اگر تابعی بر روی

باشد:ابع خود مطابق توزیع نرمال توزیع شده که میانگین و واریانس آن بدین صورت میاین ت

𝑓(𝑥1, … , 𝑥𝑛) = (𝑥1 + ⋯ + 𝑥𝑛) = ∑ 𝑥𝑖

𝐸 (∑ 𝑥𝑖) = 𝑛𝜇

𝑉𝑎𝑟 (∑ 𝑥𝑖) = 𝑛𝜎2

:تابع میانگین

𝑓(𝑥1, … , 𝑥𝑛) =1

𝑛(𝑥1 + ⋯ + 𝑥𝑛) = �̅�

𝐸(�̅�) = 𝜇

𝑉𝑎𝑟(�̅�) =𝜎2

𝑛

:nدر نمونه ای به حجم Xمیانه

fj= x میانه

𝐸 (میانه) = 𝜇

𝑉𝑎𝑟 (میانه) =𝜎2

𝑛 𝜋

2

قضیه حد مرکزی:

به یک توزیع نمونه گیری قرینه گرایش دارد. ،تایی از یک جامعه آماریnیک نمونه تصادفی رمجموع و میانگین مقادی

Page 7: یرایرهش رتکد یاقآ یرامآ لیلحت هوزج Æحªص ·Ãا Æسºجfreecontent.atiyehsanat.com/Download/Stat-Shahriyari... · 2016. 10. 5. · یرامآ لیلحت

آقای دکتر شهریاری 7 صفحهجلسه سوم تحلیل آماریجزوه

احتمال الف(است. 3و انحراف معیار آن 51. متوسط آن باشدنرمال مینان یک سازمان کیع نمره ارزشیابی کارزمثال: تو

باشد چقدر است؟ 51آنکه نمره حداقل یکی از کارکنان

جواب:

P(x>18)= P(Z>(18-15)/3)=P(Z>1)=0.1587 کنیم:تاندارد از این فرمول استفاده میبرای استاندارد نمودن و استفاده از جدول نرمال اس

𝑍 =𝑥 − 𝐸(𝑥)

𝑉𝑎𝑟(𝑥)

سپس بر اساس جدول نرمال استاندارد میزان مورد نظر را استخراج می کنیم.

51نفر حداقل 9تایی از جامعه کارکنان بگیریم، احتمال آنکه میانگین نمرات ارزشیابی این 9اگر نمونه ب( مثال ادامه

باشد؟

جواب:

𝑃(�̅� ≥ 18) = 𝑃 (𝑍 ≥18 − 15

3

√9

) = 𝑃(𝑧 ≥ 3) = 0.0013

گردد. در نمودار فوق بخش قرمز رنگ مربوط به نمونه ها شکل توزیع به حال نرمال استاندارد نزدیکتر میبا افزایش تعداد

باشد.ب مثال میمثال و سطح آبی رنگ مربوط به قسمت الف قسمت

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

-3 SD -2 SD -1 SD Mean +1 SD +2 SD +3 SD

0.00

0.05

0.10

0.15

0.20

0.25

0.30

0.35

0.40

0.45

-3.00 -2.50 -2.00 -1.50 -1.00 -0.50 0.00 0.50 1.00 1.50 2.00 2.50 3.00

Page 8: یرایرهش رتکد یاقآ یرامآ لیلحت هوزج Æحªص ·Ãا Æسºجfreecontent.atiyehsanat.com/Download/Stat-Shahriyari... · 2016. 10. 5. · یرامآ لیلحت

آقای دکتر شهریاری 8 صفحهجلسه سوم تحلیل آماریجزوه

برخی قوانین توزیع مهم در آمار استنباطی:

)کای دو( 𝝌𝟐توزیع

، یعنی:توزیع شده باشد D(x)= σ انحراف معیارو E(x)= αامید ریاضی مطابق با قانون نرمال، xکمیت تصادفی

𝑋~ℕ(𝛼 , 𝜎)

کمیت جهت استاندارد سازی

𝑈 =𝑋 − 𝛼

𝜎

𝑈~ℕ(0 , 1) درجه آزادی می باشد. 5با « کای دو»دارای توزیع Uتوان دوم

𝑈2 = (𝑋 − 𝛼

𝜎)

2

= 𝜒با یک درجه آزادی2

از جامعه گرفته شود nای به حجم اگر نمونه

𝑈𝑖 =𝑋𝑖 − 𝛼

𝜎

𝑈12 + 𝑈2

2 + ⋯ + 𝑈𝑛2 = 𝜒درجه آزادی n با

2

گیرد که مستقل از یکدیگر مقدار اختیارای را در بر می، تعداد اجزای تشکیل دهنده تابع نمونهاینمونهدرج آزادی یک تابع

کنند.می

)کای دو( 𝝌𝟐توزیع تابع چگالی

𝜙𝑥2𝜈(𝑦) =1

2(𝜐2

) Γ (𝜐2

)𝑦(𝜐

2⁄ −1) 𝑒(−𝑦

2⁄ )

𝐸(𝜒𝜐

2) = 𝜐 𝐷(𝜒𝜐

2) = 2𝜐

کند.به توزیع نرمال گرایش پیدا می 𝜒2تابع توزیع کمیت تصادفی νبر اساس قضیه حدمرکزی با افزایش درجه آزادی

𝜈 = 1 𝜈 ≥ 1

Page 9: یرایرهش رتکد یاقآ یرامآ لیلحت هوزج Æحªص ·Ãا Æسºجfreecontent.atiyehsanat.com/Download/Stat-Shahriyari... · 2016. 10. 5. · یرامآ لیلحت

آقای دکتر شهریاری 9 صفحهجلسه سوم تحلیل آماریجزوه

𝜒2کمیتهای تصادفی مستقل که هریک مطابق با قانون 𝜐𝑘با درجه آزادی 𝜒2... و و 𝜐1با درجه آزادی 𝜒2: اگر قضیه

خواهد بود. νبا درجه آزادی 𝜒2باشند. حاصل جمع این مقادیر خود یک توزیع 𝜐𝑘تا 𝜐1به ترتیب با درجه آزادی

𝜒2(𝜐1), 𝜒2(𝜐2), … , 𝜒2(𝜐𝑘) 𝜒2(𝜐) = 𝜒2(𝜐1) + … + 𝜒2(𝜐𝑘)

باشد.درجه آزادی می ها خواهد بود که نشاندهندهνبرابر با جمع νمیزان

υ = 𝜐1 + ⋯ + 𝜐𝑘

تابع گاما:

Γ(𝑛) = (𝑛 − 1)!

𝜒 𝑝 ,𝜈2

P

𝜈 ≥ 1

Page 10: یرایرهش رتکد یاقآ یرامآ لیلحت هوزج Æحªص ·Ãا Æسºجfreecontent.atiyehsanat.com/Download/Stat-Shahriyari... · 2016. 10. 5. · یرامآ لیلحت

آقای دکتر شهریاری 01 صفحهجلسه سوم تحلیل آماریجزوه

:tتوزیع

، یعنی:توزیع شده باشد 2σ و μکمیت تصادفی که بر طبق قانون نرمال با پارامترهای Xاگر

𝑋~ℕ(𝜇 , 𝜎2) گرددتعریف می Xدو تابع برای

𝑓1(𝑥1, … . 𝑥𝑛) = 𝑈 𝑓2(𝑥1, … . 𝑥𝑛) = 𝜒2𝜐

دارد: tنسبت زیر توزیع

𝑇 =𝑈

√𝜒2𝜐𝜐

𝜙𝑇𝜐 =Γ (

𝜐 + 12

)

√𝜋𝜐 Γ (𝜐2

)(1 +

𝑡2

𝜐)

− 𝜐+1

2

𝐸(𝑇) = 𝜐

𝐷(𝑇) =𝜐

𝜐 − 2

خواهد بود. 𝜒2تعداد اجزای مستقل تشکیل دهنده کمیت تصادفی νتابع کمیت در این

P

𝑡𝑃 ,𝜈

𝜈 = 1

𝜈 > 1

Page 11: یرایرهش رتکد یاقآ یرامآ لیلحت هوزج Æحªص ·Ãا Æسºجfreecontent.atiyehsanat.com/Download/Stat-Shahriyari... · 2016. 10. 5. · یرامآ لیلحت

آقای دکتر شهریاری 00 صفحهجلسه سوم تحلیل آماریجزوه

)فیشر(: Fتوزیع

توزیع شده باشد، یعنی: 2σو μکمیت تصادفی که بر طبق قانون نرمال با پارامترهای Xاگر

𝑋~ℕ(𝜇 , 𝜎2) گرددتعریف می Xدو تابع برای

𝑓1(𝑥1, … . 𝑥𝑛) = 𝜒(𝜐1)2

𝑓2(𝑥1, … . 𝑥𝑛) = 𝜒(𝜐2)2

𝐹(𝜐1,𝜐2) = 𝜒(𝜐1)

2

𝜐1

𝜒(𝜐2)2

𝜐2

𝜙𝐹(𝜐) =Γ (

𝜐1 + 𝜐2

2)

Γ (𝜐1

2) Γ (

𝜐2

2)

(𝜐1

𝜐2

)

𝜐12 𝜐

𝜐12

−1

(1 −𝜐1

𝜐2𝜐) (

𝜐1 + 𝜐2

2)

𝐸(𝐹) =𝜐2

𝜐2 − 2 𝜐 > 2

𝐷(𝐹) =2 𝜐2

2(𝜐1 + 𝜐2 − 2)

𝜐1(𝜐2 − 2)2(𝜐2 − 4)

Page 12: یرایرهش رتکد یاقآ یرامآ لیلحت هوزج Æحªص ·Ãا Æسºجfreecontent.atiyehsanat.com/Download/Stat-Shahriyari... · 2016. 10. 5. · یرامآ لیلحت

آقای دکتر شهریاری 21 صفحهجلسه چهارم تحلیل آماریجزوه

تخمین های فاصله ای:

θ: پارامتر جامعه

U: حد بالایی

L: حد پایینی

𝐿 ≤ 𝜃 ≤ 𝑈

≥ 𝐿فاصله 𝜃 ≤ 𝑈 را یک فاصله اطمینان(1-α)% برای پارامترθ گویند اگر

𝑃(𝐿 ≤ 𝜃 ≤ 𝑈) = 1 − 𝛼 1-α نامندرا ضریب اطمینان می

از این %(α-1)حاصل شود، در %(α-1)فاصله اطمینان θتفسیر فاصله اطمینان: اگر در نمونه گیریهای متعدد، برای

( زیاددر بلند مدت )تعداد نمونه گیری %59خواهد بود. به عنوان مثال در سطح اطمینان θفاصله ها شامل مقدار واقعی

نخواهد بود. θه ها شامل ، از فاصل %9تنها

1-α= 95% α=5%

در نتیجه داریم:( θ >L ویا U>θحدود دوطرفه بوده و یا یکطرفه باشد ) نکته: ممکن است

𝑃(𝐿 ≤ 𝜃) = 1 − 𝛼

𝑃(𝜃 ≤ 𝑈) = 1 − 𝛼

(:Accuracy) صحت

صحت صحت

L θ U

θ − 𝐿 = 𝑈 − 𝜃 = صحت

از طرف دیگر بزرگترگیرد، درون بازه قرار می θهرچه فاصله اطمینان بزرگتر باشد، مطمئن تر هستیم که مقدار واقعی

دهد.نشان می θبودن این فاصله اطلاعات کمتری را در مورد مقدار واقعی

در حالت ایده آل به دنبال تخمین یک فاصله کوچک با اطمینان بالا هستیم.

Page 13: یرایرهش رتکد یاقآ یرامآ لیلحت هوزج Æحªص ·Ãا Æسºجfreecontent.atiyehsanat.com/Download/Stat-Shahriyari... · 2016. 10. 5. · یرامآ لیلحت

آقای دکتر شهریاری 21 صفحهجلسه چهارم تحلیل آماریجزوه

اطمینان برای میانگین جامعه ای با واریانس معلوم:فاصله

. حال شودتایی برداشته می nباشد، یک نمونه تصادفی 2σو واریانس معلوم μیک متغیر تصادفی با میانگین مجهول xاگر

حاصل نمود. �̅�توان با در نظر گیری توزیع نمونه ای می μرا برای %(α-1)فاصله اطمینان

�̅�~ℕ (𝜇 ,𝜎2

𝑛)

𝑍 =�̅� − 𝜇

𝜎

√𝑛

⇒ 𝑍~ℕ(0,1)

𝑃 (−𝑍𝛼2⁄ ≤ 𝑍 ≤ 𝑍𝛼

2⁄ ) = 1 − 𝛼

𝑃 (−𝑍𝛼2⁄ ≤

�̅� − 𝜇𝜎

√𝑛

≤ 𝑍𝛼2⁄ ) = 1 − 𝛼

𝑃 (�̅� − 𝑍𝛼2⁄

𝜎

√𝑛≤ 𝜇 ≤ �̅� + 𝑍𝛼

2⁄ 𝜎

√𝑛) = 1 − 𝛼

%95خواهیم یک فاصله اطمینان باشد. می 0.1مثال: اگر بدانیم که جامعه مورد نظر نرمال بوده و انحراف استاندارد آن

𝑍0.975برای میانگین جامعه تخمین بزنیم. داده ها شامل: ) = 1.96)

41.6, 41.48, 42.34, 41.95, 41.86, 42.18, 41.72, 42.26, 41.81, 42.04

یادآوری: محاسبه واریانس یک نمونه می تواند از یکی از فرمولهای ذیل صورت پذیرد

𝑆2 =∑ (𝑥𝑖 − �̅�)2𝑛

𝑖=1

𝑛 − 1=

𝑛 ∑ 𝑥𝑖2𝑛

𝑖=1 − (∑ 𝑥𝑖𝑛𝑖=1 )2

𝑛(𝑛 − 1)

جواب:

𝐿 = �̅� − 𝑍𝛼2⁄

𝜎

√𝑛 ⇒ 𝐿 = 41.92 − 1.96 ∗

0.28

√10= 41.75

𝑈 = �̅� + 𝑍𝛼2⁄

𝜎

√𝑛 ⇒ 𝐿 = 41.92 + 1.96 ∗

0.28

√10= 42.09

41.75 ≤ 𝜇 ≤ 42.09

Page 14: یرایرهش رتکد یاقآ یرامآ لیلحت هوزج Æحªص ·Ãا Æسºجfreecontent.atiyehsanat.com/Download/Stat-Shahriyari... · 2016. 10. 5. · یرامآ لیلحت

آقای دکتر شهریاری 21 صفحهجلسه چهارم تحلیل آماریجزوه

اگر در مثال فوق داشته باشیم

1-α=99%

α=0.01 α/2=0.005 𝑍0.995 = 2.58

𝐿 = �̅� − 𝑍𝛼2⁄

𝜎

√𝑛 ⇒ 𝐿 = 41.92 − 2.58 ∗

0.28

√10= 41.69

𝑈 = �̅� + 𝑍𝛼2⁄

𝜎

√𝑛 ⇒ 𝐿 = 41.92 + 2.58 ∗

0.28

√10= 42.15

41.69 ≤ 𝜇 ≤ 42.15

انتخاب اندازه نمونه:

برای رسیدن به اندازه )فاصله اطمینان مناسب( هم کوچک و هم مطمئن انتخاب اندازه نمونه به حد کافی بزرگ یک راه

𝑍𝛼)حل است، در این حالت اگر صحت فاصله اطمینان برابر 2⁄

𝜎

√𝑛یک μبه جای �̅�باشد در این حالت استفاده از (

𝐸خطا به میزان = |�̅� − 𝜇| این خطا با اطمینان(1-α)% کوچکتر است از میزان صحت. حال می توانn را طوری

کوچکتر باشد یعنی: Eاطمینان خطای تخمین از خطای مشخص %(α-1)کنترل نمود که با

𝐸 = 𝑍𝛼2⁄

𝜎

√𝑛 ⇒ 𝑛 = (𝑍𝛼

2⁄ 𝜎

𝐸)

2

داریم E=0.05و خطای برابر %59با اطمینان فوقدر مثال

𝑛 = (1.96 ∗0.28

0.05)

2

= 120.47 ≈ 121

نمونه می باشد. 111نگه می دارد تعداد 0.05حداقل تعداد نمونه ای که میزان خطا را به اندازه

نرم افزارهای کاربردی در آمار:

SPSS, STATA, Statistica, Minitab, R, SAS

Page 15: یرایرهش رتکد یاقآ یرامآ لیلحت هوزج Æحªص ·Ãا Æسºجfreecontent.atiyehsanat.com/Download/Stat-Shahriyari... · 2016. 10. 5. · یرامآ لیلحت

آقای دکتر شهریاری 51 صفحهجلسه پنجم تحلیل آماریجزوه

𝝁𝟏برای تفاوت میانگین در جامعه: فاصله اطمینان − 𝝁𝟐

𝜎1و واریانس معلوم 𝜇1متغیر تصادفی مستقل با میانگین مجهول 𝑋1اگر متغیر تصادفی مستقل با میانگین 𝑋2بوده و 2

𝜎2و واریانس معلوم 𝜇2مجهول باشد: 2

𝑋1~ℕ(𝜇1, 𝜎1 �̅�1 ⇒ تایی 1nنمونه گیری (2

𝑋2~ℕ(𝜇2, 𝜎2 �̅�2 ⇒ تایی 2nنمونه گیری (2

آماره:

(�̅�1 − �̅�2)~ℕ((𝜇1 − 𝜇2), (𝜎12

𝑛1+

𝜎22

𝑛2))

توزیع:

𝑍 =(�̅�1 − �̅�2) − (𝜇1 − 𝜇2)

√(𝜎12

𝑛1+𝜎22

𝑛2)

𝑍~ℕ(0,1)

سطح اطمینان:

𝑃 (−𝑍𝛼2⁄≤ 𝑍 ≤ 𝑍𝛼

2⁄) = 1 − 𝛼

𝑃((�̅�1 − �̅�2)−𝑍𝛼 2⁄√(

𝜎12

𝑛1+𝜎22

𝑛2) ≤ (𝜇1 − 𝜇2) ≤ (�̅�1 − �̅�2)+𝑍𝛼 2⁄

√(𝜎12

𝑛1+𝜎22

𝑛2)) = 1 − 𝛼

صحت صحت

𝑍𝛼

2⁄√(

𝜎12

𝑛1+𝜎22

𝑛2)

(�̅�1 − �̅�2) 𝑍𝛼

2⁄√(

𝜎12

𝑛1+𝜎22

𝑛2)

Page 16: یرایرهش رتکد یاقآ یرامآ لیلحت هوزج Æحªص ·Ãا Æسºجfreecontent.atiyehsanat.com/Download/Stat-Shahriyari... · 2016. 10. 5. · یرامآ لیلحت

آقای دکتر شهریاری 51 صفحهجلسه پنجم تحلیل آماریجزوه

بازه یکطرفه:

𝑃((�̅�1 − �̅�2)−𝑍𝛼√(𝜎12

𝑛1+𝜎22

𝑛2) ≤ (𝜇1 − 𝜇2)) = 1 − 𝛼

𝑃((𝜇1 − 𝜇2) ≤ (�̅�1 − �̅�2)+𝑍𝛼√(𝜎12

𝑛1+𝜎22

𝑛2)) = 1 − 𝛼

دو جامعه نرمال بدین صورت استخراج شده است:مثال: اطلاعات

𝑛1 = 10 , �̅�1 = 87.6 , 𝜎1 = 1 𝑛2 = 12 , �̅�2 = 74.5 , 𝜎2 = 1.5 1 − 𝛼 = 90%

جواب:

𝑋1~ℕ(𝜇1,1

10)

𝑋2~ℕ(𝜇2,1.52

12)

𝐿 = (87.6 − 74.5) − 1.65√1

10+

1.52

12 =12.22

𝑈 = (87.6 − 74.5) + 1.65√1

10+

1.52

12 =13.98

12.22 ≤ (𝜇1 − 𝜇2) ≤ 13.98

مطمئن هستیم که میانگین جامعه %09باشد. و یا به میزان موارد اختلاف بین میانگین ها در این بازه می %09در تحلیل:

از میانگین جامعه دوم بیشتر است. 29.01تا 21.11اول به میزان

باشد: %5تعداد نمونه برای این مثال اگر خطا

𝑛 = (𝑍𝛼

2⁄

𝐸)

2

(𝜎12 + 𝜎2

2)

𝑛 = (1.65

0.05)2

(1 + 2.25) = 3540

کوچکتر است. %5از خطای مشخص ناطمینان خطای تخمی %09 با

Page 17: یرایرهش رتکد یاقآ یرامآ لیلحت هوزج Æحªص ·Ãا Æسºجfreecontent.atiyehsanat.com/Download/Stat-Shahriyari... · 2016. 10. 5. · یرامآ لیلحت

آقای دکتر شهریاری 51 صفحهجلسه پنجم تحلیل آماریجزوه

:برای میانگین با واریانس مجهول فاصله اطمینان

تایی از جامعه گرفته شده nفرض کنید در یافتن فاصله اطمینان برای میانگین، واریانس جامعه نامعلوم باشد. اگر نمونه

واریانس نمونه باشد. 𝑆2میانگین نمونه و �̅�باشد،

ا واریانس نمونه را ب توان واریانسنکته: در تمامی روابط پیشین اگر اندازه نمونه یا حجم نمونه به اندازه کافی بزرگ باشد می

𝑛اری کرد. )در حالتی که جامعه جایگذ ≥ باشد.( 30

باشد. کوچک می nو تعداد جامعه مجهول می باشند( 2σو μتایی از جامعه باشد ) nیک نمونه nXتا 1Xفرض کنید که

درنتیجه داریم:

آماره:

𝑡درجه آزادی 𝑛−1 =�̅� − 𝜇

𝑆

√𝑛

𝑃 = (−𝑡𝛼2

,(𝑛−1) ≤ 𝑡 ≤ 𝑡𝛼2

,(𝑛−1 )) = 1 − 𝛼

𝑃 = (�̅�−𝑡𝛼2

,(𝑛−1)

𝑆

√𝑛≤ 𝜇 ≤ �̅�+𝑡𝛼

2,(𝑛−1)

𝑆

√𝑛) = 1 − 𝛼

نمونه ذیل 19و تعداد نمونه در اختیار جامعه مجهول می باشند 2σو μیک جامعه در شرایطی که μمثال: برای تخمین

داریم: %05باشند. با سطح اطمینان می9.85 9.67 9.74 9.92 9.87 9.92 9.93 9.67 9.83 9.95 9.77 9.75 9.95 9.75 9.85 9.88 9.93 9.94 9.99 9.89

1 − 𝛼 𝛼2⁄ 𝛼

2⁄

L U

−𝑡𝛼2

,(𝑛−1) 𝑡𝛼

2,(𝑛−1)

Page 18: یرایرهش رتکد یاقآ یرامآ لیلحت هوزج Æحªص ·Ãا Æسºجfreecontent.atiyehsanat.com/Download/Stat-Shahriyari... · 2016. 10. 5. · یرامآ لیلحت

آقای دکتر شهریاری 51 صفحهجلسه پنجم تحلیل آماریجزوه

جواب:

�̅� = 9.85 𝑆 = 0.95 𝑡0.025 ,19 = 2.093

𝐿 = 9.85 − 2.093(0.95

√20) = 9.8

𝑈 = 9.85 + 2.093(0.95

√20) = 9.89

فاصله اطمینان برای واریانس جامعه:

2Sتایی از جامعه که دارای واریانس nباشد. و یک نمونه 2σو μنرمال و دارای میانگین و واریانس مجهول Xفرض کنید

باشد.

آماره:

𝜒2 =(𝑛 − 1)𝑆2

𝜎2

𝑃 = (𝜒 1−𝛼 2⁄ ,𝑛−1

2 ≤ 𝜒2 ≤ 𝜒 𝛼 2⁄ ,𝑛−12 ) = 1 − 𝛼

𝑃 = (𝑛 − 1)𝑆2

𝜒 𝛼 2⁄ ,𝑛−12 ≤ 𝜎2 ≤

(𝑛 − 1)𝑆2

𝜒 1−𝛼 2⁄ ,𝑛−12 = 1 − 𝛼

یکطرفه:

𝜎2 ≤(𝑛 − 1)𝑆2

𝜒 1−𝛼 ,𝑛−12

(𝑛 − 1)𝑆2

𝜒 𝛼 ,𝑛−12 ≤ 𝜎2

9.115تایی واریانس نمونه 19مثال: فرض کنید حجم مایع داخل کپسول تقریبا توزیع نرمال داشته باشد، در یک نمونه

، فاصله اطمینان بالایی را محاسبه کنید. %05است در سطح اطمینان جواب:

𝜎2 ≤19 ∗ 0.225

10.12 ⇒ 𝜎2 ≤ 0.423 , 𝜎 ≤ 0.21

𝜒 𝛼 2⁄ ,𝑛−12

1 − 𝛼

𝜒 1−𝛼 2⁄ ,𝑛−12

𝛼2⁄ 𝛼

2⁄

L U

Page 19: یرایرهش رتکد یاقآ یرامآ لیلحت هوزج Æحªص ·Ãا Æسºجfreecontent.atiyehsanat.com/Download/Stat-Shahriyari... · 2016. 10. 5. · یرامآ لیلحت

آقای دکتر شهریاری 91 صفحه ششمجلسه تحلیل آماریجزوه

𝝁𝟏فاصله اطمینان − 𝝁𝟐 :در مشاهدات زوجی

در محاسبه فاصله اطمینان برای تفاوت میانگین دو جامعه این کار بر مبنای دو نمونه تصادفی مستقل از هر یک از جوامع

گرفت. نمونه تصادفی از جامعه دوم مبنای قضاوت قرار می 2nمشاهده تصادفی از جامعه اول و 1nگردید، یعنی انجام می

گردند. وجی جمع آوری میها بصورت زواحد آزمایش متفاوت وجود داشته و داده nاما در حالت مشاهدت زوجی تنها

(iD .)اختلافات زوجی است

(x11 , x21) , (x12 , x22) , … , (x1n , x2n) D1= x11 - x21 , D2= x12 - x22 , … , Dn= x1n - x2n

𝐷𝑖~ℕ(�̅� , 𝑆𝐷2)

𝜇𝐷 = 𝐸(𝑋1 − 𝑋2) = 𝐸(𝑋1) − 𝐸(𝑋2) = 𝜇1 − 𝜇2

𝑃 −𝑍𝛼2 ≤ 𝑍 ≤ 𝑍𝛼

2 = 1 − 𝛼

کنیم و داریم:استفاده می tع باشد از توزی n<30اگر

𝑃 −𝑡 𝛼2

,𝑛−1

≤ 𝑡 ≤ 𝑡 𝛼2

,𝑛−1

= 1 − 𝛼

𝑃 �̅�−𝑡 𝛼2

,𝑛−1

𝑆𝐷

𝑛≤ 𝜇𝐷 ≤ �̅�+𝑡 𝛼

2

,𝑛−1

𝑆𝐷

𝑛 = 1 − 𝛼

%90نفر( سطح اطمینان 14مثال: مسئله پارک اتومبیل )دو اتومبیل توسط

(iDتفاوت ) نفر (iDتفاوت ) نفر

1 19.2 8 26 2 5.6 9 5.8 3 -0.6 10 1.2 4 -17.2 11 -6.2 5 0.6 12 0.6 6 -5 13 4 7 7 14 -24

�̅� = 1.21 𝑆𝐷 = 12.68

𝑈 = 1.21 + 1.771 12.68

14 = 7.21

𝐿 = 1.21 − 1.771 12.68

14 = −4.79

−4.79 ≤ 𝜇𝐷 ≤ 7.21

این نمونه گیریها، اختلاف میانگین %90راننده با سایر افراد( مطمئن هستیم که در 14تفسیر: در نمونه گیری های متعدد )جایگزین شدن

گیرد.جامعه در این بازه قرار می

Page 20: یرایرهش رتکد یاقآ یرامآ لیلحت هوزج Æحªص ·Ãا Æسºجfreecontent.atiyehsanat.com/Download/Stat-Shahriyari... · 2016. 10. 5. · یرامآ لیلحت

آقای دکتر شهریاری 02 صفحه ششمجلسه تحلیل آماریجزوه

فاصله اطمینان برای یک نسبت:

( 1اگر بخواهیم یک فاصله اطمینان − 𝛼)% ( برای نسبت خاصی از یک جامعه بدست آوریمP در یک نمونه .)مجهولn تایی

واحد به یک دسته خاص تعلق دارد Xاز جامعه میزان

آماره:

𝑃 =𝑥

𝑛

توزیع:

𝑃 ~ℕ 𝑃,𝑃(1 − 𝑃)

𝑛

𝑍 =𝑃 − 𝑃

√𝑃(1 − 𝑃)𝑛

𝑃 −𝑍𝛼2 ≤ 𝑍 ≤ 𝑍𝛼

2 = 1 − 𝛼

𝑃(𝑃 − 𝑍𝛼2 √𝑃(1 − 𝑃)

𝑛≤ 𝑃 ≤ 𝑃 + 𝑍𝛼

2 √𝑃(1 − 𝑃)

𝑛) = 1 − 𝛼

تقریب بزنیم و داریم: 𝑃را با Pتوان می

𝑃(𝑃 − 𝑍𝛼2 √𝑃 (1 − 𝑃 )

𝑛≤ 𝑃 ≤ 𝑃 + 𝑍𝛼

2 √𝑃 (1 − 𝑃 )

𝑛) = 1 − 𝛼

درصورت یکطرفه بودن نیز داریم:

𝑃 ≤ 𝑃 + 𝑍𝛼√𝑃 (1 − 𝑃 )

𝑛

𝑃 − 𝑍𝛼√𝑃 (1 − 𝑃 )

𝑛≤ 𝑃

باشند. ضمن محاسبه یک تخمین عدد دارای صافی سطح نامطلوب می 11تایی از خط تولید، 57مثال: در یک نمونه

بیابید. %97هستند، یک فاصله اطمینان نقطه ای برای نسبتی از محصولات که دارای صافی سطح نامطلوب

جواب:

𝑃 =𝑋

𝑛=12

75= 0.16

Page 21: یرایرهش رتکد یاقآ یرامآ لیلحت هوزج Æحªص ·Ãا Æسºجfreecontent.atiyehsanat.com/Download/Stat-Shahriyari... · 2016. 10. 5. · یرامآ لیلحت

آقای دکتر شهریاری 09 صفحه ششمجلسه تحلیل آماریجزوه

1 − 𝛼 = 95%

𝑈 = 0.16 + 1.96√0.16 ∗ 0.84

75= 0.24

𝐿 = 0.16 − 1.96√0.16 ∗ 0.84

75= 0.08

مناسب برای رسیدن به دقت مناسب:تعداد نمونه

𝑛 = 𝑍𝛼

2

𝐸

2

𝑃 (1 − 𝑃 )

داریم: 0.07در مثال فوق با فرض خطای

𝑛 = 1.96

0.05 2

0.16 ∗ 0.84 ≈ 207

Page 22: یرایرهش رتکد یاقآ یرامآ لیلحت هوزج Æحªص ·Ãا Æسºجfreecontent.atiyehsanat.com/Download/Stat-Shahriyari... · 2016. 10. 5. · یرامآ لیلحت

آقای دکتر شهریاری 22 صفحهجلسه هفتم تحلیل آماریجزوه

آزمون فرض آماری:

تواند شامل یک یا چند فرض آماری اظهارنظری در خصوص توزیع احتمالی یک متغیر تصادفی است. این فرض مییک

ز این توزیع باشد.پارامتر ا

های حاصل از جامعه. ر مورد نمونهشوند، نه دها در مورد جامعه مطرح میفرض

گردد:به سه طریق حاصل می شود، عموماًاز پارامتر جامعه که در فرض صفر مشخص میمقداری

های پیشین )با هدف کنترل تغییر وضعیت آزمایش(الف( حاصل از تجربه و اطلاع قبلی از فرایند و حتی آزمایش

فرایند تحت مطالعه )با هدف اثبات و یا رد تئوری(ب( حاصل یک تئوری مربوط به

ها(تطابق با خواستهج( بر اساس ملاحظات خارجی و نیز تعهدات یک قرارداد )با هدف

0Hنقیض فرض مطروحه د( 1ر : فرضیه صفرH بوده و به صورت مساوی درج می).گردد

1Hگردد.(: فرضیه مقابل )فرضیه مورد آزمایش و ادعای پژوهشگر قلمداد می

کند. این کار بر اساس اطلاعات حاصل از یک نمونه تصادفی انجام آزمون فرض درستی یا نادرستی یک فرضیه را تعیین می

کنیم.پذیرد. اگر اطلاعات حاصل از این نمونه با فرض سازگار باشد آنرا پذیرفته و در غیر این صورت رد میمی

رویه آزمون فرض:

I. انتخاب یک نمونه تصادفی

II. محاسبه آماره مناسب

III. 0اگر در بازه قبولی باشدH 0حرانی باشد، پذیریم و اگر در ناحیه برا میH کنیم.میرا رد

خطاهای نوع اول و دوم:

باشد و به همین دلیل با خطا همراه خواهد تصمیم گیری در خصوص قبول یا رد فرض صفر بر اساس نمونه تصادفی می

بود.

ا رد کنیم یعنی:( فرض صفر درست باشد ولی آنرαخطای نوع اول )

α = 𝑃 فرض صفر درست باشد فرض𝐻0 رد شود

ر غلط است ولی آنرا بپذیریم یعنی:( فرض صفβخطای نوع دوم )

β = 𝑃 فرض صفر غلط باشد فرض𝐻0 پذیرفته شود

قدرت آزمون:

1= قدرت آزمون − β = 𝑃 𝐻0فرض صفر غلط باشد رد

α وβ هایی آنها را کنترل نمود.توان با اعمال روشروند ولی میهیچگاه از بین نمی

Page 23: یرایرهش رتکد یاقآ یرامآ لیلحت هوزج Æحªص ·Ãا Æسºجfreecontent.atiyehsanat.com/Download/Stat-Shahriyari... · 2016. 10. 5. · یرامآ لیلحت

آقای دکتر شهریاری 22 صفحهجلسه هفتم تحلیل آماریجزوه

یا اندازه آزمون گویند را سطح اهمیت αشوند، گیری انتخاب میناحیه بحرانی و توسط تصمیم ( از طریقαخطای نوع اول )

یک نتیجه قوی است. 0Hها( بنابر این رد ای برای معنادار بودن تفاوت)درجه

مختلفی چون میزان انحراف )انحرافات کوچکتر( قابل تشخیص نیستند و به اندازه نمونه لموا( به علت عβخطای نوع دوم )

یک 0Hیابد( پذیرش و ... بستگی دارد. )با افزایش تعداد نمونه در آزمون فرضیه، احتمال خطای نوع دوم کاهش می

باشد.گیری ضعیف مینتیجه

«دلیلی برای رد آن نیافتیم»و یا « کنیمآنرا رد نمی»بگوییم 0Hبهتر است بجای پذیرش

شوند که اظهارنظر در مورد فرضی عیین میها به صورتی تیک نتیجه قوی است، معمولا فرض 0Hبا توجه به اینکه رد فرضیه

باشد. 1Hگیری قوی برای آن مطلوب است در فرض که نتیجه

طرفه: فرضیه دو

𝐻0: 𝜇 = 18 𝐻1: 𝜇 ≠ 18

طرفه:یک فرضیه

𝐻0: 𝜇 = 18 𝐻1: 𝜇 > 18

است. 18معدل دانشجویان بیشتر از

18

ناحیه بحرانی ناحیه بحرانی

17 19

𝐻1 𝐻1

18

ناحیه بحرانی

19

𝐻1

Page 24: یرایرهش رتکد یاقآ یرامآ لیلحت هوزج Æحªص ·Ãا Æسºجfreecontent.atiyehsanat.com/Download/Stat-Shahriyari... · 2016. 10. 5. · یرامآ لیلحت

آقای دکتر شهریاری 42 صفحهجلسه هشتم تحلیل آماریجزوه

:میانگین جامعه با واریانس معلومآزمون فرض

در یک جامعه دارای توزیع نرمال است با پارامترهای 𝑋متغیر تصادفی

𝑋~ℕ(𝜇 , 𝜎2) باشد. اگر میانگین جامعه ای دارای توزیع نرمال بوده و یا تابع دارای شرایط حدمرکزی میدر جامعه 𝑥متغیر تصادفی

مجهول و واریانس معلوم باشد، به دنبال آزمون این فرضیه هستیم:

𝐻0: 𝜇 = 𝜇0 𝐻1: 𝜇 ≠ 𝜇0

ک آماره مناسب داریم:تایی از جامعه گرفته و با استفاده از ی nیک نمونه تصادفی

�̅�~ℕ(𝜇 ,𝜎2

𝑛)

𝑍0 =�̅� − 𝜇0

𝜎2

𝑛

2یند اواحد باشد. فرض که انحراف استاندارد فر 40ال در یک سیستم سوخت رسانی ال: لازم است تا میانگین نرخ اشتعمث

خواهیم با استفاده از یک نمونه تعریف گردد می 0.05( به میزان αد در صورتی که احتمال خطای نوع اول )واحد باش

�̅�تایی از این جامعه فرض آماری را آزمون نمایید؟ ) 25تصادفی = 41.25)

𝐻0: 𝜇 = 40 𝐻1: 𝜇 ≠ 40 𝛼 = 0.05 𝑛 = 25 𝜎 = 2

𝑍0 =41.25 − 40

22

25

= 3.125

𝑍0 قرار داشته در نتیجه فرضیه در ناحیه بحرانی𝐻0 شود.می در

𝐻0رد

−𝑧𝛼2

𝐻0رد

𝐻0عدم رد

𝑧𝛼2

𝐻0رد

-1.96

𝐻0عدم رد

1.96 𝑍0 = 3.125

Page 25: یرایرهش رتکد یاقآ یرامآ لیلحت هوزج Æحªص ·Ãا Æسºجfreecontent.atiyehsanat.com/Download/Stat-Shahriyari... · 2016. 10. 5. · یرامآ لیلحت

آقای دکتر شهریاری 42 صفحهجلسه هشتم تحلیل آماریجزوه

ارتباط آزمون فرض و فاصله اطمینان:

,𝐿 اگر در بازه 𝑈 1)با فاصله اطمینان − 𝛼)% برای پارامترθ ( باشد، آزمونی با خطای نوع اولαنسبت ) به این فرض

آماری

𝐻0: 𝜃 = 𝜃0 𝐻1: 𝜃 ≠ 𝜃0

,𝐿 در بازه 𝜃0شود، اگر و تنها اگر می 𝐻0منتهی به رد 𝑈 .نباشد

40.47به میزان μبرای %95ینان در مثال قبل با فاصله اطم ≤ μ ≤ در 40که باشد در نتیجه با توجه به این 42.03

شود.می رد 𝐻0این بازه نیست، در نتیجه

P (P-Value:)ارزش

𝐻0بزرگتر باشد، فرض « Pارزش »از مقدار αشود. یعنی اگر منجر می 𝐻0رین سطح اهمیتی است که به رد کمت Pمقدار

رد شده است.

آزمون فرض تساوی دو میانگین با واریانس معلوم:

که هر دو جامعه نرمال بوده و یا شرایط قضیه حد مرکزی بر آن حادث باشد 𝑋2و 𝑋1دو جامعه مستقل

𝑋1~ℕ(𝜇1 , 𝜎12)

𝑋2~ℕ(𝜇2 , 𝜎22)

گیریم.تا نمونه می 𝑛2و از جامعه دوم به میزان 𝑛1در جامعه اول به میزان

𝐻0: 𝜇1 = 𝜇2 𝐻1: 𝜇1 ≠ 𝜇2

کنیماز آماره با توزیع زیر استفاده می

(�̅�1 − �̅�2)~ℕ(𝜇1 − 𝜇2 ,𝜎1

2

𝑛1−

𝜎22

𝑛2)

𝑍0

(=

�̅�1 − �̅�2) − (𝜇1 − 𝜇2)

𝜎12

𝑛1− 𝜎2

2

𝑛2

رد شده و در غیر این صورت دلیلی برای رد آن وجود ندارد. 𝐻0در ناحیه بحرانی قرار گرفت، 𝑍0اگر میزان

𝐻1: 𝜇1 > 𝜇2 ⇒ 𝑍0 > 𝑍𝛼 𝐻0 ردبحرانی برای هناحی

𝐻1: 𝜇1 < 𝜇2 ⇒ 𝑍0 < −𝑍𝛼 𝐻0 ردبحرانی برای هناحی

Page 26: یرایرهش رتکد یاقآ یرامآ لیلحت هوزج Æحªص ·Ãا Æسºجfreecontent.atiyehsanat.com/Download/Stat-Shahriyari... · 2016. 10. 5. · یرامآ لیلحت

آقای دکتر شهریاری 42 صفحهجلسه هشتم تحلیل آماریجزوه

رود که خروجی آن برمثال: فرض کنید که مقایسه عملکرد دو خط تولید مدنظر باشد. برای خط )جدیدتر( اول انتظار می

آوری روز جمع 10های نگین خط اول بیشتر از خط دوم( دادهشتر از خط )مستهلک( دوم باشد )میاحسب تعداد در روز بی

باشد. با فرض نرمال بودن فرایند در هر یک از خطوط تولید، آزمون فرض زیر را شده است و اطلاعات زیر در دسترس می

انجام دهید.

𝐻0: 𝜇1 ≤ 𝜇2 𝐻1: 𝜇1 > 𝜇2

𝛼 = 0.05 𝑛 = 10 𝜎1

2 = 40 𝜎22 = 50

�̅�1 = 824.9 �̅�2 = 818.69

𝑍0 =824.9 − 818.69

4010

− 5010

=6.21

3= 2.7

𝑍𝛼 = 1.645

𝑍0 > 𝑍𝛼 ⇒ شود.رد می 𝐻0فرض

آزمون فرض واریانس جامعه:

هستیم.در نظر بگیرید که به دنبال آزمون فرضیه ای درباره واریانس جامعه ای با توزیع نرمال

𝑋~ℕ(𝜇 , 𝜎2) تایی از جامعه گرفته شده است و آماره زیر را تعریف می کنیم. nیک نمونه

𝜒02 =

(𝑛 − 1)𝑠2

𝜎02

𝜈 = (𝑛 − 1)

𝐻0: 𝜎2 = 𝜎0

2 𝐻1: 𝜎

2 ≠ 𝜎02

𝐻0عدم رد

1.645 𝑍0 = 2.7

1 − 𝛼 رد𝐻0

𝛼2 𝛼

2

𝜒 𝛼 2 ,𝑛−12 𝜒 1−𝛼

2 ,𝑛−12

𝐻0رد

𝐻0رد عدم

Page 27: یرایرهش رتکد یاقآ یرامآ لیلحت هوزج Æحªص ·Ãا Æسºجfreecontent.atiyehsanat.com/Download/Stat-Shahriyari... · 2016. 10. 5. · یرامآ لیلحت

آقای دکتر شهریاری 42 صفحهجلسه هشتم تحلیل آماریجزوه

𝜒0

2 < 𝜒 𝛼 ,𝑛−12

𝐻1: 𝜎2 < 𝜎0

2 ⇒ شودرد می 𝐻0فرض

𝜒02 > 𝜒 𝛼 ,𝑛−1

2

𝐻1: 𝜎2 > 𝜎0

2 ⇒ شودرد می 𝐻0فرض

واحد بیشتر 0.02گیرد. اگر واریانس حجم پر شده از وطی های نوشابه، مورد استفاده قرار میمثال: ماشینی برای پر کردن ق

نوشابه خواهد داشت.ها کسری حجم قبولی از قوطی باشد، درصد غیر قابل

𝐻0: 𝜎2 ≤ 0.02

𝐻1: 𝜎2 > 0.02

𝛼 = 0.05 𝑛 = 20 𝑠2 = 0.0225

𝜒02 =

(20 − 1)0.0225

0.02= 21.4

𝜒 0.05 ,19

2 = 30.14

نداریم. 𝐻0در ناحیه بحرانی نبوده و دلیلی برای رد

1 − 𝛼 رد𝐻0

𝛼

𝜒 1−𝛼 ,𝑛−12

𝐻0رد عدم

1 − 𝛼

𝛼

𝜒 𝛼 ,𝑛−12

𝐻0رد

𝐻0رد عدم

Page 28: یرایرهش رتکد یاقآ یرامآ لیلحت هوزج Æحªص ·Ãا Æسºجfreecontent.atiyehsanat.com/Download/Stat-Shahriyari... · 2016. 10. 5. · یرامآ لیلحت

آقای دکتر شهریاری 82 صفحهجلسه نهم تحلیل آماریجزوه

:جدول توافقیآزمون

های اند را از منظر استقلال روشنمونه گرفته شده از یک جامعه که بر مبنای دو معیار طبقه بندی شده nاگر بخواهیم

بندی بررسی کنیم به آزمون جدول توافقی نیازمندیم.طبقه

انی مشاهده شده در سطح فراو 𝑂𝑖𝑗سطح باشد، 𝑐سطح و روش طبقه بندی دوم دارای 𝑟اگر روش طبقه بندی اول دارای

𝑖 ام اولین روش و سطح𝑗 باشد.ام دومین روش می

1 2 … 𝑐 1 𝑂11 𝑂12 … 𝑂1𝑐 2 𝑂21 𝑂22 … 𝑂2𝑐 . . .

.

.

. . . .

.

.

. 𝑟 𝑂𝑟1 𝑂𝑟2 … 𝑂𝑟𝑐

𝑈𝑖 محاسبه سطر =1

𝑛 𝑂𝑖𝑗

𝑐

𝑉𝑗 محاسبه ستون =1

𝑛 𝑂𝑖𝑗

𝑟

𝐸𝑖𝑗 فراوانی مورد انتظار = 𝑛 ∙ 𝑈𝑖 ∙ 𝑉𝑗

𝜒02 =

𝑂𝑖𝑗 − 𝐸𝑖𝑗 2

𝐸𝑖𝑗

𝑐

𝑟

𝜈 درجه آزادی = 𝑟 − 1 ∙ 𝑐 − 1

فرض استقلال رد می شود اگر:

𝜒02 > 𝜒𝛼 , 𝑟−1 ∙ 𝑐−1

2

Page 29: یرایرهش رتکد یاقآ یرامآ لیلحت هوزج Æحªص ·Ãا Æسºجfreecontent.atiyehsanat.com/Download/Stat-Shahriyari... · 2016. 10. 5. · یرامآ لیلحت

آقای دکتر شهریاری 82 صفحهجلسه نهم تحلیل آماریجزوه

معیارهای طرح دستمزد و نوع مشاغلاستقلال مثال: مقایسه

طرح دستمزد

نوع شغل1طرح 2طرح 3طرح جمع سطر

340 40 140 160 تمام وقت

160 60 60 40 پاره وقت

500 100 200 200 جمع ستون

𝑈1 =340

500= 0.68

𝑈2 =160

500= 0.32

𝑉1 =200

500= 0.4

𝑉2 =200

500= 0.4

𝑉3 =100

500= 0.2

𝐸11 = 500 × 0.68 × 0.4 = 136 𝐸21 = 500 × 0.32 × 0.4 = 64

جدول مورد انتظار

(𝐸𝑖𝑗) 1طرح 2طرح 3طرح

68 136 136 تمام وقت

32 64 64 پاره وقت

𝜒02 =

160−136 2

136+

140−136 2

136+

40−68 2

68+

40−64 2

64+

60−64 2

64+

60−32 2

32= 49.63

𝛼 = 0.5 𝜈 = 2 − 1 ∙ 3 − 1 = 2 𝜒0.5 ,2

2 = 5.99

𝜒0

2 > 5.22

گردد. فرض استقلال میان سطح دستمزد و نوع شغل رد می

Page 30: یرایرهش رتکد یاقآ یرامآ لیلحت هوزج Æحªص ·Ãا Æسºجfreecontent.atiyehsanat.com/Download/Stat-Shahriyari... · 2016. 10. 5. · یرامآ لیلحت

آقای دکتر شهریاری 03 صفحه مدهجلسه تحلیل آماریجزوه

:(Goodness o fit testآزمون زیبندگی)

های آزمون فرض پیشین وقتی کاربرد دارند که تابع چگالی متغیر تصادفی معلوم باشد و آزمون فرض نیز بر روی روش

نداشته باشیم و 𝑋پارامترهای این توزیع معلوم باشد. حال اگر اطلاعی در مورد توزیع احتمالی متغیر تصادفی مورد بررسی

یم.کنبرازندگی )زیبندگی( استفاده میدارای توزیع احتمال خاصی باشد، آزمون کنیم از آزمون 𝑋بخواهیم این فرض را که

:𝐻0ال ....... می باشددارای توزیع احتم 𝑋متغیر

:𝐻1از توزیع....... پیروی نمی کند 𝑋متغیر

𝑛ول است احتیاج داریم. این چگالی آن مجهکه تابع 𝑋تای از متغیر تصادفی 𝑛برای انجام این آزمون یک نمونه تصادفی

𝐸𝑖شاهده شده در هر رده هیستوگرام باشد و فراوانی م 𝑂𝑖شود. اگر رده منظم می 𝑘م با مشاهده در قالب یک هیستوگرا

کنیم:ام بر اساس توزیع مفروض باشد، آماره زیر را محاسبه می 𝑖فراوانی مورد انتظار رده

𝜒02 =

𝑂𝑖 − 𝐸𝑖 2

𝐸𝑖

باشد.می νاین حالت آماره مورد نظر از توزیع کای دو با درجه آزادی در

ν = 𝑘 − 𝑃 − 1 𝑘رده های هیستوگرام :

𝑃شوند.: پارامترهای تابع مفروض که تخمین زده می

اگر

𝜒02 > 𝜒𝛼 , 𝑘−𝑃−1

2

گردد.رد می 𝐻0فرض

را به عنوان حداقل بپذیرد. 5یا 4یا 3ها منتظره مقادیر نکته: لازم است تا فراوانی

Page 31: یرایرهش رتکد یاقآ یرامآ لیلحت هوزج Æحªص ·Ãا Æسºجfreecontent.atiyehsanat.com/Download/Stat-Shahriyari... · 2016. 10. 5. · یرامآ لیلحت

آقای دکتر شهریاری 03 صفحه مدهجلسه تحلیل آماریجزوه

برای تولید اعداد صحیح تصادفی در بازه صفر تا نه طراحی شد است. با اجرای این برنامه یکهزار رقم تصادفی مثال: برنامه ای

کند؟توان گفت این مولد به درستی کار میدیر مشاهده شده بصورت زیر باشد، آیا میتولید شده است. اگر مقا

0 1 2 3 4 5 6 7 8 9 𝑶𝒊 94 93 112 101 104 95 100 99 108 94 𝑬𝒊 100 100 100 100 100 100 100 100 100 100

𝜒02 =

94−100 2

100+

93−100 2

100+ ⋯+

108−100 2

100+

94−100 2

100= 3.72

𝛼 = 0.05 𝜈 = 10 − 0 − 1 = 9 𝜒0.05 ,9

2 = 16.91

3.74 < 𝜒0.05 ,9

2

دلیلی برای رد شدن فرض نداریم.

Page 32: یرایرهش رتکد یاقآ یرامآ لیلحت هوزج Æحªص ·Ãا Æسºجfreecontent.atiyehsanat.com/Download/Stat-Shahriyari... · 2016. 10. 5. · یرامآ لیلحت

آقای دکتر شهریاری 23 صفحهجلسه یازدهم تحلیل آماریجزوه

رگرسیون خطی ساده:

و لازم است این ارتباط مشخص شود. اندم که بطور ذاتی با یکدیگر مرتبط ر برخی مسائل با متغیرهایی مواجه هستید

رتحلیل رگرسیون یک فن آماری برای مدلسازی برای بررسی ارتباط دو یا چند متغیر است. در حالت کلی فرض کنید متغی

𝑥𝑘متغیر مستقل ) kبه Yوابسته ( مرتبط است.𝑥1تا

«میزان سختی جسم»و « میزان حرارت»مانند دو متغیر

x)350 300 250 متغیر ریاضی )مستقل( : )میزان حرارت ...

y)62 65 50 متغیر تصادفی )وابسته( : )میزان سختی جسم ...

باشد.تصادفی وابسته به متغیر ریاضی میبوده ولی متغیر محقق متغیر ریاضی در کنترل

تحلیلگر هستند. در مدل رگرسیون متغیرهای ریاضی و تحت کنترل 𝑥𝑖ولی متغیرهای است یک متغیر تصادفی Yمتغیر

Y نسبت به𝑥𝑘 به دنبال یافتن تابعی مناسب بصورت زیر هستیم 𝑥1تا

𝑌 = 𝑦(𝑥1 → 𝑥𝑘) یک متغیر xدر هر سطح yها بصورت یک خط راست بوده و مشاهده xو yبخش فرض می کنیم که رابطه میان در این

تصادفی می باشد.

𝐸(𝑦 𝑥) = 𝛽1𝑥 + 𝛽0 .باشد شرایط تعریف شده را داشته xچه خواهد بود اگر y طبطور متوسیعنی:

𝑦 = 𝛽1𝑥 + 𝛽0 + 𝜀 𝛽1ر متوسط : شیب خط، تغییر دy وقتیx یک واحد تغییر کند.

𝛽0 عرض از مبدا، اگر :x=0 متوسطy چقدر است.

𝜀 خطای برآوردی، فرض می شود دارای توزیع نرمال با میانگین صفر و واریانس :𝜎2 است

(𝑦1, 𝑥1), (𝑦2, 𝑥2), … , (𝑦𝑛 , 𝑥𝑛)

زنیم که را طوری تخمین می 𝛽0و 𝛽1استفاده می شود. در این حالت 𝛽0و 𝛽1از این داده ها برای تخمین پارامترهای

مجموع مربعات انحراف میان مشاهدات و خط رگرسیون حداقل گردد.

x مجموع مربعات تصحیح شده 𝑆𝑥𝑥 = 𝑥𝑖2 −

( 𝑥𝑖)2

𝑛

y مجموع مربعات تصحیح شده 𝑆𝑦𝑦 = 𝑦𝑖2 −

( 𝑦𝑖)2

𝑛

x,y مجموع مربعات تصحیح شده 𝑆𝑥𝑦 = 𝑥𝑖𝑦𝑖 − 𝑥𝑖 𝑦𝑖

𝑛

𝛽1 =𝑆𝑥𝑦

𝑆𝑥𝑥

𝛽0 = 𝑦 − 𝛽1 𝑥

Page 33: یرایرهش رتکد یاقآ یرامآ لیلحت هوزج Æحªص ·Ãا Æسºجfreecontent.atiyehsanat.com/Download/Stat-Shahriyari... · 2016. 10. 5. · یرامآ لیلحت

آقای دکتر شهریاری 22 صفحهجلسه یازدهم تحلیل آماریجزوه

نمونه 10باشد. با استفاده از ای اثر درجه حرارت عملیاتی بر روی میزان سختی فولاد مورد بررسی میمثال: در مطالعه

زوجی ذیل معادله خطی زیر را برآورد نمایید.

X 100 110 120 130 140 150 160 170 180 190

Y 45 51 54 61 66 70 74 78 85 89

𝑆𝑥𝑥 = (100)2 + (110)2 +⋯+ (190)2 −

(1450)2

10= 8250

𝑆𝑥𝑦 = (100 × 45) + ⋯+ (190 × 89) −(1450 × 673)

10= 3985

𝛽1 =3985

8250= به ازای یک درجه تغییر حرارت سختی به این میزان افزایش می یابد 0.483

𝑦 = 67.3 𝑥 = 145 𝛽0 = 67.3 − 0.48 × 145 = −2.74

𝑦 = 0.483𝑥 − 2.74

Page 34: یرایرهش رتکد یاقآ یرامآ لیلحت هوزج Æحªص ·Ãا Æسºجfreecontent.atiyehsanat.com/Download/Stat-Shahriyari... · 2016. 10. 5. · یرامآ لیلحت

آقای دکتر شهریاری 23 صفحهجلسه یازدهم تحلیل آماریجزوه

تخمین فاصله ای در رگرسیون خطی:

𝛽1 − 𝑡𝛼2,(𝑛−2)

𝑀𝑆𝐸

𝑆𝑥𝑥≤ 𝛽1 ≤ 𝛽1 + 𝑡𝛼

2,(𝑛−2)

𝑀𝑆𝐸

𝑆𝑥𝑥

𝑦 = 𝛽1𝑥 + 𝛽0 + 𝜀

𝑀𝑆𝐸 میانگین مربع خطا ها =𝑆𝑆𝐸

𝑛−2

𝑆𝑆𝐸 مجموع مربع خطا ها = 𝑆𝑦𝑦 − 𝛽1 𝑆𝑥𝑦

در مثال پیشین داریم: %95مثال: با فاصله اطمینان

𝑡0.025 ,8 = 2.31 𝑆𝑆𝐸 = 1932.1 − 0.483 × 3985 = 7.34

𝑀𝑆𝐸 =7.34

8= 0.9

0.483 − 2.31 0.9

8250≤ 𝛽1 ≤ 0.483 − 2.31

0.9

8250

0.46 ≤ 𝛽1 ≤ 0.51

نکته: تحلیلهای رگرسیون هر چند در حجم وسیعی کاربرد پیدا کرده اند، لیکن نیاز به دقت کافی بجای استفاده از مدل

دارند. در این حالت باید در انتخاب متغیرهای مدل دقت نمود. این امکان وجود دارد که میان متغیرها رابطه آماری وجود

ارتباط باشند.داشته باشد در حالیکه در دنیای واقعی کاملا بی

یرها نیست.رابطه قوی میان متغیرها لزوما به معنی وجود رابطه علّی میان متغ

اند، به عبارت واقع شده های اصلیتقل معتبر است که در محدوده دادهرسیون تنها برای مقادیری از متغیر مسرابطه رگ

اطمینان داریم. ضهای موجود دور شویم، کمتر به اعتبار مدل مفروبر حسب داده xدیگر هرچه از محدوده مقادیر

Page 35: یرایرهش رتکد یاقآ یرامآ لیلحت هوزج Æحªص ·Ãا Æسºجfreecontent.atiyehsanat.com/Download/Stat-Shahriyari... · 2016. 10. 5. · یرامآ لیلحت

آقای دکتر شهریاری 23 صفحهجلسه یازدهم تحلیل آماریجزوه

آزمون فرض در رگرسیون خطی:

لات رگرسیون بصورت زیر استهای آماری در خصوص معاحالت خاص و بسیار با اهمیت فرضیه

𝐻0: 𝛽1 = 0 𝐻1: 𝛽1 ≠ 0

تاثیر کمی xوجود ندارد. به عبارت دیگر yو xمعادل آن است که بگوییم هیچ رابطه خطی میان 𝐻0 رد نکردن فرضیه

دارد. yدر توزیع تغییرات

,𝐹0(1 توزیع فیشر 𝑛−2) =𝑆𝑆𝑅1𝑆𝑆𝐸𝑛−2

𝑆𝑆𝑅 مجموع مربعات رگرسیون = 𝛽1 𝑆𝑥𝑦

𝑆𝑆𝐸 مجموع مربعات خطا = 𝑆𝑦𝑦− 𝑆𝑆𝑅

اگر𝐹0 > 𝐹𝛼(1, 𝑛−2)

رد می گردد. 𝐻0در نتیجه

مثال: اگر در مثال پیشین داریم:

𝑆𝑆𝑅 = 1924.87

𝑆𝑆𝐸 = 7.23

𝐹0 = 2131.57

𝐹0.01(1, 8) = 11.26

𝐹0 > 𝐹𝛼(1, 𝑛−2) 2131.57 > 11.26

رد می گردد 𝐻0فرض

Page 36: یرایرهش رتکد یاقآ یرامآ لیلحت هوزج Æحªص ·Ãا Æسºجfreecontent.atiyehsanat.com/Download/Stat-Shahriyari... · 2016. 10. 5. · یرامآ لیلحت

آقای دکتر شهریاری 63 صفحهجلسه دوازدهم تحلیل آماریجزوه

(Corralationهمبستگی )

تحلیل باقیمانده:

شود که در آنباقیمانده در معادله رگرسیون به این صورت تعریف می

𝑦𝑖 مقدار داخلی مشاهده شده

𝑦 𝑖 باشد.مقدار تقریب زده شده می

𝑒𝑖 = 𝑦𝑖 − 𝑦 𝑖 , ℕ(0تحلیل باقیمانده فرض نرمال بوده باقی مانده را با 𝜎2) ده و اطلاعاتی در خصوص بهبود مدل برازش شده ری کبررس

دهد.در اختیار قرار می

ها آزمون شده و نرمال بودن آن بررسی شود.برای این کار لازم است تا توزیع باقیمانده

توان برای این تقریب استفاده نمود.نیز می Fittingاز

باشد.می 𝑥و یا 𝑦 𝑖( نسبت به 𝑒𝑖یک روش مفید در تحلیل باقی مانده رسم مقادی خطاها )

I. باشدلا تصادفی بوده و حالت مطلوبی میخطاها حول خط رگرسیون بصورت کام

II. با افزایش مقدار𝑥𝑖 یا𝑦𝑖 یابد )به صورت قیفی شکل( و نامطوب است.دات افزایش میپراکندگی مشاه

Page 37: یرایرهش رتکد یاقآ یرامآ لیلحت هوزج Æحªص ·Ãا Æسºجfreecontent.atiyehsanat.com/Download/Stat-Shahriyari... · 2016. 10. 5. · یرامآ لیلحت

آقای دکتر شهریاری 63 صفحهجلسه دوازدهم تحلیل آماریجزوه

III. خطاهای حول خط رگرسیون بصورت منحنی بوده و عدم تناسب مدل و نیاز به اضافه شدن متغیرهای بیشتر

ضریب تعیین

عیین گوییم که برای قضاوت در خصوص مناسب بودن مدل رگرسیون از منظر تشریح با رابطه زیر را ضریب ت 𝑅2کمیت

گیرد.فاده قرار میها توسط مدل مورد استپراکندگی داده

𝑅2 =𝑆𝑆𝑅

𝑆𝑦𝑦

مثال: در مثال پیشین داریم:

𝑅2 =1924.87

1932.1= 0.9963

ها توسط مدل تشریح شده است.پراکندگی داده %99.63به عبارتی

Page 38: یرایرهش رتکد یاقآ یرامآ لیلحت هوزج Æحªص ·Ãا Æسºجfreecontent.atiyehsanat.com/Download/Stat-Shahriyari... · 2016. 10. 5. · یرامآ لیلحت

آقای دکتر شهریاری 63 صفحهجلسه دوازدهم تحلیل آماریجزوه

ضریب همبستگی

یک متغیر 𝑦و گرددیک متغیر ریاضی بوده که از سوی تحلیلگر تعیین می 𝑥تاکنون در رگرسیون فرض بر آن است که

شاهدات شود که مباشد. حالتی را در نظر بگیرید که هر دو متغیر مذکور تصادفی باشند. در این حالت فرض میتصادفی می(𝑦𝑖 , 𝑥𝑖) متغیرهای تصادفی با توزیع توام𝑓(𝑥, 𝑦) باشند. در بحث همبستگی، توزیع توام این متغیر بصورت نرمال می

𝜎1و𝜇1در این حال .باشدمیمفروض 𝜎2و𝜇2و همچنین 𝑦واریانس و میانگین 2

هستند. 𝑥واریانس و میانگین 2

ضریب همبستگی جامعه:

ρ =𝜎12

𝜎1𝜎2

مونه:ضریب همبستگی ن

𝑟 =𝑆𝑥𝑥

𝑆𝑥𝑥𝑆𝑦𝑦

−1 ≤ 𝑟 ≤ 1 یا منفی یک باشد همبستگی بسیار بالا است.زمانی که ضریب همبستگی یک و

,𝑥میزان ارتباط خطی دو متغیر 𝑟ضریب همبستگی 𝑦 گیرد.را اندازه می

آزمون فرض ضریب همبستگی:

𝐻0: 𝜌 = 0 𝐻1: 𝜌 ≠ 0

𝑡0 =𝑟 𝑛 − 2

1 − 𝑟2

اگر 𝑡0 > 𝑡𝛼

2 𝑛−2 رد می گردد. 𝐻0فرض

Page 39: یرایرهش رتکد یاقآ یرامآ لیلحت هوزج Æحªص ·Ãا Æسºجfreecontent.atiyehsanat.com/Download/Stat-Shahriyari... · 2016. 10. 5. · یرامآ لیلحت

آقای دکتر شهریاری 63 صفحهجلسه دوازدهم تحلیل آماریجزوه

,𝑥مثال: اگر دو متغیر تصادفی 𝑦 مرتبط به نظر برسند با فرض نرمال بودن توزیع توام آنها و اطلاعات داده شده همبستگی

آنرا تحلیل نمایید؟

𝑆𝑥𝑥 = 698.6 𝑆𝑦𝑦 = 6105.9

𝑆𝑥𝑦 = 2027.7

𝑛 = 25 𝛼 = 0.05

جواب:

𝑟 =𝑆𝑥𝑥

𝑆𝑥𝑥𝑆𝑦𝑦

=698.6

698.6 × 6105.9= 0.982

ها بر قرار است.توجهی بین دادهیک رابطه خطی مستقیم قابل

𝐻0: 𝜌 = 0 𝐻1: 𝜌 ≠ 0

𝑡0 =𝑟 𝑛 − 2

1 − 𝑟2=

0.982 25 − 2

1 − 0.9822= 24.8

𝑡0.025 23 = 2.07 𝑡0 = 24.8 > 2.07 = 𝑡0.025 23

رد می گردد. 𝐻0فرض

,𝑥میان دو متغیر وجود ارتباط خطی 𝐻0با رد فرض 𝑦 گردد.تایید می

Page 40: یرایرهش رتکد یاقآ یرامآ لیلحت هوزج Æحªص ·Ãا Æسºجfreecontent.atiyehsanat.com/Download/Stat-Shahriyari... · 2016. 10. 5. · یرامآ لیلحت

آقای دکتر شهریاری 04 صفحهجلسه دوازدهم تحلیل آماریجزوه

نمونه سوالات امتحانی:

واحد مشاهده شده 900و انحراف معیار 25.000ز کارکنان یک سازمان، میانگین حقوق تایی ا100در یک نمونه -1

برای میانگین واقعی حقوق ایشان %95است. اگر توزیع دستمزد این کارکنان نرمال باشد، یک فاصله اطمینان

بیابید؟

برای نسبت %90واحد آن ضایعات محسوب شده است. یک فاصله اطمینان 200واحدی 2000در یک نمونه -2

واقعی ضایعات بیابید؟

سه میانگین زمان بازدید مشتریان از دو غرفه خود را دارد، برای این منظور از غرفه مدیر یک فروشگاه قصد مقای -3

باشد. در غرفه دوم نیز از می 1.5و 4تایی گرفته که میانگین و انحراف معیار آن به ترتیب 60اول یک نمونه

ده شده است. ادعای بیشتر بودن متوسط زمان بازدید غرفه همشا 1.7و انحراف معیار 5.5تایی میانگین 45نمونه

دوم از غرفه اول را آزمون نمایید؟

داده های زیر را در نظر بگیرید -4

90 120 200 80 110 70 حقوق

4 6 7 5 2 3 ساعات کار مفید

معادله رگرسیون را برآورد نموده و فرض آماری نبود ارتباط خطی میان دو متغیر را بررسی نمایید؟

Page 41: یرایرهش رتکد یاقآ یرامآ لیلحت هوزج Æحªص ·Ãا Æسºجfreecontent.atiyehsanat.com/Download/Stat-Shahriyari... · 2016. 10. 5. · یرامآ لیلحت

آقای دکتر شهریاری 14 صفحه تحلیل آماریجزوه

نمونه سوالات امتحانی:

واحد مشاهده شده 900و انحراف معیار 25.000تایی از کارکنان یک سازمان، میانگین حقوق 100ونه در یک نم -1

برای میانگین واقعی حقوق ایشان %95است. اگر توزیع دستمزد این کارکنان نرمال باشد، یک فاصله اطمینان

بیابید؟

جواب:

اری ذتوان واریانس نمونه را با واریانس جامعه جایگاگر اندازه نمونه یا حجم نمونه به اندازه کافی بزرگ باشد میدانیم می

𝑛کرد. )در حالتی که ≥ باشد.( پس داریم: 30

𝑛 = 100 �̅� = 25′000 𝜎 = 𝑆 = 900

1 − 𝛼 = 95% 𝛼2⁄ = 0.025

از جدول استاندارد )و یا صورت مساله( داریم:

𝑍0.025 = 1.96

�̅� − 𝑍𝛼2⁄ 𝜎

√𝑛≤ 𝜇 ≤ �̅� + 𝑍𝛼

2⁄ 𝜎

√𝑛

25000 − 1.96 900

√100≤ 𝜇 ≤ 25000 + 1.96

900

√100

24823.6 ≤ 𝜇 ≤ 25176.4

Page 42: یرایرهش رتکد یاقآ یرامآ لیلحت هوزج Æحªص ·Ãا Æسºجfreecontent.atiyehsanat.com/Download/Stat-Shahriyari... · 2016. 10. 5. · یرامآ لیلحت

آقای دکتر شهریاری 14 صفحه تحلیل آماریجزوه

برای نسبت %90واحد آن ضایعات محسوب شده است. یک فاصله اطمینان 200واحدی 2000در یک نمونه -2

واقعی ضایعات بیابید؟

جواب:

𝑛 = 2000 𝑥 = 200

1 − 𝛼 = 90% 𝛼2⁄ = 0.05

از جدول استاندارد )و یا صورت مساله( داریم:

𝑍0.05 = 1.64

𝑃 =𝑥

𝑛=200

2000= 0.1

𝑃 − 𝑍𝛼2⁄√𝑃 (1 − 𝑃 )

𝑛≤ 𝑃 ≤ 𝑃 + 𝑍𝛼

2⁄√𝑃 (1 − 𝑃 )

𝑛

0.1 − 1.64√0. (1 1 − 0. )1

200≤ 𝑃 ≤ 0.1 + 1.64√

0.1(1 − 0.1)

200

0.096 ≤ 𝑃 ≤ 0.103 وشگاه قصد مقایسه میانگین زمان بازدید مشتریان از دو غرفه خود را دارد، برای این منظور از غرفه مدیر یک فر -3

باشد. در غرفه دوم نیز از می 1.5و 4تایی گرفته که میانگین و انحراف معیار آن به ترتیب 60اول یک نمونه

ده شده است. ادعای بیشتر بودن متوسط زمان بازدید غرفه همشا 1.7و انحراف معیار 5.5تایی میانگین 45نمونه

(0.05تشخیص )سطح دوم از غرفه اول را آزمون نمایید؟

جواب:

𝐻0: 𝜇2 ≤ 𝜇1 𝐻1: 𝜇2 > 𝜇1 𝛼 = 0.05

𝑛1 = 60 𝑛2 = 45

𝜎12 = (1.5)2 = 2.25 𝜎2

2 = (1.7)2 = 2.89

�̅�1 = 4 �̅�2 = 5.5

Page 43: یرایرهش رتکد یاقآ یرامآ لیلحت هوزج Æحªص ·Ãا Æسºجfreecontent.atiyehsanat.com/Download/Stat-Shahriyari... · 2016. 10. 5. · یرامآ لیلحت

آقای دکتر شهریاری 14 صفحه تحلیل آماریجزوه

𝑍0(

=�̅�2 − �̅�1) − (𝜇2 − 𝜇1)

𝜎22

𝑛2− 𝜎1

2

𝑛1

گیریم.تفاضل میانگینهای جامعه را صفر در نظر می

𝑍0 =5.5 − 4 − 0

2.8945− 2.25

60

=1.5

0.163= 9.176

از جدول استاندارد )و یا صورت مساله( داریم:

𝑍0.05 = 1.645

𝑍0 > 𝑍𝛼 ⇒ شود.رد می 𝐻0فرض

ادعای بیشتر بودن متوسط زمان بازدید غرفه دوم درست است.

داده های زیر را در نظر بگیرید -4

70 110 80 200 120 90 (y) حقوق

3 2 5 7 6 4 (x)ساعات کار مفید

(0.05تشخیص )سطح را بررسی نمایید؟معادله رگرسیون را برآورد نموده و فرض آماری نبود ارتباط خطی میان دو متغیر

جواب:

𝑆𝑥𝑥 = (3)2 + (2)2 + (5)2 + (7)2 + (6)2 + (4)2 −

(27)2

6= 17.5

𝑆𝑥𝑦 = (70 × 3) + (110 × 2) + ⋯+ (90 × 4) −(670 × 27)

6= 295

𝐻0ناحیه عدم رد

𝑍0 = 9.176 1.645

Page 44: یرایرهش رتکد یاقآ یرامآ لیلحت هوزج Æحªص ·Ãا Æسºجfreecontent.atiyehsanat.com/Download/Stat-Shahriyari... · 2016. 10. 5. · یرامآ لیلحت

آقای دکتر شهریاری 11 صفحه تحلیل آماریجزوه

𝛽1 =𝑆𝑥𝑦

𝑆𝑥𝑥=295

17.5= 16.857

�̅� = 𝑦𝑖𝑛=670

6= 111.67

�̅� = 𝑥𝑖𝑛=27

6= 4.5

𝛽0 = �̅� − 𝛽1 �̅�

𝛽0 = 111.67 − 16.57 × 4.5 = 35.81

معادله خط:

𝑦 = 16.857 𝑥 + 35.81

آزمون فرض نبود ارتباط خطی

𝐻0: 𝛽1 = 0 𝐻1: 𝛽1 ≠ 0

𝑆𝑆𝑅 = 𝛽1 𝑆𝑥𝑦 = 16.857 × 295 = 4972.815

𝑆𝑦𝑦 = (70)2 + (110)2 +⋯+ (90)2 −

(670)2

6= 11′083.3

𝑆𝑆𝐸 = 𝑆𝑦𝑦 − 𝑆𝑆𝑅 = 11083.3 − 4972.815 = 6110.485

𝐹0(1, 6−2) =𝑆𝑆𝑅1𝑆𝑆𝐸𝑛−2

=4972.8151

6110.4856−2

= 0.203

از جدول استاندارد )و یا صورت مساله( داریم:

𝐹0.05(1, 4) = 7.71

𝐹0 < 𝐹0.05(1, 4)

تاثیر کمی در توزیع xوجود ندارد. به عبارت دیگر yو xنداریم در نتیجه هیچ رابطه خطی میان 𝐻0 دلیلی برای رد

دارد. yتغییرات