Тема 3 Верифікація моделі

36
1 Тема 3 Верифікація моделі Кафера інформатики та комп‘ютерних технологій доцент Бесклінська О.П.

Upload: finnea

Post on 04-Jan-2016

97 views

Category:

Documents


1 download

DESCRIPTION

Тема 3 Верифікація моделі. К афер а інформатики та комп‘ютерних технологій доцент Бесклінська О.П. Зміст. Показники якості моделі 2. Перевірка значущості та довірчі інтервали. Етапи побудови моделі. Постановка задачі. Формування вихідної інформації. Аналіз залишків. Прогноз - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Тема 3 Верифікація моделі

1

Тема 3Верифікація моделі

Кафера інформатики та комп‘ютерних технологій доцент Бесклінська О.П.

Page 2: Тема 3 Верифікація моделі

2

Зміст

1.Показники якості моделі

2. Перевірка значущості та довірчі інтервали

Page 3: Тема 3 Верифікація моделі

3

Постановка задачі

Постановка задачі

Формуваннявихідної

інформації

Формуваннявихідної

інформації

Аналіззалишків

Аналіззалишків

Прогнозна основі

моделі

Прогнозна основі

моделі

Специфікаціямоделі

Специфікаціямоделі

Оцінкапараметрів

моделі

Оцінкапараметрів

моделі

Верифікаціямоделі

Верифікаціямоделі

Етапи побудови моделі

Page 4: Тема 3 Верифікація моделі

4

1. Показники якості моделі

Верифікація моделі—статистична перевірка на адекватність моделі, тобто наскільки добре розв‘язано проблему специфікації моделі, наскільки добрі оцінки імітаційних та прогнозних розрахунків.

Page 5: Тема 3 Верифікація моделі

5

Для перевірки коректності побудови моделі визначають:

• стандартну похибку рівняння;• коефіцієнт детермінації;• коефіцієнт множинної кореляції;• стандартну похибку параметрів.

Page 6: Тема 3 Верифікація моделі

6

Стандартна похибка рівняння (точкова оцінка емпіричної дисперсії залишків)- характеризує абсолютну величину розкиду випадкової складової рівняння

n

iiu u

nS

1

22 1

Page 7: Тема 3 Верифікація моделі

7

Поправка на число ступенів свободи дає незміщену оцінку дисперсії

залишків:

n

iiu u

mn 1

22

1

1

Page 8: Тема 3 Верифікація моделі

8

У поняття "тіснота зв'язку" (щільність) вкладається оцінка впливу незалежної змінної на залежну змінну.

Під терміном "значимість зв'язку" (істотність, або значущість) розуміють оцінку відхилення вибіркових змінних від своїх значень у генеральній сукупності спостережень за допомогою статистичних критеріїв.

Page 9: Тема 3 Верифікація моделі

9

Коефіцієнт детермінації показує, якою мірою варіація залежної змінної (результативного показника) у

визначається варіацією незалежної змінної (вхідного показника) х.

n

iiy yy

nS

1

22 1)(

де

2

22 1

y

u

S

SR

Page 10: Тема 3 Верифікація моделі

10

Інші формули:

де - розрахункові значення регресанда;

-загальна середня фактичних даних результативного показника;

-фактичні індивідуальні значення результативного показника.

y

y

iy

n

ii

n

i

yy

yyR

1

2

1

2

2

)(

)ˆ(

Page 11: Тема 3 Верифікація моделі

11

квадрат емпіричного коефіцієнта кореляції між двома рядами спостережень (теоретичними значеннями регресанта та його розрахунковими значеннями ).y

iy

n

i

n

iii

n

iii

yyyy

yyyy

R

1 1

22

2

12

)ˆ()(

)ˆ)((

Page 12: Тема 3 Верифікація моделі

12

Коефіцієнт кореляції, або індекс кореляції, показує, наскільки значним є

вплив змінної хi , на yi

і розраховується так:

2RR

Page 13: Тема 3 Верифікація моделі

13

Іноді для спрощення розрахунків тісноту кореляційного зв'язку характеризують

коефіцієнтом кореляції, який розраховується за формулою:

n

ii

n

ii

yy

yyR

1

2

1

2

1 1)(

)ˆ(

Page 14: Тема 3 Верифікація моделі

14

Якщо зв'язок між результативним і вхідним показниками лінійний, то використовується лінійний коефіцієнт кореляції, який характеризує не тільки тісноту зв'язку, а і його напрям:

2222 yyxx

yxxyrxy

Page 15: Тема 3 Верифікація моделі

15

2. Перевірка значущості та довірчі інтервали.

Page 16: Тема 3 Верифікація моделі

16

Зауваження. У задачах регресійного аналізу важливе значення має припущення про нормальний розподіл випадкових величин, що задіяні в даній моделі.

Певні перетворення нормально розподілених величин забезпечують їх розподіл за законом Стьюдента чи за законом Фішера: на підставі першого з них визначаються довірчі інтервали, а другий дає змогу оцінювати відношення двох випадкових величин.

Page 17: Тема 3 Верифікація моделі

17

Стосовно кожного статистичного результату висувається так звана нульова гіпотеза (про рівність нулю деякої випадкової величини) і альтернативна до неї гіпотеза (про її суттєву відмінність від нуля).

У нульовій гіпотезі формулюють результат, який бажано відхилити, а в альтернативній, яка інакше називається експериментальною, — той, що його необхідно підтвердити.

Page 18: Тема 3 Верифікація моделі

18

За заданим рівнем значущості множина допустимих значень розбивається на дві неперетинні множини: одна містить значення випадкової величини, ймовірність досягнення яких перевищує заданий рівень значущості, а інша — критична область — визначає ті значення, що досягаються рідко (ймовірність потрапити до такої області нижча від заданого рівня), і розташована вона, як правило, на "хвостах розподілу".

Page 19: Тема 3 Верифікація моделі

19

При перевірці гіпотез може бути допущена помилка, наприклад може бути відхилена нульова гіпотеза, хоча насправді вона правильна (помилка першого роду), або ж, навпаки, нульова гіпотеза може бути прийнята, хоча вона неправильна (помилка другого роду).

Page 20: Тема 3 Верифікація моделі

20

R2 R2 R2 R2

00 11?застосувати відповідний статистичний критерій,

який дасть змогу встановити, чи суттєво відрізняється R2 від нуля,

чи ця відмінність пов'язана з особливостями конкретних даних,

тобто зумовлена лише похибками вимірювань.

застосувати відповідний статистичний критерій, який дасть змогу встановити,

чи суттєво відрізняється R2 від нуля, чи ця відмінність пов'язана з особливостями

конкретних даних, тобто зумовлена лише похибками вимірювань.

Page 21: Тема 3 Верифікація моделі

21

Висувається нульова гіпотеза Н0 : R2 = О.

Це означає, що досліджуване рівняння не

пояснює змінювання регресанда під впливом відповідних регресорів.

У такому разі всі коефіцієнти при незалежних змінних мають дорівнювати нулю.

При цьому нульову гіпотезу можна подати у вигляді

Н0 :а1 =а2 =... = аn = 0.

Page 22: Тема 3 Верифікація моделі

22

Альтернативною до неї є Н1:

значення хоча б одного параметра моделі відмінне від нуля, тобто хоча б один із факторів впливає на змінювання залежної змінної.

Page 23: Тема 3 Верифікація моделі

23

Для перевірки цих гіпотез застосовують F- критерій Фішера з

n-m-1 ступенями свободи.

яке порівнюють з табличним значенням розподілу Фішера при заданому рівні значущості α. (Як правило, α = 0,05 або α = 0,01).

mmn

RR

F1

1 2

2

Page 24: Тема 3 Верифікація моделі

24

Якщо Fтабл < Fексп Якщо Fтабл < Fексп

нульова гіпотеза відхиляється, тобто існує такий коефіцієнт у регресійному рівнянні,

який суттєво відрізняється від нуля, а відповідний фактор впливає на досліджувану змінну.

нульова гіпотеза відхиляється, тобто існує такий коефіцієнт у регресійному рівнянні,

який суттєво відрізняється від нуля, а відповідний фактор впливає на досліджувану змінну.

Page 25: Тема 3 Верифікація моделі

25

У випадку парної регресії цей критерій розраховується за

формулою:

2

)ˆ(:

1

)ˆ(1

2

1

2

n

yyyyF

n

ii

n

i

Page 26: Тема 3 Верифікація моделі

26

Коефіцієнт кореляції, як вибіркова характеристика, перевіряється на

значущість за допомогою t-критерію Стьюдента.

Фактичне значення t статистики обчислюється за формулою

21

1

R

mnRtексп

Page 27: Тема 3 Верифікація моделі

27

tексп порівнюється з табличним значенням

t- розподілу з п – т – 1 ступенями свободи, та при заданому рівні значущості α/2

Якщо

таблексп tt

можна зробити висновок, що коефіцієнт кореляції достовірний (значущий), а зв'язок між залежною змінною та всіма незалежними факторами суттєвий.

Page 28: Тема 3 Верифікація моделі

28

Можна визначити стандартні похибки оцінок параметрів моделі з урахуванням дисперсії залишків:

jjua cSj

де - дисперсія залишків, обчислюється за формулою:

2u

mn

un

ii

u 1

2

2

Page 29: Тема 3 Верифікація моделі

29

cjj –відповідний діагональний елемент

матриці похибок С (матриця, обернена до матриці коефіцієнтів системи нормальних рівнянь)

1

1

2

1

11

n

ii

n

ii

n

ii

xx

xnAC

Page 30: Тема 3 Верифікація моделі

30

Статистичну значущість кожного параметра моделі можна перевірити за

допомогою t-критерію. При цьому нульова гіпотеза буде: Н0: aj=0, альтернативна H1: aj≠0

Експериментальне значення t-статистики для кожного параметра моделі обчислюється за формулою:

ja

jj S

at

Page 31: Тема 3 Верифікація моделі

31

Довірчі інтервали для кожного параметра aj

обчислюються на основі його стандартної похибки та критерію Стьюдента:

)1(2/ mnttтабл

Табличне значення t табл. , як і раніше, має n-

m-1 ступенів свободи і рівень значущості α/2

jjuтаблjjjuтаблj ctacta 22 ;

Page 32: Тема 3 Верифікація моделі

32

Завдання: Зробити аналіз залежності обсягу споживання y (у.о.) домогосподарства від наявного прибутку x (у.о.) за вибіркою обсягом n=12, результати якої наведено у таблиці. Визначити вид залежності, оцінити параметри рівняння регресії, оцінити силу лінійної залежності між x та y.

Page 33: Тема 3 Верифікація моделі

33

№ 1 2 3 4 5 6 7 8 9 10 11 12

Обсягспожива-

ння

( y у.о.)

107 109 110 113 120 122 123 128 136 140 145 150

Наявнийприбуток

( x у.о.)

102 105 108 110 115 117 119 125 132 130 141 144

Page 34: Тема 3 Верифікація моделі

34

Графік лінійної регресії

y = 3,4226+0,9361*x

105 110 115 120 125 130 135 140 145 150 155

x

100

105

110

115

120

125

130

135

140

145

150

y

y=3,423+0,936 х

Page 35: Тема 3 Верифікація моделі

35

Regression Summary for Dependent Variable: y (labor2.sta)R= ,99160670 R_= ,98328384 Adjusted R_= ,98161222F(1,10)=588,22 p<,00000 Std.Error of estimate: 1,8775

N=12BetaStd.Err.

of BetaB Std.Err.

of Bt(10)p-level

Interceptx

3,4226104,8644320,703600,4977380,9916070,0408850,9360800,03859624,253320,000000

коефіцієнт кореляції

R=0,9916067.

Коефіцієнт детермінації .

98328384,02 RЗначення критерію Фішера

Значення критерію Стьюдента

Page 36: Тема 3 Верифікація моделі

36

Завдання : За 10 парами спостережень отримано такі результати:

10

1

100i

ix

10

1

200i

iy

10

1

21000i

ii yx

10

1

2 12000i

ix

10

1

2 45000i

iy

За МНК оцініть коефіцієнти рівняння регресії Y на X . Оцініть коефіцієнт кореляції rxy