Подобряване на качеството на модела
DESCRIPTION
Подобряване на качеството на модела. Качество на модела Включване и изключване на променливи Тестване на ограничения за коефициентите Стабилност на модела. Въпроси на качеството с практическо значение. Кои са характеристиките на добрия модел - PowerPoint PPT PresentationTRANSCRIPT
Подобряване на качеството на модела
• Качество на модела
• Включване и изключване на променливи
• Тестване на ограничения за коефициентите
• Стабилност на модела
Въпроси на качеството с практическо значение
• Кои са характеристиките на добрия модел
• Какви са възможните грешки, ако разработения модел се отличава от “идеалния” – грешки на спецификацията на модела
• Какви са последиците от тях• Как да се открият грешките от лоша
спецификация на модела
Добрият модел е: (по Харви)
• Достатъчно опростен, но запазващ характеристиките на процеса
• Еднозначно решен спрямо дадена извадка
• С възможно най-висок коефициент на детерминация
• Верифициран с икономическата теория• Направената прогноза и действителната
реализация са близки
Възможните грешки -спецификация на модела
• Некоректна спецификация– Има пропусната ключова праменлива– Има включена излишна променлива– Избрана е некоректна функционална
форма
Грешки на спецификацията
• Пропуснат съществен фактор – лоша спецификация– Няма специализирани тестове
– Индиректно – коефициента на детерминация
– Тестове за добавяне на променлива
Пропуснат фактор - последици
• Пропуснатия фактор се корелира с включени в модела фактори– Некоректна оценка на коефициентите –коректния
коефициент ще бъде по-голям от оценката при позитивна корелация и обратно
– Некоректен свободен член (дори и ако пропуснатия фактор не се корелира с фактор от модела)
• Некоректно оценена стандартна грешка на модела
• Намаляване силете на тестовете – некоректни заключения
2-Apr-2002 10:02:02 Ordinary Least Squares Estimation ****************************************************************************** Dependent variable is Q12105 50 observations used for estimation from 1995M1 to 2000M12 ****************************************************************************** Regressor Coefficient Standard Error T-Ratio[Prob] C .22785 .052291 2.5552[.000] T -.3225E-3 .2771E-3 -.57589[.502] P12105 -.2913E-3 .5808E-3 -.82592[.001] P12102 -.7579E-3 .2930E-3 -1.5577[.125] P12103 -.8552E-3 .2350E-3 -3.5287[.001] P12104 .0012251 .5052E-3 2.8525[.005]
****************************************************************************** R-Squared .62522 R-Bar-Squared .58089 S.E. of Regression .234218 F-Stat. F( 5, 53) 30.5201[.000] Mean of Dependent Variable .31225 S.D. of Dependent Variable .170551 Residual Sum of Squares .055735 Equation Log-likelihood 119.3572 Akaike Info. Criterion 112.3572 Schwarz Bayesian Criterion 105.0272 DW-statistic 1.5925 ******************************************************************************
2-Apr-2002 10:02:02 Ordinary Least Squares Estimation ****************************************************************************** Dependent variable is Q12105 50 observations used for estimation from 1995M1 to 2000M12 ****************************************************************************** Regressor Coefficient Standard Error T-Ratio[Prob] C .22785 .052291 2.5552[.000] T -.1275 .1012771 -.57589[.002] P12105 -.2913 .0075808 -.82592[.035] P12102 -.3254 .0562930 -1.5577[.075] P12103 -.1236 .0092350 -3.5287[.001] P12104 .0875 .0245052 2.8525[.002] INCOME .2150 .1002592 8.2892[.000]****************************************************************************** R-Squared .77522 R-Bar-Squared .75089 S.E. of Regression .035218 F-Stat. F( 5, 53) 30.5201[.000] Mean of Dependent Variable .31225 S.D. of Dependent Variable .010551 Residual Sum of Squares .055735 Equation Log-likelihood 119.3572 Akaike Info. Criterion 112.3572 Schwarz Bayesian Criterion 105.0272 DW-statistic 1.6225 ******************************************************************************
“Излишна” променлива• Включена е “излишна” променлива• “Излишна” – няма теоретични основания
за включването й• Може да се установи само индиректно –
логически• На практика се случва когато:
– Теоретично неизяснени проблеми– Няма практически разработки– Теорията не е достатъчно формализирана
“Излишна” променлива - последици
• Не променя или увеличава R2
• Оценките са коректни, но
• с голяма стандартна грешка
• некоректни заключения за статистическата значимост
• Води до изключване от модела на статистически значима променлива
“Излишна” променлива - последици
• Тестовете за модела като цяло – коректни
• Необходима по-голяма извадка за “добри” оценки
Извод
По-добре да се включи излишна обясняваща променлива, отколкото да
се изпусне съществен фактор
Некоректна функционална форма
• Икономическата теория не се интерисува от функционална форма на модела
• От практическа гледна точка – това е от съществено значение
• Индикация за некоректна форма – диагностичния тест
• Правила за правилно определяне на функционална форма – няма
• Памага – натрупания опит
Препоръчителни функционални форми
• Определяне на теоретични еластичности – двойно логаритмична функция
• Обуславя се от същността на логаритмичната функция – процентно изменение
Препоръчителни функционални ....
• Анализ на темпа – полу-логаритмична функция от номиналното изменение на факторите
• Позволява да се определи % изменение на зависимата променлива при определено номинално изменение на факторите
Препоръчителни функционални ....
• Анализ на абсолютното нарастване – полу-логаритмична функция от релативнато изменение на факторите
• Позволява да се определи номиналното изменение на зависимата променлива при определено релативно изменение на факторите
Препоръчителни функционални ....
• Анализ и определяне на абсолютното нарастване в зависимост от времето (във финансовите анализи) – модели на линейния тренд
• Позволява да се определи абсолютното изменение на зависимата променлива спрямо началото на периода
tt btaY
Препоръчителни функционални ....
• Анализ и определяне на постоянните разходи за 1-ца продукция – реципрочна функция
• От теорията – постоянните разходи намаляват асимптотично да определено равнище
Препоръчителни функционални ....
• Анализ и определяне на относителния дял на разходите за потребление на даден продукт – реципрочна функция (крива на Енджел)
• Практически установено
Препоръчителни функционални ....
• Анализ и определяне на средния доход от безработицата – реципрочна функция (крива на Филипс)
• Практически установено- има допълнителни ограничения а0 <0 и а1 >0
Препоръчителни функционални ....
• Анализ и определяне на маржиналните и средни разходи за производство – полином от 3-та степен
• Практически установено- има допълнителни ограничения:– а0, а1 и a3>0 ; – а2 <0 и – a2
2<3a1 a3
• 8a3
Показатели за оценка
• Основен показател - R2
• Изискване за директно сравняване – зависимата променлива да е една и съща– Един и същи показател– В една и съща функционална зависимост
• Причина – не могат да се сравняват величини с различни измерения
При необходимост от промени в модела
• Могат да се използват резултати получени за други периоди
• Пример
Q = a0 + a1P + a2Income – проблем при оценката
от друг анализ - еластичността на дохода - 0.7
Трансформация
Q* = Q – 0,7*Income
Q* = a0 + a1P
Друг тип трансформации
• При агрегирани данни– Преизчисляването им на база на човек от
населението – анализ на вноса от изменението на ценовото равнище и БВП
– Разделяне на двете страни на единият от факторите
Q = a0 + a1P + a2Income /Income
(Q/Income) = b0 + b1(P/Income)
Друг тип трансформации
• Използване на първите разлики вместо самите показатели
Q = a0 + a1P + a2Income
ΔQ = a0 + a1 Δ P + a2 Δ Income
• Използване на някаква функция от показателите (логаритмична)
Добавяне на променлива
• Използва се за проверка дали включването на даден показател ще подобри модела
• Докога продължава процеса –преизчисления R2 се увеличава:– ItI – по-голяма от 1
• От следрегресионното меню• H0: ak = am = al = =0• Приемането на H0 - добавените променливи
не подобряват модела • Отхвърлянето на H0 - факторите трябва да
бъдат включени в модела
10-May-2003 0:54:33 Variable Addition Test (OLS case) ****************************************************************************** Dependent variable is Q12102 List of the variables added to the regression: P12101 60 observations used for estimation from 1996M1 to 2000M12 ****************************************************************************** Regressor Coefficient Standard Error T-Ratio[Prob] C -.064037 .066828 -.95823[.342] T .6945E-3 .5623E-3 1.2350[.222] P12102 -.0011191 .4795E-3 -2.3340[.023] P12106 .0015867 .9152E-3 1.7337[.089] P12104 -.6497E-5 .2326E-3 -.027930[.978] P12105 -.1219E-3 .5165E-3 -.23590[.814] INCOME .6038E-5 .2523E-5 2.3927[.020] P12101 -.5055E-4 .4424E-3 -.11427[.909]****************************************************************************** Joint test of zero restrictions on the coefficients of additional variables: Lagrange Multiplier Statistic CHSQ( 1)= .015063[.902] Likelihood Ratio Statistic CHSQ( 1)= .015065[.902] F Statistic F( 1, 52)= .013058[.909] ******************************************************************************
Изключване на променлива
• Използва се за проверка дали изключването на даден показател ще подобри модела
• От следрегресионното меню• H0: ak = am = al = =0• Приемането на H0 - изключването на
променливите не влошава модела• Отхвърлянето на H0 - факторите не
могат да бъдат изключени от модела
10-May-2003 0:53:26 Variable Deletion Test (OLS case) ****************************************************************************** Dependent variable is Q12102 List of the variables deleted from the regression: C T P12105 60 observations used for estimation from 1996M1 to 2000M12 ****************************************************************************** Regressor Coefficient Standard Error T-Ratio[Prob] P12102 -.9239E-3 .3828E-3 -2.4134[.019] P12106 .8964E-3 .3135E-3 2.8589[.006] P12104 -.8165E-4 .1930E-3 -.42307[.674] INCOME .6801E-5 .1478E-5 4.6017[.000]****************************************************************************** Joint test of zero restrictions on the coefficients of deleted variables: Lagrange Multiplier Statistic CHSQ( 3)= 2.4861[.478] Likelihood Ratio Statistic CHSQ( 3)= 2.5391[.468] F Statistic F( 3, 53)= .76366[.519] ******************************************************************************
Икономическа адекватност на модела
• Проверка на знаците на регресионните коефициенти
• Проверка на други детерминирани връзки между коефициентите– За еластичностите на заместване – сумата
от еластичностите = 0– За проверка на ефекта от инвестиции –
сбора от коефициентите пред разходите за труд и капитал = 1
Сравняване на модели
• Позволяват да се провери степента на годност на даден модел, спрямо степента на годност на друг модел
• Моделите – една и съща зависима променлива
• Тестове за непокриващи се хипотези• Две хипотези се наричат непокриващи се,
ако независимите променливи включени в първата хипотеза не се явяват независими променливи по отношение на втората хипотеза.
Непокриващи се хипотези
ubXaYH :0
vZbaYH 111 :
Тестове за непокриващи се хипотези
• Обхващащ или заграждащ тест. – Той работи с 2 модела, като позволява
част от независимите променливи на първия модел да се включват и като независими променливи и във втория модел
– Анализира комбинирания модел
dWcZbXaY **
Обхващащ тест
• Параметрите на този обобщен модел се тестват за следните ограничения:
• с=0• b=0
• Ако ограничението с=0 се приема, това практически означава отхвърляне на хипотезата Н1, спрямо хипотезата Н0
• Ако ограничението с=0 се отхвърли - отхвърляне на хипотезата Н0 в полза на хипотеза Н1
Обхващащ тест ...
• Ако ограничението b=0 се приеме - приемане на хипотезата Н1, спрямо хипотезата Н0
• Ако ограничението b=0 се отхвърли - приемане на хипотезата Н0 спрямо хипотеза Н1
Обхващащ тест ...
• Недостатъци• 2 проблема
– в комбинирания модел остават общите за двата първоначални модела променливи и тестването на ограниченията b=0 или c=0 не дава никаква информация за тези общи независими променливи
– че броят на независимите променливи във хибридния модел може да се окаже твърде голям и да възникне проблем с колинеарността между независимите променливи
Обхващащ тест ...
• Решение на проблемите
• Z* е вектор, включващ тези променливи на Z, които не принадлежат на Х
• В този случай приемането на ограничението с=0, позволява да се направи заключение в полза на хипотезата Н0 срещу хипотезата Н1
*cZbXaY
J тест
• Използва следната комбинация от двата начални модела
• Тества се ограничението = 0 - тест срещу хипотезата Н1
• Проблем - не може да бъде оценен директно – разработен 3-етапен метод
ZbbXY 11
Група тестове
• Извеждат се едновременно
• J тест, N тест, NT тест, W тест, JA тест, AIC тест и SBC тест
• Възможни са 4 случая– И двете хипотези да се отхвърлят, – Да се отхвърли първата хипотеза,– Да се отхвърли втората хипотеза,– Да се приемат и двете хипотези.
Alternative Tests for Non-Nested Regression Models
******************************************************************************
Dependent variable is LNQ101 48 observations used from 1997M1 to 2000M
Regressors for model M1:
C T LNP101 LNP106 LNP107
LNINCOME S12
Regressors for model M2:
C T P12101 P12106 P12107
INCOME S12
******************************************************************************
Test Statistic M1 against M2 M2 against M1
N-Test 1.1641[.244] -2.7316[.006]
NT-Test 1.0797[.280] -2.3175[.020]
W-Test 1.1142[.265] -2.1861[.029]
J-Test -1.1081[.268] 2.3808[.017]
JA-Test -1.1968[.231] 2.2684[.023]
Encompassing F( 4, 37) 1.6376[.185] F( 4, 37) 2.7205[.044]
******************************************************************************
Model M1: DW 1.5023 ;R-Bar-Squared .88452 ;Log-likelihood 25.4154
Model M2: DW 1.4355 ;R-Bar-Squared .87303 ;Log-likelihood 23.1396
Model M1+M2: DW 1.6063 ;R-Bar-Squared .89128 ;Log-likelihood 29.3273
Akaike's Information Criterion of M1 versus M2= 2.2758 favours M1
Schwarz's Bayesian Criterion of M1 versus M2= 2.2758 favours M1
******************************************************************************
Икономическа адекватност на модела ...
–При определяне на маржиналните и средните разходи за производство:
а0, а1 и a3>0 ;
а2 <0 и
a22<3a1 a3
• Проверката на различните ограничения от тип равенство чрез Валд теста
Валд тест
• Тест за налагане на ограничения на параметрите на модела– При наличие на специфични изисквания
наложени от теорията– При проверка на причините за динамиката:
произтича от детерминираната част на модела или е стохастична (при авторегресионните модели с разпределен лаг)
Валд тест
• Ограниченията: линейни и нелинейни
• Н0: всички поставени ограничения са едновременно изпълнени
Валд тест• Wald test of restriction(s) imposed on parameters • ******************************************************************************• Based on OLS regression of LNQ101 on: • C T LNP101 LNP106 LNP107 • LNINCOME S12 • 48 observations used for estimation from 1997M1 to 2000M12 • ******************************************************************************• Coefficients A1 to A7 are assigned to the above regressors respectively. • List of restriction(s) for the Wald test: • a3+a4+a5=1 • ******************************************************************************• Wald Statistic CHSQ( 3)= 46.8390[.000] • ******************************************************************************
Интерпретация на резултата
• Валд теста нормализира поставеното ограничение и го проверява при– Н0: нормализирано ограничение = 0– за конкретния случай:
a(3) + a(4) +a(5) -1 = 0• Като резултат извежда 2 вида статистики: F
статистика и Chi-square със вероятността за приемане на Н0
• F статистика – валидна само при линейни ограничения
• Резултатите от Валд теста зависят от начина на задаване на ограниченията (при нелинейни ограничения)
Икономическа адекватност на модела ...
• Когато трябва да се провери ограничение от типа “по-голямо”/”по-малко” – няма автоматизиран тест – t-теста
• Сравнява се получената стойност за t и критичната стойност (равнище на статистическа значимост и степените на свобода)
• За целта изходния модел се преобразува така, че ограничението да бъде сравнение с 0 и да се явява параметър в преобразувания модел
Икономическа адекватност на модела ...
• От преобразувания модел могат да бъдат тествани и хипотезите:
• В първия случай, Н0 се приема - получената стойност на t е по-малка от критичната стойност на t при едностранния t тест, отчетен със знак минус.
• Във втория случай, Н0 се приема - получената стойност на t е по-голяма от критичната стойност на t при едностранния t тест.
0:0 iaH 0:0 iaH
Стабилност и устойчивост на модела
• Показват доколко разработеният модел може да направи коректна прогноза
• Тестове – Браун, Дърбин и Ивънс- базирани на рекурсивните остатъци
• Графични тестове
Стабилност и устойчивост на модела ...
• Рекурсивни остатъци:– Определяне на регресионните коефициенти при
използване на n+1 набюдения– Определяне на грешката при n+2-то наблюдение –
първи остатък– Определяне на регресионните коефициенти при
използване на n+2 набюдения– Определяне на грешката при n+3-то наблюдение –
втори остатък– .... До изчерпране на всички наблюдения
Стабилност и устойчивост на модела ...
• 2 теста– QUSUM – анализира директно получените
рекурсивни остатъци– QSUMSQ – анализира квадратите на
рекурсивните остатъци
• QUSUM– Н0: редът на рекурсивните остатъци има средно
равно на 0 и вариация ≈ на броя на остатъците– На графиката – нормализираните рекурсивни
остатйци
Тестове за стабилност
Тестове за стабилност
Възможност за определяне на структурни прекъсвания
• Ако графиката на рекурсивните остатъци пресича граничните линии в определен период и се връща отново - структурно прекъсване в този период