eksamensoppgÅve i svsos316 regresjonsanalyse · 2004-09-21 · norges teknisk-naturvitenskapelige...

38
Norges Teknisk-Naturvitenskapelege Universitet Institutt for sosiologi og statsvitenskap Eksamensoppgåver i SOS316 Regresjonsanalyse 6 desember 2000 1 NTNU, TRONDHEIM NYNORSK Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap EKSAMENSOPPGÅVE I SVSOS316 REGRESJONSANALYSE Eksamensdag: 6 desember 2000 Eksamensstad: Dragvoll, Pav. C, rom 101 Tid til eksamen: 6 timar Vekter: 5 Talet av sider med tekst: 34 Talet av sider bokmål: -- Talet av sider nynorsk: 2 Talet av sider engelsk: 2 Sensurfrist: 8. januar 2001 Hjelpemiddel som kan nyttast: Kalkulator. Norsk-engelsk/ engelsk-norsk ordbok. Hamilton, Lawrence C. 1992 «Regression with Graphics», Belmont, Duxbury, Hardy, Melissa A. 1993 «Regression with Dummy Variables», QASS 93, London, Sage Breen, Richard 1996 «Regression Models. Censored, Sample Selected, or Truncated Data», QASS 111, London, Sage OPPGÅVE 1 (vekt 0,1) a) Kva gjer den justerte determinasjonskoeffesienten interessant samanlikna med den vanlege determinasjonskoeffesienten? b) Heteroskedastisitet er eit større problem i modellar med sensurerte eller utvalsselekterte data enn i OLS modellar (med data frå eit enkelt tilfeldig utval). Kvifor?

Upload: others

Post on 18-Mar-2020

4 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: EKSAMENSOPPGÅVE I SVSOS316 REGRESJONSANALYSE · 2004-09-21 · Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap EKSAMENSOPPGÅVE I SVSOS316

Norges Teknisk-Naturvitenskapelege Universitet Institutt for sosiologi og statsvitenskap Eksamensoppgåver i SOS316 Regresjonsanalyse 6 desember 2000

1

NTNU, TRONDHEIM NYNORSK Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

EKSAMENSOPPGÅVE I

SVSOS316 REGRESJONSANALYSE

Eksamensdag: 6 desember 2000 Eksamensstad: Dragvoll, Pav. C, rom 101 Tid til eksamen: 6 timar Vekter: 5 Talet av sider med tekst: 34 Talet av sider bokmål: -- Talet av sider nynorsk: 2 Talet av sider engelsk: 2 Sensurfrist: 8. januar 2001 Hjelpemiddel som kan nyttast:

Kalkulator. Norsk-engelsk/ engelsk-norsk ordbok. Hamilton, Lawrence C. 1992 «Regression with Graphics», Belmont, Duxbury, Hardy, Melissa A. 1993 «Regression with Dummy Variables», QASS 93, London, Sage Breen, Richard 1996 «Regression Models. Censored, Sample Selected, or Truncated Data», QASS 111, London, Sage

OPPGÅVE 1 (vekt 0,1) a) Kva gjer den justerte determinasjonskoeffesienten interessant samanlikna med den vanlege determinasjonskoeffesienten? b) Heteroskedastisitet er eit større problem i modellar med sensurerte eller utvalsselekterte data enn i OLS modellar (med data frå eit enkelt tilfeldig utval). Kvifor?

Page 2: EKSAMENSOPPGÅVE I SVSOS316 REGRESJONSANALYSE · 2004-09-21 · Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap EKSAMENSOPPGÅVE I SVSOS316

NORWEGIAN UNIVERSITY OF SCIENCE AND TECHNOLOGY Department of sociology and political science

Examination questions for SOS316 Regression analysis 6 December 2000

2

OPPGÅVE 2 (vekt 0,45) I vedlegga til oppgåve 2 er det estimert 3 modellar av «HHinnt», bruttoinntekt i hushaldet. a) Formuler modellen som er estimert i modell 1. Finn eit konfidensintervall for effekten av «eiga utdanning» i modell 2. Test om «kjelde til livsopphald» gir ei signifikant yting til å forklare variasjonen i hushaldsinntekta. b) Bruk modell 2. Finn forventa hushaldsinntekt for hushaldet til ei 40 år gammal kvinne med 12 års utdanning, gift med ein lærar, busett spredtbygd, med deltidsarbeid som funksjonær i kommunen når vi i tillegg får vite at ho har 2 barn og at det ikkje er andre medlemmer i hushaldet. Kva kan lesast ut av koeffesientane for bustadsvariabelen om hushaldsinntekter i Norge? c) Vurder i kva grad modellane 2 og/ eller 3 stettar krava til OLS regresjon. d) Modellane 1-3 er estimert berre på dei observasjonane som inneheld hushaldsinntekt. Dei 360 utelatte personane svarte ikkje på spørsmålet om hushaldsinntekt eller nekta å svare. Drøft generelt problemet med manglande svar i utvalsgranskingar og spesielt problemet med å utelate observasjonar som manglar svar på avhengig variabel. OPPGÅVE 3 (vekt 0,45) I vedlegga til oppgåve 3 er det estimert 4 modellar av variabelen «Besøke husflidsforretning» a) Finn eit konfidensintervall for effekten av «Kvinne» i modell 1. Forklar kva oddsraten for «Kvinne» seier oss. b) Bruk sannsynsratetesten (Hamilton 1992:225) for å avgjere om «Alder» gir ei signifikant yting til å forklare variasjonen i sannsynet for å velje å «Besøke husflidsforretning». Finn oddsraten mellom personar med 17 og 7 års utdanning i modell 4. c) Formuler den modellen som er estimert som modell 4. Finn frå modell 4 forventa sannsyn for å velje å «Besøke husflidsforretning» for ein barnlaus mann på 30 år med 12 års utdanning. d) Vurder for modell 4 kva for ein variabel som kan seiast å ha størst verknad på sannsynet for å velje å «Besøke husflidsforretning». Vurder kor «god» modell 4 kan seiast å vere.

Page 3: EKSAMENSOPPGÅVE I SVSOS316 REGRESJONSANALYSE · 2004-09-21 · Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap EKSAMENSOPPGÅVE I SVSOS316

Norges Teknisk-Naturvitenskapelege Universitet Institutt for sosiologi og statsvitenskap Eksamensoppgåver i SOS316 Regresjonsanalyse 6 desember 2000

3

NTNU, TRONDHEIM ENGLISH Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap

EXAMINATION QUESTIONS FOR

SVSOS316 REGRESJON ANALYSIS

Date of examination: 6 December 2000 Place of examination: Dragvoll, Pav. C, rom 101 Time allowed: 6 timer Weight: 5 Number of pages with text: 36 Number of pages with «Nynorsk»: 2 Number of pages with «Bokmål»: -- Number of pages with English: 2 Date of results: 8. januar 2001 Allowed means for assistance:

Calculator Norsk-engelsk/ engelsk-norsk dictionary. Hamilton, Lawrence C. 1992 «Regression with Graphics», Belmont, Duxbury, Hardy, Melissa A. 1993 «Regression with Dummy Variables», QASS 93, London, Sage Breen, Richard 1996 «Regression Models. Censored, Sample Selected, or Truncated Data», QASS 111, London, Sage

QUESTION 1 (weight 0,1) a)What makes the adjusted coefficient of determination of interst compared to the ordinary coefficient of determination? b) Heteroscedasticity is a more important problem in censored and sample-selected models than in OLS models (using data from a simple random sample). Why?

Page 4: EKSAMENSOPPGÅVE I SVSOS316 REGRESJONSANALYSE · 2004-09-21 · Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap EKSAMENSOPPGÅVE I SVSOS316

NORWEGIAN UNIVERSITY OF SCIENCE AND TECHNOLOGY Department of sociology and political science

Examination questions for SOS316 Regression analysis 6 December 2000

4

QUESTION 2 (weight 0,45) In the attachments to question 2 three models of «HHinnt», gross income of household, have been estimated. a) Define the model estimated as model 1. Find a confidence interval for the impact of «own education» in model 2. Test whether «source of livelihood» contributes significantly to the explanation of variance in household income. b) Use model 2. Find expected household income of the household of a 40 years old woman with 12 years of education, married to a teacher, living in a sparsely settled area, working part time as white collar worker for the municipality when you in addition get to know that she has 2 children and that there are no other members of the household. What can be learned about household income in Norway from the coefficients on the type of home town variables? c) Evaluate the degree to which models 2 and/ or 3 satisfies the requirements of OLS regression. d) The models 1-3 are estimated on only those observations reporting household income. The 360 persons excluded did not answer the question on household income or did not want to answer. Discuss the general problem of missing answers in sample surveys, and in particular the problems created by excluding cases with missing information on the dependent variable. QUESTION 3 (weight 0,45) Attachments to question 3 present estimates of 4 models of the variable «Besøke husflidsforretning» (Visit arts and crafts shop) a) Find a confidence interval of the impact of «Kvinne» in model 1. Explain what the odds rate of «Kvinne» means. b) Use the liklihood ratio test (Hamilton 1992:225) to decide whether «Alder» adds significantly to the explanation of the variance in the probability to chose to visit an arts and crafts shop. Find the odds ratio between persons with 17 and 7 years of education in model 4. c) Define the model estimated as model 4. Use model 4 to find the expected probability of choosing to visit an arts and crafts shop for a childless man of age 30 years and with 12 years of education. d) Find for model 4 which variable you would judge to have the largest impact on the probability of choosing to visit an arts and crafts shop. Evaluate how «good» model 4 would seem to be.

Page 5: EKSAMENSOPPGÅVE I SVSOS316 REGRESJONSANALYSE · 2004-09-21 · Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap EKSAMENSOPPGÅVE I SVSOS316

Norges Teknisk-Naturvitenskapelege Universitet Institutt for sosiologi og statsvitenskap Eksamensoppgåver i SOS316 Regresjonsanalyse 6 desember 2000

5

OPPGÅVE/ OPPGAVE 2 Variabeldefinisjonar / QUESTION 2 Definition of variables HHinnt = bruttoinntekt i hushaldet i 1000 kr, er koda 30, dersom personen meiner bruttoinntekta i hushaldet er i intervallet 0-60.000 80, dersom personen meiner bruttoinntekta i hushaldet er i intervallet 60-100.000 115, dersom personen meiner bruttoinntekta i hushaldet er i intervallet 100-130.000 140, dersom personen meiner bruttoinntekta i hushaldet er i intervallet 130-160.000 180, dersom personen meiner bruttoinntekta i hushaldet er i intervallet 160-200.000 250, dersom personen meiner bruttoinntekta i hushaldet er i intervallet 200-300.000 350, dersom personen meiner bruttoinntekta i hushaldet er i intervallet 300-400.000 450, dersom personen meiner bruttoinntekta i hushaldet er i intervallet 400.000+... 999, dersom opplysningar manglar HHinnt = bruttoinntekt i husholdet i 1000 kr er kodet 30, hvis personen mener bruttoinntekta i husholdet er i intervallet 0-60.000 80, hvis personen mener bruttoinntekta i husholdet er i intervallet 60-100.000 115, hvis personen mener bruttoinntekta i husholdet er i intervallet 100-130.000 140, hvis personen mener bruttoinntekta i husholdet er i intervallet 130-160.000 180, hvis personen mener bruttoinntekta i husholdet er i intervallet 160-200.000 250, hvis personen mener bruttoinntekta i husholdet er i intervallet 200-300.000 350, hvis personen mener bruttoinntekta i husholdet er i intervallet 300-400.000 450, hvis personen mener bruttoinntekta i husholdet er i intervallet 400.000+... 999, hvis opplysningar manglar HHinnt = gross income of household in 1000 kr has been coded 30, if the person thinks the gross income of the household is in the range of 0-60.000 80, if the person thinks the gross income of the household is in the range of 60-100.000 115, if the person thinks the gross income of the household is in the range of 100-130.000 140, if the person thinks the gross income of the household is in the range of 130-160.000 180, if the person thinks the gross income of the household is in the range of 160-200.000 250, if the person thinks the gross income of the household is in the range of 200-300.000 350, if the person thinks the gross income of the household is in the range of 300-400.000 450, if the person thinks the gross income of the household is in the range of 400.000+... 999, if data is missing

200

400

600

0.05

0.10

0.15

0.20

30 80 115140

180250

350450

999

Frequencies 1000 kr Count Prob30 125 0.0424080 186 0.06309115 165 0.05597140 230 0.07802180 322 0.10923250 620 0.21031350 523 0.17741450 417 0.14145999 360 0.12212Total 2948 1.00000

Page 6: EKSAMENSOPPGÅVE I SVSOS316 REGRESJONSANALYSE · 2004-09-21 · Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap EKSAMENSOPPGÅVE I SVSOS316

NORWEGIAN UNIVERSITY OF SCIENCE AND TECHNOLOGY Department of sociology and political science

Examination questions for SOS316 Regression analysis 6 December 2000

6

OPPGÅVE/ OPPGAVE 2 Variabeldefinisjonar / QUESTION 2 Definition of variables Kvinne Woman Frequencies

Level Count Prob0 1445 0.490161=kvinne (woman) 1503 0.50984Total 2948 1.00000

Fulltidsarb = arbeider heil dag Fulltidsarb = arbeider hel dag Fulltidsarb = full time employment Frequencies

Level Count Prob0 1669 0.566151 = fulltid (full time) 1279 0.43385Total 2948 1.00000

Eg. arb off sektor = arbeider i offentleg sektor Eg. arb off sektor = arbeider i offentlig sektor Eg. arb off sektor = employed by public sector Frequencies

Level Count Prob0 2131 0.722861 = ansatt (employed) 817 0.27714Total 2948 1.00000

Barn i HH = det finst barn i hushaldet Barn i HH = tilstedeværelse av barn i husholdet Barn i HH = presence of children in the household Frequencies

Level Count Prob0 1308 0.443691 = ja (yes) 1640 0.55631Total 2948 1.00000

Page 7: EKSAMENSOPPGÅVE I SVSOS316 REGRESJONSANALYSE · 2004-09-21 · Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap EKSAMENSOPPGÅVE I SVSOS316

Norges Teknisk-Naturvitenskapelege Universitet Institutt for sosiologi og statsvitenskap Eksamensoppgåver i SOS316 Regresjonsanalyse 6 desember 2000

7

OPPGÅVE/ OPPGAVE 2 Variabeldefinisjonar / QUESTION 2 Definition of variables Ektesk. Status = ekteksapeleg status Ektesk. Status = ekteksapelig status Ektesk. Status = status of marriage

500

1000

1500

0.100.200.300.400.50

1 2 3 4

Frequencies Code Count Prob 1= Gift/ sambo (Married/ cohabiting) 1707 0.57904 2= Aldri gift (Never married) 866 0.29376 3= Før gift (Previously married) 364 0.12347 4= Uoppgitt (No data) 11 0.00373 Total 2948 1.00000 Pers m innt i HH = talet av personar i hushaldet med inntekt Pers m innt i HH = antall personar i husholdet med inntekt Pers m innt i HH = number of persons in the household with income

250

500

750

1000

1250

0.10

0.20

0.30

0.40

0 1 2 3 4 5

Frequencies Number Count Prob0 382 0.129581 956 0.324292 1311 0.444713 230 0.078024 60 0.020355 9 0.00305Total 2948 1.00000

Page 8: EKSAMENSOPPGÅVE I SVSOS316 REGRESJONSANALYSE · 2004-09-21 · Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap EKSAMENSOPPGÅVE I SVSOS316

NORWEGIAN UNIVERSITY OF SCIENCE AND TECHNOLOGY Department of sociology and political science

Examination questions for SOS316 Regression analysis 6 December 2000

8

OPPGÅVE/ OPPGAVE 2 Variabeldefinisjonar / QUESTION 2 Definition of variables Alder = alder i år Alder = age in years

Quantiles 100.0% maximum 94.00099.5% 84.25597.5% 77.00075.0% quartile 50.00050.0% median 35.00025.0% quartile 25.0002.5% 16.0000.5% 15.0000.0% minimum 15.000Moments Mean 38.88501Std Dev 17.44791Std Err Mean 0.32135upper 95% Mean 39.51511lower 95% Mean 38.25490N 2948

Page 9: EKSAMENSOPPGÅVE I SVSOS316 REGRESJONSANALYSE · 2004-09-21 · Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap EKSAMENSOPPGÅVE I SVSOS316

Norges Teknisk-Naturvitenskapelege Universitet Institutt for sosiologi og statsvitenskap Eksamensoppgåver i SOS316 Regresjonsanalyse 6 desember 2000

9

OPPGÅVE/ OPPGAVE 2 Variabeldefinisjonar / QUESTION 2 Definition of variables Eg.Utd = «eiga utdanning i år» er koda

7 dersom personen har utdanning på folkeskolenivå (inntil 8 års skolegang) 9 dersom personen har utdanning på ungdomsskole/ realskolenivå (9-10 års skolegang) 12 dersom personen har utdanning på videregående skole/ gymnas nivå (11-13 års

skolegang) 14 dersom personen har utdanning på universitetsnivå med meir enn 12 års skolegang +

studiar, men er uten akademisk tittel 17 dersom personen har utdanning på universitetsnivå med meir enn 12 års skolegang +

studiar, og har akademisk tittel Eg.Utd = «egen utdanning i år» er kodet

7 hvis personen har utdanning på folkeskolenivå (inntil 8 års skolegang) 9 hvis personen har utdanning på ungdomsskole/ realskolenivå (9-10 års skolegang) 12 hvis personen har utdanning på videregående skole/ gymnas nivå (11-13 års skolegang) 14 hvis personen har utdanning på universitetsnivå med mer enn 12 års skolegang + studier,

men er uten akademisk tittel 17 hvis personen har utdanning på universitetsnivå med mer enn 12 års skolegang + studier, og

har akademisk tittel Eg.Utd = «own education in years» has been coded

7 if the person has education at the level of primary school (up to 8 years of education) 9 if the person has education at the level of secondary school (9-10 years of education) 12 if the person has education at the level of high school (11-13 years of education) 14 if the person has education at college level (more than 12 years of education + college

studies, but without academic title) 17 if the person has education at university level (more than 12 years of education +

college studies, and with academic title)

250

500

750

1000

0.05

0.150.20

0.30

7 9 12 14 17

Frequencies Years Count Prob7 431 0.146209 680 0.2306612 1092 0.3704214 415 0.1407717 330 0.11194Total 2948 1.00000

Page 10: EKSAMENSOPPGÅVE I SVSOS316 REGRESJONSANALYSE · 2004-09-21 · Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap EKSAMENSOPPGÅVE I SVSOS316

NORWEGIAN UNIVERSITY OF SCIENCE AND TECHNOLOGY Department of sociology and political science

Examination questions for SOS316 Regression analysis 6 December 2000

10

OPPGÅVE/ OPPGAVE 2 Variabeldefinisjonar / QUESTION 2 Definition of variables Bost. type = bustadstype er svar på spørsmålet • «Hvilke av de beskrevne bostedene ligner mest på det du har i dag? Sentrum av storby,

Forstad til storby, Småby, Tettsted i landkommune eller Spredtbygd» Bost. type = bostedstype er svar på spørsmålet • Kva for ein av dei omtala bustadane liknar mest på den du har i dag? Sentrum av storby,

Forstad til storby, Småby, Tettstad i landkommune eller Spredtbygd. Bost. type = type of home town is the answer to the question • Which of the described places resembles closest where you live today? Center of city,

suburb to city, small town, village, sparsely settled.

250

500

750

0.050.100.150.200.250.30

1 2 3 4 5 6

Frequencies Type Count Prob1 = sentrum av storby (center of city) 354 0.120082 = forstad til storby (suburb of city) 562 0.190643 = småby (small town) 510 0.173004 = tettstad i landkommune (village) 969 0.328705 = spredbygd (sparsely settled) 492 0.166896 = ukjent (unknown) 61 0.02069Total 2948 1.00000 Bost. type er dummykoda med

Bost. Sentrum storby =1 dersom bustaden ligg i sentrum av storby, 0 elles Bost. Forst storby =1 dersom bustaden ligg i forstad til storby, 0 elles Bost. Småby =1 dersom bustaden ligg i småby, 0 elles Bost. Tettst =1 dersom bustaden ligg i tettstad i landkommune, 0 elles Bost. Spredtb =1 dersom bustaden ligg i spredtbygde strok, 0 elles Bost. Uoppg =1 dersom det ikkje er oppgitt kvar bustaden ligg, 0 elles

Bost.type has been dummy coded with Bost. Sentrum storby =1 if the home town is center of city, 0 otherwise Bost. Forst storby =1 if the home town is suburb of city, 0 otherwise Bost. Småby =1 if the home town is small town, 0 otherwise Bost. Tettst =1 if the home town is village, 0 otherwise Bost. Spredt =1 if the home town is sparsely settled, 0 otherwise Bost. Uoppg =1 if the home town is unknown, 0 otherwise

Page 11: EKSAMENSOPPGÅVE I SVSOS316 REGRESJONSANALYSE · 2004-09-21 · Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap EKSAMENSOPPGÅVE I SVSOS316

Norges Teknisk-Naturvitenskapelege Universitet Institutt for sosiologi og statsvitenskap Eksamensoppgåver i SOS316 Regresjonsanalyse 6 desember 2000

11

OPPGÅVE/ OPPGAVE 2 Variabeldefinisjonar / QUESTION 2 Definition of variables K. til livsopph = kjelde til livsopphald / kilde til livsopphald K. til livsopph = source of livelihood

100

200

300

400

0.05

0.10

0.15

1 2 3 4 5 6 7 8 9 10 11 12

Frequencies Code Count Prob1 Arbeidar, ufaglært (Worker, unbskilled) 420 0.142472 Arbeidar, faglært (Worker, skilled) 489 0.165883 Funksjonær, leiande, (While collar worker, manager) 264 0.089554 Funksjonær elles (White collar worker otherwise) 320 0.108555 Sjølvstendig (Self employed) 171 0.058016 Elev/ student/ lærling (Student) 463 0.157067 For tida arbeidslaus (Currently unemployed) 99 0.033588 Alderspensjonist (Pensioner) 255 0.086509 Trygda (Social security) 232 0.0787010 Gift utan betalt arbeid (Married without paid work) 79 0.0268011 Andre kjelder (Other sources) 107 0.0363012 Uoppgitt (No answer) 49 0.01662Total 2948 1.00000 K. til livsopph er dummykoda med Arbeider =1 dersom personen er faglært eller ufaglært arbeidar (kode 1 og 2), 0 elles Funksjonær =1 dersom personen er funksjonær (inkl leiande funksjonær) (kode 3 og 4), 0 elles Selvstendig =1 dersom personen er sjølvstendig (kode 5), 0 elles Elev/ student =1 dersom personen er elev, student eller lærling (kode 6), 0 elles Pensjon/ trygd =1 dersom personen er alderspensjonist eller trygda (kode 8 og 9), 0 elles Annet =1 dersom personen er arbeidslaus, gift uten eige betalt arbeid eller har anna type forsørging (kode 7, 10 og 11), 0 elles Uoppgitt ktL =1 dersom personen ikkje har svart på spørsmålet, 0 elles K. til livsopph has been dummy coded with Arbeider =1 if the person is skilled or unskilled worker (code 1 og 2), 0 otherwise Funksjonær =1 if the person is white collar worker or manager (code 3 og 4), 0 otherwise Selvstendig =1 if the person is selfemployed (code 5), 0 otherwise Elev/ student =1 if the person is student (code 6), 0 otherwise Pensjon/ trygd =1 if the person is pensioner (code 8 og 9), 0 otherwise Annet =1 if the person is unemployed, married without paid work or has

other source of livelihood (code 7, 10 og 11), 0 otherwise Uoppgitt ktL =1 if the person did not answer the question, 0 otherwise

Page 12: EKSAMENSOPPGÅVE I SVSOS316 REGRESJONSANALYSE · 2004-09-21 · Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap EKSAMENSOPPGÅVE I SVSOS316

NORWEGIAN UNIVERSITY OF SCIENCE AND TECHNOLOGY Department of sociology and political science

Examination questions for SOS316 Regression analysis 6 December 2000

12

OPPGÅVE/ OPPGAVE 2 Modell 1 / QUESTION 2 Model 1 Response HHinnt Summary of Fit RSquare 0.509513RSquare Adj 0.506652Root Mean Square Error 88.08607Mean of Response 252.4981Observations (or Sum Wgts) 2588 Analysis of Variance Source DF Sum of Squares Mean Square F Ratio Model 15 20730625 1382042 178.1175 Residual 2572 19956550 7759 Prob > F C. Total 2587 40687175 0.0000 Parameter Estimates Term Estimate Std Error t Ratio Prob>|t| Intercept -20.67688 12.99859 -1.59 0.1118 Alder 0.803322 0.140257 5.73 <.0001 Kvinne -8.77648 3.718355 -2.36 0.0183 Eg.Utd 8.5328411 0.663932 12.85 <.0001 Fulltidsarb 54.712884 3.914078 13.98 <.0001 Eg. arb off sektor -15.52156 4.079303 -3.80 0.0001 EktStat Før gift -59.7405 5.850642 -10.21 <.0001 EktStat Aldri gift -32.28797 4.732586 -6.82 <.0001 EktStat Uoppg -7.478827 29.61003 -0.25 0.8006 Barn i HH 38.223677 4.201877 9.10 <.0001 Pers m innt i HH 64.372323 2.33297 27.59 <.0001 Bost. Sentrum storby 12.711644 6.94327 1.83 0.0672 Bost. Forst. storby 38.85599 6.030408 6.44 <.0001 Bost. Småby 29.695063 6.057122 4.90 <.0001 Bost. Tettst. 20.001992 5.264629 3.80 0.0001 Bost. Uoppg 4.9841947 13.71182 0.36 0.7163

Page 13: EKSAMENSOPPGÅVE I SVSOS316 REGRESJONSANALYSE · 2004-09-21 · Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap EKSAMENSOPPGÅVE I SVSOS316

Norges Teknisk-Naturvitenskapelege Universitet Institutt for sosiologi og statsvitenskap Eksamensoppgåver i SOS316 Regresjonsanalyse 6 desember 2000

13

OPPGÅVE/ OPPGAVE 2 Modell 1 / QUESTION 2 Model 1 Residual by Predicted Plot

Page 14: EKSAMENSOPPGÅVE I SVSOS316 REGRESJONSANALYSE · 2004-09-21 · Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap EKSAMENSOPPGÅVE I SVSOS316

NORWEGIAN UNIVERSITY OF SCIENCE AND TECHNOLOGY Department of sociology and political science

Examination questions for SOS316 Regression analysis 6 December 2000

14

OPPGÅVE/ OPPGAVE 2 Modell 1 / QUESTION 2 Model 1 Residual HHinnt (liten mod)

Quantiles 100.0% maximum 321.1199.5% 241.8397.5% 182.9175.0% quartile 57.4650.0% median -6.3425.0% quartile -56.532.5% -165.840.5% -217.590.0% minimum -321.22Moments Mean 0.0000000Std Dev 87.83033Std Err Mean 1.7264833upper 95% Mean 3.3854893lower 95% Mean -3.385489

Page 15: EKSAMENSOPPGÅVE I SVSOS316 REGRESJONSANALYSE · 2004-09-21 · Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap EKSAMENSOPPGÅVE I SVSOS316

Norges Teknisk-Naturvitenskapelege Universitet Institutt for sosiologi og statsvitenskap Eksamensoppgåver i SOS316 Regresjonsanalyse 6 desember 2000

15

OPPGÅVE/ OPPGAVE 2 Modell 2 / QUESTION 2 Model 2 Response HHinnt Summary of Fit RSquare 0.535506RSquare Adj 0.531705Root Mean Square Error 85.8204Mean of Response 252.4981Observations (or Sum Wgts) 2588 Analysis of Variance Source DF Sum of Squares Mean Square F Ratio Model 21 21788223 1037534 140.8710 Residual 2566 18898952 7365 Prob > F C. Total 2587 40687175 0.0000 Parameter Estimates Term Estimate Std Error t Ratio Prob>|t| Intercept 9.4333473 13.33503 0.71 0.4794 Alder 0.5404105 0.162855 3.32 0.0009 Kvinne -13.40399 3.671474 -3.65 0.0003 Eg.Utd 7.1545204 0.671729 10.65 <.0001 Fulltidsarb 37.006128 4.799469 7.71 <.0001 Eg. arb off sektor -16.72892 4.175597 -4.01 <.0001 EktStat Før gift -56.29383 5.724796 -9.83 <.0001 EktStat Aldri gift -24.64822 4.817662 -5.12 <.0001 EktStat Uoppg -14.63981 29.21286 -0.50 0.6163 Barn i HH 35.725215 4.11641 8.68 <.0001 Pers m innt i HH 62.562706 2.340343 26.73 <.0001 Bost. Sentrum storby 6.3122867 6.818761 0.93 0.3547 Bost. Forst. storby 34.763046 5.927287 5.86 <.0001 Bost. Småby 27.168812 5.944491 4.57 <.0001 Bost. Tettst. 19.303531 5.169371 3.73 0.0002 Bost. Uoppg 6.1870045 13.37853 0.46 0.6438 KtL Funksj 52.038895 5.021073 10.36 <.0001 KtL S.stend 19.250825 7.702224 2.50 0.0125 KtL Elev/ stud -16.52944 7.031348 -2.35 0.0188 KtL Pens/ trygd -2.121673 7.50382 -0.28 0.7774 KtL Andre 5.5998421 6.791642 0.82 0.4097 KtL Uoppg 47.347032 14.63776 3.23 0.0012

Page 16: EKSAMENSOPPGÅVE I SVSOS316 REGRESJONSANALYSE · 2004-09-21 · Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap EKSAMENSOPPGÅVE I SVSOS316

NORWEGIAN UNIVERSITY OF SCIENCE AND TECHNOLOGY Department of sociology and political science

Examination questions for SOS316 Regression analysis 6 December 2000

16

OPPGÅVE/ OPPGAVE 2 Modell 2 / QUESTION 2 Model 2 Residual by Predicted Plot

Page 17: EKSAMENSOPPGÅVE I SVSOS316 REGRESJONSANALYSE · 2004-09-21 · Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap EKSAMENSOPPGÅVE I SVSOS316

Norges Teknisk-Naturvitenskapelege Universitet Institutt for sosiologi og statsvitenskap Eksamensoppgåver i SOS316 Regresjonsanalyse 6 desember 2000

17

OPPGÅVE/ OPPGAVE 2 Modell 2 / QUESTION 2 Model 2 Residual HHinnt

Quantiles 100.0% maximum 319.3399.5% 243.7997.5% 184.5275.0% quartile 54.7850.0% median -6.5925.0% quartile -57.252.5% -155.000.5% -206.850.0% minimum -299.12Moments Mean 0.0000000Std Dev 85.471366Std Err Mean 1.6801131upper 95% Mean 3.2945611lower 95% Mean -3.294561

Page 18: EKSAMENSOPPGÅVE I SVSOS316 REGRESJONSANALYSE · 2004-09-21 · Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap EKSAMENSOPPGÅVE I SVSOS316

NORWEGIAN UNIVERSITY OF SCIENCE AND TECHNOLOGY Department of sociology and political science

Examination questions for SOS316 Regression analysis 6 December 2000

18

OPPGÅVE/ OPPGAVE 2 Modell 2 / QUESTION 2 Model 2 h(i) leverage HHinnt

Quantiles 100.0% maximum 0.1253999.5% 0.0358697.5% 0.0282675.0% quartile 0.0090050.0% median 0.0070925.0% quartile 0.005912.5% 0.004100.5% 0.003480.0% minimum 0.00337Moments Mean 0.0086475Std Dev 0.0083360Std Err Mean 0.0001535upper 95% Mean 0.0089485lower 95% Mean 0.0083464

Page 19: EKSAMENSOPPGÅVE I SVSOS316 REGRESJONSANALYSE · 2004-09-21 · Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap EKSAMENSOPPGÅVE I SVSOS316

Norges Teknisk-Naturvitenskapelege Universitet Institutt for sosiologi og statsvitenskap Eksamensoppgåver i SOS316 Regresjonsanalyse 6 desember 2000

19

OPPGÅVE/ OPPGAVE 2 Modell 2 / QUESTION 2 Model 2 Cook's D(i) Influence HHinnt

Quantiles 100.0% maximum 0.0305099.5% 0.0048197.5% 0.0021775.0% quartile 0.0004550.0% median 0.0001425.0% quartile 0.000032.5% 0.000000.5% 0.000000.0% minimum 0.00000Moments Mean 0.0004108Std Dev 0.0010457Std Err Mean 0.0000206upper 95% Mean 0.0004511lower 95% Mean 0.0003705

Page 20: EKSAMENSOPPGÅVE I SVSOS316 REGRESJONSANALYSE · 2004-09-21 · Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap EKSAMENSOPPGÅVE I SVSOS316

NORWEGIAN UNIVERSITY OF SCIENCE AND TECHNOLOGY Department of sociology and political science

Examination questions for SOS316 Regression analysis 6 December 2000

20

OPPGÅVE/ OPPGAVE 2 Modell 2 / QUESTION 2 Model 2 Variabelverdiar for case med høg verdi på leverage h(i) («hatt»-observatoren) eller Cook’s D(i), del I ( «.» = missing ) Variable values for cases with high values on leverage h(i) («hat»-statistic) or Cook’s D(i), part I ( «.» = missing )

Case no.

HH-innt

Alder Kvinne

Eg. Utd

Full-tids-arb

Eg. arb off

sektor

Ektesk Status

Barn i HH

Pers m innt i

HH

Bost. type

K. til livs-

opph

Sorted by size of h(i) leverage HHinnt 2767 250 16 0 9 0 0 4 1 2 3 61152 . 15 1 9 0 0 4 1 1 4 61279 . 19 1 12 0 0 4 1 2 3 71457 180 17 0 12 0 0 4 1 1 5 61578 250 38 0 9 1 1 4 1 1 3 22663 180 16 1 9 0 0 4 1 2 5 111880 180 32 0 12 1 0 4 1 1 1 12379 140 25 1 14 1 0 4 1 2 4 72224 350 20 1 12 0 0 4 1 2 4 12

752 450 17 1 9 0 0 4 1 2 3 12544 350 21 0 12 0 0 4 1 2 4 12

Sorted by size of Cook’s D(i) Influence HHinnt 1696 450 62 0 17 0 1 1 0 0 3 81341 450 27 0 9 1 0 3 0 1 3 21894 450 43 0 9 0 0 1 1 0 5 9

17 30 70 0 7 0 0 3 0 1 2 12502 450 16 1 9 0 0 2 1 2 3 12

2827 450 16 1 9 0 0 2 1 2 3 12669 140 55 1 12 1 0 1 1 2 6 5

2792 30 22 1 17 0 0 2 1 0 2 12547 450 17 0 7 0 0 2 1 2 6 6752 450 17 1 9 0 0 4 1 2 3 12

2379 140 25 1 14 1 0 4 1 2 4 7

Page 21: EKSAMENSOPPGÅVE I SVSOS316 REGRESJONSANALYSE · 2004-09-21 · Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap EKSAMENSOPPGÅVE I SVSOS316

Norges Teknisk-Naturvitenskapelege Universitet Institutt for sosiologi og statsvitenskap Eksamensoppgåver i SOS316 Regresjonsanalyse 6 desember 2000

21

OPPGÅVE/ OPPGAVE 2 Modell 2 / QUESTION 2 Model 2 Variabelverdiar for case med høg verdi på leverage h(i) («hatt»-observatoren) eller Cook’s D(i), del II ( «.» = missing ) Variable values for cases with high values on leverage h(i) («hat»-statistic) or Cook’s D(i), part II ( «.» = missing )

Case no.

Residual HHinnt h(i) leverage HHinnt Cook's D(i) Influence HHinnt

Sorted by size of h(i) leverage HHinnt 2767 10.6792096 0.11860868 0.00010746 1152 . 0.11894370 . 1279 . 0.11914637 . 1457 8.40675546 0.11939578 0.00006716 1578 24.54624020 0.11967787 0.00057424 2663 -40.87726800 0.11997639 0.00159760 1880 -59.54725200 0.12018938 0.00339788 2379 -177.82322000 0.12080582 0.03049941 2224 44.44680840 0.12505956 0.00199176

752 159.66632000 0.12517915 0.02573455 544 30.50240950 0.12539375 0.00094127

Sorted by size of Cook’s D(i) Influence HHinnt 1696 277.11613500 0.01020924 0.00493886 1341 291.14106700 0.00977594 0.00521548 1894 319.33477500 0.00824828 0.00527771

17 -155.72268000 0.03496519 0.00561888 502 170.21513500 0.02980627 0.00566217

2827 170.21513500 0.02980627 0.00566217 669 -194.90077000 0.03030381 0.00755526

2792 -192.73231000 0.03366615 0.00826503 547 255.43805100 0.02712029 0.01153834 752 159.66632000 0.12517915 0.02573455

2379 -177.82322000 0.12080582 0.03049941

Page 22: EKSAMENSOPPGÅVE I SVSOS316 REGRESJONSANALYSE · 2004-09-21 · Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap EKSAMENSOPPGÅVE I SVSOS316

NORWEGIAN UNIVERSITY OF SCIENCE AND TECHNOLOGY Department of sociology and political science

Examination questions for SOS316 Regression analysis 6 December 2000

22

OPPGÅVE/ OPPGAVE 2 Modell 3 / QUESTION 2 Model 3 Response Ln(HHinnt) Summary of Fit RSquare 0.531411RSquare Adj 0.527577Root Mean Square Error 0.458083Mean of Response 5.357956Observations (or Sum Wgts) 2588 Analysis of Variance Source DF Sum of Squares Mean Square F Ratio Model 21 610.6378 29.0780 138.5724 Residual 2566 538.4488 0.2098 Prob > F C. Total 2587 1149.0866 0.0000 Parameter Estimates Term Estimate Std Error t Ratio Prob>|t| Intercept 4.311966 0.071178 60.58 0.0000 Alder 0.0018989 0.000869 2.18 0.0290 Kvinne -0.091078 0.019597 -4.65 <.0001 Eg.Utd 0.0298031 0.003585 8.31 <.0001 Fulltidsarb 0.1900541 0.025618 7.42 <.0001 Eg. arb off sektor -0.051886 0.022288 -2.33 0.0200 EktStat Før gift -0.345452 0.030557 -11.31 <.0001 EktStat Aldri gift -0.168608 0.025715 -6.56 <.0001 EktStat Uoppg 0.0181681 0.155929 0.12 0.9073 Barn i HH 0.1959541 0.021972 8.92 <.0001 Pers m innt i HH 0.3157959 0.012492 25.28 <.0001 Bost. Sentrum storby -0.011654 0.036396 -0.32 0.7488 Bost. Forst. storby 0.1355961 0.031638 4.29 <.0001 Bost. Småby 0.1258007 0.03173 3.96 <.0001 Bost. Tettst. 0.0897459 0.027593 3.25 0.0012 Bost. Uoppg -0.008105 0.07141 -0.11 0.9096 KtL Funksj 0.1978454 0.026801 7.38 <.0001 KtL S.stend 0.0655429 0.041112 1.59 0.1110 KtL Elev/ stud -0.259245 0.037531 -6.91 <.0001 KtL Pens/ trygd -0.045539 0.040053 -1.14 0.2557 KtL Andre 0.0321556 0.036252 0.89 0.3752 KtL Uoppg 0.0925885 0.078132 1.19 0.2361

Page 23: EKSAMENSOPPGÅVE I SVSOS316 REGRESJONSANALYSE · 2004-09-21 · Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap EKSAMENSOPPGÅVE I SVSOS316

Norges Teknisk-Naturvitenskapelege Universitet Institutt for sosiologi og statsvitenskap Eksamensoppgåver i SOS316 Regresjonsanalyse 6 desember 2000

23

OPPGÅVE/ OPPGAVE 2 Modell 3 / QUESTION 2 Model 3 Residual by Predicted Plot

Page 24: EKSAMENSOPPGÅVE I SVSOS316 REGRESJONSANALYSE · 2004-09-21 · Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap EKSAMENSOPPGÅVE I SVSOS316

NORWEGIAN UNIVERSITY OF SCIENCE AND TECHNOLOGY Department of sociology and political science

Examination questions for SOS316 Regression analysis 6 December 2000

24

OPPGÅVE/ OPPGAVE 2 Modell 3 / QUESTION 2 Model 3 Residual Ln(HHinnt)

Quantiles 100.0% maximum 1.297099.5% 1.156997.5% 0.848175.0% quartile 0.278450.0% median 0.035725.0% quartile -0.21952.5% -1.17660.5% -1.45160.0% minimum -2.1264Moments Mean 4.5e-15Std Dev 0.4562197Std Err Mean 0.0089679upper 95% Mean 0.0175853lower 95% Mean -0.017585

Page 25: EKSAMENSOPPGÅVE I SVSOS316 REGRESJONSANALYSE · 2004-09-21 · Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap EKSAMENSOPPGÅVE I SVSOS316

Norges Teknisk-Naturvitenskapelege Universitet Institutt for sosiologi og statsvitenskap Eksamensoppgåver i SOS316 Regresjonsanalyse 6 desember 2000

25

OPPGÅVE/ OPPGAVE 2 Modell 3 / QUESTION 2 Model 3 h(i) leverage Ln(HHinnt)

Quantiles 100.0% maximum 0.1253999.5% 0.0358697.5% 0.0282675.0% quartile 0.0090050.0% median 0.0070925.0% quartile 0.005912.5% 0.004100.5% 0.003480.0% minimum 0.00337Moments Mean 0.0086475Std Dev 0.0083360Std Err Mean 0.0001535upper 95% Mean 0.0089485lower 95% Mean 0.0083464

Page 26: EKSAMENSOPPGÅVE I SVSOS316 REGRESJONSANALYSE · 2004-09-21 · Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap EKSAMENSOPPGÅVE I SVSOS316

NORWEGIAN UNIVERSITY OF SCIENCE AND TECHNOLOGY Department of sociology and political science

Examination questions for SOS316 Regression analysis 6 December 2000

26

OPPGÅVE/ OPPGAVE 2 Modell 3 / QUESTION 2 Model 3 Cook's D(i) Influence Ln(HHinnt)

Quantiles 100.0% maximum 0.0275299.5% 0.0053497.5% 0.0026575.0% quartile 0.0003850.0% median 0.0001025.0% quartile 0.000022.5% 0.000000.5% 0.000000.0% minimum 0.00000Moments Mean 0.0004192Std Dev 0.0011299Std Err Mean 0.0000222upper 95% Mean 0.0004628lower 95% Mean 0.0003757

Page 27: EKSAMENSOPPGÅVE I SVSOS316 REGRESJONSANALYSE · 2004-09-21 · Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap EKSAMENSOPPGÅVE I SVSOS316

Norges Teknisk-Naturvitenskapelege Universitet Institutt for sosiologi og statsvitenskap Eksamensoppgåver i SOS316 Regresjonsanalyse 6 desember 2000

27

OPPGÅVE/ OPPGAVE 2 Modell 3 / QUESTION 2 Model 3 Variabelverdiar for case med høg verdi på leverage h(i) («hatt»-observatoren) eller Cook’s D(i), del I ( «.» = missing ) Variable values for cases with high values on leverage h(i) («hat»-statistic) or Cook’s D(i), part II ( «.» = missing )

Case no.

HH-innt

Alder Kvinne Eg. Utd

Full-tids-arb

Eg. arb off

sektor

Ektesk Status

Barn i HH

Pers m innt i

HH

Bost. type

K. til livs-

opphSorted by size of h(i) leverage HHinnt

2767 250 16 0 9 0 0 4 1 2 3 61152 . 15 1 9 0 0 4 1 1 4 61279 . 19 1 12 0 0 4 1 2 3 71457 180 17 0 12 0 0 4 1 1 5 61578 250 38 0 9 1 1 4 1 1 3 22663 180 16 1 9 0 0 4 1 2 5 111880 180 32 0 12 1 0 4 1 1 1 12379 140 25 1 14 1 0 4 1 2 4 72224 350 20 1 12 0 0 4 1 2 4 12

752 450 17 1 9 0 0 4 1 2 3 12544 350 21 0 12 0 0 4 1 2 4 12

Sorted by size of Cook’s D(i) Influence Ln(HHinnt) 1343 30 23 0 12 1 0 2 0 1 5 112871 30 58 1 7 0 0 3 0 1 6 9

703 30 84 1 7 0 0 3 0 1 6 8547 450 17 0 7 0 0 2 1 2 6 6752 450 17 1 9 0 0 4 1 2 3 12

3 30 73 1 7 0 0 3 0 1 6 11244 30 76 0 7 0 0 2 0 0 5 12

1741 30 40 0 7 0 1 3 0 1 4 1217 30 70 0 7 0 0 3 0 1 2 12

2792 30 22 1 17 0 0 2 1 0 2 122379 140 25 1 14 1 0 4 1 2 4 7

Page 28: EKSAMENSOPPGÅVE I SVSOS316 REGRESJONSANALYSE · 2004-09-21 · Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap EKSAMENSOPPGÅVE I SVSOS316

NORWEGIAN UNIVERSITY OF SCIENCE AND TECHNOLOGY Department of sociology and political science

Examination questions for SOS316 Regression analysis 6 December 2000

28

OPPGÅVE/ OPPGAVE 2 Modell 3 / QUESTION 2 Model 3 Variabelverdiar for case med høg verdi på leverage h(i) («hatt»-observatoren) eller Cook’s D(i), del II ( «.» = missing ) Variable values for cases with high values on leverage h(i) («hat»-statistic) or Cook’s D(i), part II ( «.» = missing )

Case no. Residual Ln(HHinnt) h(i) leverage Ln(HHinnt)

Cook's D(i) Influence

Ln(HHinnt) Sorted by size of h(i) leverage HHinnt

2767 0.19861521 0.11860868 0.00130465 1152 . 0.11894370 . 1279 . 0.11914637 . 1457 0.22039961 0.11939578 0.00162009 1578 0.07522226 0.11967787 0.00018928 2663 -0.20441110 0.11997639 0.00140219 1880 -0.24572890 0.12018938 0.00203091 2379 -0.90163100 0.12080582 0.02752108 2224 0.21338163 0.12505956 0.00161125

752 0.52374721 0.12517915 0.00971912 544 0.12040505 0.12539375 0.00051479

Sorted by size of Cook’s D(i) Influence Ln(HHinnt) 1343 -1.68147760 0.01057779 0.00661764 2871 -1.05514750 0.02621454 0.00666702

703 -1.10451870 0.02609282 0.00726978 547 1.16479154 0.02712029 0.00842097 752 0.52374721 0.12517915 0.00971912

3 -1.16132550 0.03194295 0.00995796 244 -1.18768630 0.03674337 0.01210007

1741 -1.29613790 0.03556099 0.01391286 17 -1.45084080 0.03496519 0.01711902

2792 -1.62364940 0.03366615 0.02058795 2379 -0.90163100 0.12080582 0.02752108

Page 29: EKSAMENSOPPGÅVE I SVSOS316 REGRESJONSANALYSE · 2004-09-21 · Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap EKSAMENSOPPGÅVE I SVSOS316

Norges Teknisk-Naturvitenskapelege Universitet Institutt for sosiologi og statsvitenskap Eksamensoppgåver i SOS316 Regresjonsanalyse 6 desember 2000

29

OPPGÅVE/ OPPGAVE 3 Variabeldefinisjonar / QUESTON 3 Definition of variables Besøke husflidsforretning = 1 dersom «Val av tidsbruk i bygdenorge» = 2, 0 elles

Val av tidsbruk i bygdenorge er svar på spørsmålet Dersom du var på reise i bygdenorge og måtte vente ein time på ferje, kva for ein av desse stadane ville du helst vitje? Lokalt kusntgalleri, husflidsforretning, staden sitt kjøpsenter, kafe/ restaurant.

Besøke husflidsforretning = 1 hvis «Val av tidsbruk i bygdenorge» = 2, 0 ellers Val av tidsbruk i bygdenorge er svar på spørsmålet «Hvis du var på reise i bygdenorge og måtte vente en time på ferge, hvilke av disse stende ville du da helst besøke? Lokalt kusntgalleri, husflidsforretning, stedets kjøpsenter, kafe/ restaurant.»

Besøke husflidsforretning = 1 if «Val av tidsbruk i bygdenorge» = 2, 0 otherwise Val av tidsbruk i bygdenorge is the answer to the question If you were travelling in Norway and had to wait an hour for the ferry, which of the following establishments would you rather visit? Local art gallery, arts and crafts shop, local shopping mall, café/ restaurant.

250

500

750

1000

1250

0.10

0.20

0.30

0.40

1 2 3 4

Frequencies Code Count 1 = Lokalt kunstgalleri (local art gallery) 393 2 = Husflidsforretning (arts and crafts shop) 494 3 = Stedets kjøpsenter (local shopping mall) 692 4 = Kafé/ restaurant (café/ restaurant) 1324 Missing 45 Total 2948

Kvinne: sjå definisjon under oppgåve 2 / se definisjon under oppgave 2 Kvinne: see definition under question 2 Barn i HH: sjå definisjon under oppgåve 2 / se definisjon under oppgave 2 Barn i HH: see definition under question 2 Eg.Utd. : sjå definisjon under oppgåve 2 / se definisjon under oppgave 2 Eg.Utd. : see definition under question 2 Alder : sjå definisjon under oppgåve 2 / se definisjon under oppgave 2 Alder : see definition under question 2

Page 30: EKSAMENSOPPGÅVE I SVSOS316 REGRESJONSANALYSE · 2004-09-21 · Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap EKSAMENSOPPGÅVE I SVSOS316

NORWEGIAN UNIVERSITY OF SCIENCE AND TECHNOLOGY Department of sociology and political science

Examination questions for SOS316 Regression analysis 6 December 2000

30

OPPGÅVE/ OPPGAVE 3 Modell 1-4 / QUESTION 3 Model 1-4 Nynorsk Kommentarar til vedleggstabellane for oppgåve 3 1. Oddsrater

Til skilnad frå SPSS vil kolonna med oddsrater her gi høvestalet mellom oddsen for å ha varabelen sin høgaste verdi og oddsen for å ha variabelen sin lågaste verdi.

2. Rsquare Rsquare(U) for ein modell er definert som reduksjonen i negativ loglikelihood som følgjer av modellen (kalla Difference, skilnaden mellom Full og Reduced) i høve til den negative loglikelihooden i ein modell som berre har konstant til parameter (kalla Reduced)

3. Betinga effekt plott I ei rekkje av betinga effekt plott (eksempel nedanfor) vil kvart einskild plott gi oss samanhengen mellom sannsynet for den gitte avhengige variabelen ( Pr{Y=1}) og den uavhengige som er nemnt under det einskilde plottet når dei andre uavhengige variablane er haldne konstante med dei verdiane som står midt under plottet deira. Variabelverdiane som står på kvar side gir minste og største observerte variabelverdi for variabelen. Det samme gjeld for verdiane som er gitt for sannsynet. Eksempel: Samanhengen mellom «Kvinne» og Pr{Y=1} er betinga av variabelverdiane Eg.Utd. = 17, Barn i HH = 0 og Alder = 70. Største mogelege verdi av Pr{Y=1}= 0.508 og lågaste mogelege verdi er 0.0132. For Kvinne = 0 (dvs. for ein mann), gitt at dei andre variablane er faste (Eg.Utd. = 17, Barn i HH = 0 og Alder = 70), vil Pr{Y=1}= 0.149087, talet som er gitt midt på skalaen.

Pr[Y

=1]

0.508

0.0132

0.149087

Kvinne

0 1

0

E.utdanning

7

1717

Barn i husholdet

0 1

0

Alder

15 9470

Page 31: EKSAMENSOPPGÅVE I SVSOS316 REGRESJONSANALYSE · 2004-09-21 · Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap EKSAMENSOPPGÅVE I SVSOS316

Norges Teknisk-Naturvitenskapelege Universitet Institutt for sosiologi og statsvitenskap Eksamensoppgåver i SOS316 Regresjonsanalyse 6 desember 2000

31

OPPGÅVE/ OPPGAVE 3 Modell 1-4 / QUESTION 3 Model 1-4 Bokmål Kommentarer til vedleggstabellene for oppgave 3 1. Oddsrater

Ulikt SPSS vil kolonnen med oddsrater her gi forholdstallet mellom oddsen for å ha variabelens høyeste verdi og oddsen for å ha variabelens laveste verdi.

2. Rsquare Rsquare(U) for en modell er definert som reduksjonen i negativ loglikelihood som følger av modellen (kalt Difference, forskjellen mellom Full og Reduced) i forhold til den negative loglikelihooden i en modell som bare har konstant til parameter (kalt Reduced)

3. Betinget effekt plott I en rekke av betinget effekt plott (eksempel nedenfor) vil hvert enkelt plott gi oss sammenhengen mellom sannsynligheten for den gitte avhengige variabelen ( Pr{Y=1}) og den uavhengige som er nevnt under det enkelte plottet når de andre uavhengige variablene er holdt konstante med de verdiene som står midt under plottet deres. Variabelverdiene som står på hver side gir minste og største observerte variabelverdi for variabelen. Det samme gjelder for verdiene som er gitt for sannsynligheten. Eksempel: Sammenhengen mellom «Kvinne» og Pr{Y=1} er betinget av variabelverdiene Eg.Utd. = 17, Barn i HH = 0 og Alder = 70. Største mugelige verdi av Pr{Y=1}= 0.508 og laveste mugelige verdi er 0.0132. For Kvinne = 0 (dvs. for en mann), gitt at de andre variablene er faste (Eg.Utd. = 17, Barn i HH = 0 og Alder = 70), vil Pr{Y=1}= 0.149087, tallet som er gitt midt på skalaen.

Pr[Y

=1]

0.508

0.0132

0.149087

Kvinne

0 1

0

E.utdanning

7

1717

Barn i husholdet

0 1

0

Alder

15 9470

Page 32: EKSAMENSOPPGÅVE I SVSOS316 REGRESJONSANALYSE · 2004-09-21 · Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap EKSAMENSOPPGÅVE I SVSOS316

NORWEGIAN UNIVERSITY OF SCIENCE AND TECHNOLOGY Department of sociology and political science

Examination questions for SOS316 Regression analysis 6 December 2000

32

OPPGÅVE/ OPPGAVE 3 Modell 1-4 / QUESTION 3 Model 1-4 English Comments to the tables attached to question 3 1. Odds ratios

Different from SPSS the column of odds ratios here gives the ratio of the odds of having the highest value of the variable and the odds of having the lowest value of the variable.

2. Rsquare Rsquare(U) for a model is defined as the reduction in i negative loglikelihood caused by the model (called Difference, the difference between Full and Reduced) in relation to the negative loglikelihood in a model with only a constant as parameter (called Reduced)

3. Conditional effect plots In a row of conditional effect plots (as in the example below) each plot will give us the relationship between the probability of the dependent variable ( Pr{Y=1}) and the independent variable listed below each plots with the other independent variables kept constant at the values given in the middle below their plot. The variable values on each side give the lowest and highest observed value on that variable. Similarly applies for the values given for the probability. Example: the relationship between «Kvinne» and Pr{Y=1} is based on the variable values Eg.Utd. = 17, Barn i HH = 0 and Alder = 70. The highest possible value of Pr{Y=1}= 0.508 and the lowest possible value is 0.0132. For Kvinne = 0 (i.e. for a man), given that the other variable values are fixed (i.e. Eg.Utd. = 17, Barn i HH = 0 og Alder = 70), Pr{Y=1}= 0.149087, the figure given in the middle of the scale.

Pr[Y

=1]

0.508

0.0132

0.149087

Kvinne

0 1

0

E.utdanning

7

1717

Barn i husholdet

0 1

0

Alder

15 9470

Page 33: EKSAMENSOPPGÅVE I SVSOS316 REGRESJONSANALYSE · 2004-09-21 · Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap EKSAMENSOPPGÅVE I SVSOS316

Norges Teknisk-Naturvitenskapelege Universitet Institutt for sosiologi og statsvitenskap Eksamensoppgåver i SOS316 Regresjonsanalyse 6 desember 2000

33

OPPGÅVE/ OPPGAVE 3 Modell 1 / QUESTION 3 Model 1 Nominal Logistic Fit for Besøke husflidsforretning Iteration History

Iter LogLikelihood Step Delta-Criterion Obj-Criterion1 -2043.397888 Initial 1662283737 .2 -1296.328651 Newton 0.70556780 0.576291723 -1260.834146 Newton 0.13388809 0.028151384 -1259.314064 Newton 0.00802578 0.001207065 -1259.308273 Newton 0.00003366 0.00000460

Whole Model Test Model -LogLikelihood DF ChiSquare Prob>ChiSq Difference 73.2293 1 146.4587 <.0001 Full 1259.3083 Reduced 1332.5376 RSquare (U) 0.0550Observations (or Sum Wgts) 2948 Parameter Estimates Term Estimate Std Error ChiSquare Prob>ChiSq Odds Ratio Intercept -2.3835933 0.0946164 634.65 <.0001 . Kvinne 1.2716297 0.1119134 129.11 <.0001 3.56666041 OPPGÅVE/ OPPGAVE 3 Modell 2 / QUESTION 3 Model 2 Nominal Logistic Fit for Besøke husflidsforretning Iteration History

Iter LogLikelihood Step Delta-Criterion Obj-Criterion1 -2043.397888 Initial 3111596887 .2 -1261.547910 Newton 0.83504765 0.619749583 -1209.939258 Newton 0.18634675 0.042653574 -1206.404922 Newton 0.01596205 0.002929625 -1206.376704 Newton 0.00014242 0.000023396 -1206.376701 Newton 0.00000001 1.809e-9

Whole Model Test Model -LogLikelihood DF ChiSquare Prob>ChiSq Difference 126.16090 3 252.3218 <.0001 Full 1206.3767 Reduced 1332.5376 RSquare (U) 0.0947Observations (or Sum Wgts) 2948 Parameter Estimates Term Estimate Std Error ChiSquare Prob>ChiSq Odds RatioIntercept -5.7035567 0.3882248 215.84 <.0001 .Kvinne 1.324728 0.1139086 135.25 <.0001 3.76116217Alder 0.14501658 0.0173592 69.79 <.0001 94495.7339Alder**2 -0.0013493 0.0001836 54.03 <.0001 0.00000899

Page 34: EKSAMENSOPPGÅVE I SVSOS316 REGRESJONSANALYSE · 2004-09-21 · Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap EKSAMENSOPPGÅVE I SVSOS316

NORWEGIAN UNIVERSITY OF SCIENCE AND TECHNOLOGY Department of sociology and political science

Examination questions for SOS316 Regression analysis 6 December 2000

34

OPPGÅVE/ OPPGAVE 3 Modell 3 / QUESTION 3 Model 3 Nominal Logistic Fit for Besøke husflidsforretning Iteration History

Iter LogLikelihood Step Delta-Criterion Obj-Criterion1 -2043.397888 Initial 3397263233 .2 -1258.822184 Newton 0.85106254 0.623256793 -1205.332502 Newton 0.19490388 0.044377164 -1201.441377 Newton 0.01768019 0.003238695 -1201.406655 Newton 0.00017755 0.00002896 -1201.406652 Newton 0.00000002 2.806e-9

Whole Model Test Model -LogLikelihood DF ChiSquare Prob>ChiSq Difference 131.1310 4 262.2619 <.0001 Full 1201.4067 Reduced 1332.5376 RSquare (U) 0.0984Observations (or Sum Wgts) 2948Parameter Estimates Term Estimate Std Error ChiSquare Prob>ChiSq Odds RatioIntercept -6.41582730 0.4538710 199.82 <.0001 .Kvinne 1.35541098 0.1147888 139.43 <.0001 3.87835457Alder 0.14341186 0.0174629 67.44 <.0001 83244.4349Alder**2 -0.00129090 0.0001849 48.75 <.0001 0.00001487Eg.Utd. 0.05661608 0.0178994 10.00 0.0016 1.76149127 OPPGÅVE/ OPPGAVE 3 Modell 4 / QUESTION 3 Model 4 Nominal Logistic Fit for Besøke husflidsforretning Iteration History

Iter LogLikelihood Step Delta-Criterion Obj-Criterion1 -2043.397888 Initial 3480982107 .2 -1256.938852 Newton 0.83826473 0.625688973 -1203.087080 Newton 0.19401873 0.044760954 -1199.174010 Newton 0.01789469 0.003263115 -1199.138840 Newton 0.00018328 0.000029336 -1199.138836 Newton 0.00000002 2.9e-9

Whole Model Test Model -LogLikelihood DF ChiSquare Prob>ChiSq Difference 133.3988 5 266.7975 <.0001 Full 1199.1388 Reduced 1332.5376 RSquare (U) 0.1001Observations (or Sum Wgts) 2948Parameter Estimates Term Estimate Std Error ChiSquare Prob>ChiSq Odds Ratio Intercept -6.51025120 0.4539816 205.65 <.0001 . Kvinne 1.34401309 0.1149831 136.63 <.0001 3.83440046 Alder 0.13641411 0.0175968 60.10 <.0001 47892.5306 Alder**2 -0.00118030 0.0001898 38.67 <.0001 0.00003854 Eg.Utd. 0.05900844 0.0179562 10.80 0.0010 1.80414068 Barn i HH 0.25424529 0.1202249 4.47 0.0345 1.28948806

Page 35: EKSAMENSOPPGÅVE I SVSOS316 REGRESJONSANALYSE · 2004-09-21 · Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap EKSAMENSOPPGÅVE I SVSOS316

Norges Teknisk-Naturvitenskapelege Universitet Institutt for sosiologi og statsvitenskap Eksamensoppgåver i SOS316 Regresjonsanalyse 6 desember 2000

35

OPPGÅVE/ OPPGAVE 3 Modell 4 / QUESTION 3 Model 4 Conditional effect plots

Pr[Y

=1]

0.504

0.0132

0.02102

Kvinne

0 1

0

E.utdanning

7

177

Barn i husholdet

0 1

0

Alder

15 9420

Pr[Y

=1]

0.504

0.0132

0.103725

Kvinne

0 1

0

E.utdanning

7

177

Barn i husholdet

0 1

0

Alder

15 9457

Pr[Y

=1]

0.504

0.0132

0.088518

Kvinne

0 1

0

E.utdanning

7

177

Barn i husholdet

0 1

0

Alder

15 9470

Page 36: EKSAMENSOPPGÅVE I SVSOS316 REGRESJONSANALYSE · 2004-09-21 · Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap EKSAMENSOPPGÅVE I SVSOS316

NORWEGIAN UNIVERSITY OF SCIENCE AND TECHNOLOGY Department of sociology and political science

Examination questions for SOS316 Regression analysis 6 December 2000

36

OPPGÅVE/ OPPGAVE 3 Modell 4 / QUESTION 3 Model 4 Conditional effect plots

Pr[Y

=1]

0.508

0.0132

0.160744

Kvinne

0 1

1

E.utdanning

7

1717

Barn i husholdet

0 1

1

Alder

15 9420

Pr[Y

=1]

0.508

0.0132

0.507958

Kvinne

0 1

1

E.utdanning

7

1717

Barn i husholdet

0 1

1

Alder

15 9457

Pr[Y

=1]

0.508

0.0132

0.464181

Kvinne

0 1

1

E.utdanning

7

1717

Barn i husholdet

0 1

1

Alder

15 9470

Page 37: EKSAMENSOPPGÅVE I SVSOS316 REGRESJONSANALYSE · 2004-09-21 · Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap EKSAMENSOPPGÅVE I SVSOS316

Norges Teknisk-Naturvitenskapelege Universitet Institutt for sosiologi og statsvitenskap Eksamensoppgåver i SOS316 Regresjonsanalyse 6 desember 2000

37

OPPGÅVE/ OPPGAVE 3 Modell 4 / QUESTION 3 Model 4 Contingency Analysis of MostLikely Besøke husflidsforretning (MostLikely = P(i)>0. 5) By Besøke husflidsforretning Contingency Table Besøke husflidsforretning By MostLikely Besøke husflidsforretning Count Total % Row % Col %

0 MostLikely=1

0 2454 83.24

100.00 83.30

00.000.000.00

245483.24

Observed=1 492 16.69 99.60 16.70

20.070.40

100.00

49416.76

2946 99.93

20.07

2948

Contingency Analysis of Most Likely Besøke husflidsforretning (MostLikely = P(i) > 0.3) By Besøke husflidsforretning Contingency Table Besøke husflidsforretning By Most Likely Besøke husflidsforretning Count Total % Row % Col %

0 Mostlikely=1

0

2252 76.39 91.77 85.21

202 6.85 8.23

66.23

2454 83.24

Observed=1 391 13.26 79.15 14.79

103 3.49

20.85 33.77

494 16.76

2643 89.65

305 10.35

2948

Page 38: EKSAMENSOPPGÅVE I SVSOS316 REGRESJONSANALYSE · 2004-09-21 · Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap EKSAMENSOPPGÅVE I SVSOS316

NORWEGIAN UNIVERSITY OF SCIENCE AND TECHNOLOGY Department of sociology and political science

Examination questions for SOS316 Regression analysis 6 December 2000

38

OPPGÅVE/ OPPGAVE 3 Modell 4 / QUESTION 3 Model 4 Distribution of Pr[Y =1]

Quantiles 100.0% maximum 0.5039175.0% quartile 0.2590850.0% median 0.1300425.0% quartile 0.081420.0% minimum 0.01317Moments Mean 0.1675712Std Dev 0.1126333Std Err Mean 0.0020745upper 95% Mean 0.1716388lower 95% Mean 0.1635036