opdracht gravity
Embed Size (px)
TRANSCRIPT
-
7/27/2019 Opdracht Gravity
1/13
-
7/27/2019 Opdracht Gravity
2/13
Correlations
logExport logDistance logGDP country i logGDP country j
logExport Pearson Correlation 1 -,350**
,206**
,416**
Sig. (2-tailed) ,000 ,003 ,000
N 214 214 214 214
logDistance Pearson Correlation -,350**
1 -,057 ,094
Sig. (2-tailed) ,000 ,358 ,126
N 214 264 264 264
logGDP country i Pearson Correlation ,206**
-,057 1 -,028
Sig. (2-tailed) ,003 ,358 ,654
N 214 264 264 264
logGDP country j Pearson Correlation ,416**
,094 -,028 1
Sig. (2-tailed) ,000 ,126 ,654
N 214 264 264 264
**. Correlation is significant at the 0.01 level (2-tailed).
-
7/27/2019 Opdracht Gravity
3/13
-
7/27/2019 Opdracht Gravity
4/13
4. Which country-pairs are high traders, which country-pairs are low traders? Explain inyour own words what possible factors are behind this trade heterogeneity?
Hoge traders: Mexico en USA zijn hoge traders. Dit is te verklaren door het tropische klimaat dat er
heerst in deze landen. Een tropisch klimaat is immers ideaal voor de groei van de katoenplant. Veelproductie betekent ook veel export, aangezien slechts een deel wordt gehouden voor binnenlands
gebruik.
Laag:
5. Based on you .ndings, explain (no more than two short paragraphs) what you conclude from your
.ndings in (a), (b) ane (c)?Hoe groter de afstand, hoe lager de export, negatieve correlatie (-0,35).
Hoe groter het BBP van de exporteur, hoe hoger de export, positieve correlatie (0,260). Hoe groter
het BBP van de importeur, hoe meer hij dus gaat importeren, en hoe meer het andere land dus gaat
exporteren, positieve correlatie (0,416). Dit komt dus overeen met de verwachtingen. De
cofficinten zijn significant, omdat de p-waarden telkens kleiner zijn dan 0,01. Mexico VS hetmeeste export. Mexico grote exporteur van katoen. Verschillende die nul waren, wegens geen
export naar dat land.
II. Building the Modela. Run the regression, Tij= a + b1yi+ b2yj+ b3dij+ eij, interpret the estimated slope
coefficients (including the constant). Do the sign of these coefficients make sense? What
about the overall fit of your model? Interpret your cofficients.
Model Summary
Model R R Square
Adjusted R
Square
Std. Error of the
Estimate
1 ,675a
,456 ,448 2,60058
a. Predictors: (Constant), logGDPreporter, logGDPpartner, logDistance
ANOVAb
Model Sum of Squares df Mean Square F Sig.
1 Regression 1189,325 3 396,442 58,619 ,000a
Residual 1420,230 210 6,763
Total 2609,555 213
a. Predictors: (Constant), logGDPreporter, logGDPpartner, logDistance
b. Dependent Variable: logExport
-
7/27/2019 Opdracht Gravity
5/13
Coefficientsa
Model
Unstandardized Coefficients
Standardized
Coefficients
t Sig.B Std. Error Beta
1 (Constant) -4,027 2,784 -1,447 ,150
logDistance -1,421 ,152 -,489 -9,323 ,000
logGDPpartner ,685 ,132 ,265 5,172 ,000
logGDPreporter 1,458 ,139 ,553 10,517 ,000
a. Dependent Variable: logExport
Regressievergelijking: Xij = -4,027 + 0,685 Yi + 1,458 Yj 1,421 Dij
1% stijging in distance zorgt voor een daling van de export met 1,421%
1%stijging in GDP country i zorgt voor een stijging van de export met 0,685%1% stijging in GDP country j zorgt voor een stijging van de export met 1,458%
De constante is negatief en geeft het snijpunt met de y-as weer. Dit is de waarde van de export alles
alle variabelen nul zijn. Aangezien dit negatief is heeft dit geen betekenis, want export kan niet
negatief zijn.
De cofficinten zijn zoals verwacht, een grotere afstand zorgt voor een daling van de export. Een
toename van het BBP zorgt voor hogere export. Dit komt overeen met onze eerdere bevindingen op
basis van de correlaties.
De adjusted R is 0,448. Dit houdt in dat 44,8% van de variantie in de totale export verklaard kanworden door de regeressoren/variabelen.
b. Equation (1) can be augmented with other variables. For instance: Tij= a + b1yi+ b2yj+ b3dij+ b4ADJij+ b5LANGij+ eij(2) where ADJijis a dummy variables and equal 1 whencountry i and country j share the same border and 0 otherwise; LANGijis dummyvariable and equal 1 when country i and country j share the same language; and all
other variables are defined previously. Estimate the following model in OLS and interpretthe new results (with the new variables).
Model Summary
Model R R Square
Adjusted R
Square
Std. Error of the
Estimate
1 ,675a
,456 ,443 2,61202
a. Predictors: (Constant), logGDPreporter, Dummy Language,
logGDPpartner, logDistance, Dummy Adjacency
-
7/27/2019 Opdracht Gravity
6/13
ANOVAb
Model Sum of Squares df Mean Square F Sig.
1 Regression 1190,445 5 238,089 34,897 ,000a
Residual 1419,110 208 6,823
Total 2609,555 213
a. Predictors: (Constant), logGDPreporter, Dummy Language, logGDPpartner, logDistance,
Dummy Adjacency
b. Dependent Variable: logExport
Coefficientsa
Model
Unstandardized Coefficients
Standardized
Coefficients
t Sig.B Std. Error Beta
1 (Constant) -4,164 2,823 -1,475 ,142
logDistance -1,388 ,173 -,478 -8,013 ,000
logGDPpartner ,680 ,134 ,262 5,062 ,000
Dummy Adjacency ,272 ,738 ,023 ,369 ,712
Dummy Language ,007 ,614 ,001 ,012 ,991
logGDPreporter 1,452 ,140 ,551 10,360 ,000
a. Dependent Variable: logExport
Regressievergelijking: Xij = -4,164 + 0,680 Yi + 1,452 Yj 1,388 Dij + 0,272ADJij + 0,007LANGij
1% stijging in distance zorgt voor een daling van de export met 1,388%
1%stijging in GDP country i zorgt voor een stijging van de export met 0,680%
1% stijging in GDP country j zorgt voor een stijging van de export met 1,452%
Als de dummy variabele ADJ ij de waarde 1 aanneemt, dit wil zeggen dat de landen aanelkaar grenzen, dan zal het totale exportvolume met 0,272 toenemen, alle anderecofficinten constant gehouden.
Als de dummy variabele LANGij de waarde 1 aanneemt, dit wil zeggen dat er in beide
landen dezelfde taal wordt gesproken, dan zal het totale exportvolume met 0,007
toenemen, alle andere cofficinten constant gehouden.
De cofficinten distance, GDP country i en GDP country j zijn significant op 1%. De p-
waarde bedraagt 0,000 wat dus kleiner is dan 0,01. De cofficinten adjacency enlanguage zijn absoluut niet significant, de p-waarde bedragen 0,712 en 0,991. Dit islogisch omdat de export afhangt van de aanwezigheid van de katoenplant en niet van degemeenschappelijke talen of grenzen. Puur de aanwezigheid van de katoenplant, bepaalt
de export.
De adjusted R is quasi constant gebleven, dit wijst er op dat de 2 nieuwe variabelen
weinig tot geen relevantie hebben in dit model.
-
7/27/2019 Opdracht Gravity
7/13
From chapter 7 we have seen the technicalities related to a F-test. Test unitaryelasticities doing a joint test on the income variables that is, H0 : b1 = b2 = 1 versus Ha :b1 6= 1 either/or b2 6= 1 How would you interpret the implications of this test? Hint: inSPSS you will have to perform this test by rearranging equation (2). Alternatively, alsotest whether b1 = b2? Given the set of variables that you have, which equation wouldyield the best specification?
b) H0: 1 + 2 2 = 0
H1: 1 + 2 2 0
Xij = -4,164 + 0,680 Yi + 1,452 Yj 1,388 Dij + 0,272ADJij + 0,007LANGij + eij
Xij = -4,164 + 0,680 Yi + 1,452 Yi 2Yi + 1,452 Yj 1,452 Yi + 2 Yi - 1,388 Dij + 0,272ADJij +
0,007LANGij + eij
Xij = -4,164 + (0,680+ 1,452 2) Yi + 1,452 (Yj - Yi) + 2 Yi - 1,388 Dij + 0,272ADJij + 0,007LANGij
+ eij
Xij = -4,164 + 0,132 Yi + 1,452 (Yj - Yi) + 2 Yi - 1,388 Dij + 0,272ADJij + 0,007LANGij + eij
Xij - 2 Yi = -4,164 + 0,132 Yi + 1,452 (Yj - Yi) - 1,388 Dij + 0,272ADJij + 0,007LANGij + eij
Model Summary
Model R R Square
Adjusted R
Square
Std. Error of the
Estimate
1 ,758a
,575 ,565 2,61202
a. Predictors: (Constant), logGDPpartner, logDistance, Dummy
Language, Dummy Adjacency, YjminYi
ANOVAb
Model Sum of Squares df Mean Square F Sig.
1 Regression 1918,580 5 383,716 56,242 ,000a
Residual 1419,110 208 6,823
Total 3337,690 213
a. Predictors: (Constant), logGDPpartner, logDistance, Dummy Language, Dummy Adjacency,
YjminYi
b. Dependent Variable: Xij2Yi
-
7/27/2019 Opdracht Gravity
8/13
Coefficientsa
Model
Unstandardized Coefficients
Standardized
Coefficients
t Sig.B Std. Error Beta
1 (Constant) -4,164 2,823 -1,475 ,142
logDistance -1,388 ,173 -,423 -8,013 ,000
Dummy Adjacency ,272 ,738 ,021 ,369 ,712
Dummy Language ,007 ,614 ,001 ,012 ,991
YjminYi 1,452 ,140 ,723 10,360 ,000
logGDPpartner ,131 ,204 ,045 ,644 ,520
Niet significant, want log GDP partner is 0,520 > 0,005.
We kunnen dus H0 niet verwerpen, dus 1 + 2 2 = 0 .
1 en/of2 zijn niet significant verschillend van 1.
H0: 1 - 2 = 0
H1: 1 - 2 0
Xij = -4,164 + 0,680 Yi + 1,452 Yj 1,388 Dij + 0,272ADJij + 0,007LANGij + eij
Xij = -4,164 + (0,680- 1,452) Yi + 1,452 (Yi + YJ) 1,388 Dij + 0,272ADJij + 0,007LANGij + eij
Xij = -4,164 0,772 Yi + 1,452 (Yi + YJ) 1,388 Dij + 0,272ADJij + 0,007LANGij + eij
Model Summary
Model R R Square
Adjusted R
Square
Std. Error of the
Estimate
1 ,675a
,456 ,443 2,61202
a. Predictors: (Constant), YiplusYj, Dummy Adjacency, Dummy
Language, logDistance, logGDPpartner
ANOVAb
Model Sum of Squares df Mean Square F Sig.
1 Regression 1190,445 5 238,089 34,897 ,000a
Residual 1419,110 208 6,823
Total 2609,555 213
a. Predictors: (Constant), YiplusYj, Dummy Adjacency, Dummy Language, logDistance,
logGDPpartner
b. Dependent Variable: logExport
-
7/27/2019 Opdracht Gravity
9/13
Coefficientsa
Model
Unstandardized Coefficients
Standardized
Coefficients
t Sig.B Std. Error Beta
1 (Constant) -4,164 2,823 -1,475 ,142
logDistance -1,388 ,173 -,478 -8,013 ,000
Dummy Adjacency ,272 ,738 ,023 ,369 ,712
Dummy Language ,007 ,614 ,001 ,012 ,991
logGDPpartner -,772 ,184 -,298 -4,194 ,000
YiplusYj 1,452 ,140 ,754 10,360 ,000
a. Dependent Variable: logExport
Log GDP partner is significant want 0 < 0,005We kunnen dus HO verwerpen en stellen dat 1 - 2 0.
Do some analysis using the tabular approach explained in section 7.6. of SW by making,and commenting on, a table with your result similar to table 7.1 ? Conclude and explainyour final model?
Regressor (1) (2) (3) (4) (5) (6)
LogGDPpartner (Yi) 0,532** 0,623** 0,685** 0,686** 0,679** 0,68**
(0,174) (0,157) (0,132) (0,133) (0,133) (0,134)
LogGDPreporter (Yj) 1,147** 1,458** 1,457** 1,452** 1,452**
(0,160) (0,139) (0,139) (0,140) (0,140)
LogDistance (Dij) -1,421** -1,416** -1,388** -1,388**
(0,152) (0,156) (0,173) (0,173)
Dummy Adjacency (ADJij) 0,276 0,272
(0,679) (0,738)
Dummy Language (LANGij) 0,095 0,007
(0,566) (0,614)
Intercept 5,833*-
10,682** -4,027 -4,079 -4,162 -4,164
(2,465) (3,192) (2,784) (2,808) (2,809) (2,823)
Summary Statistics
SER 3,4335 3,0849 2,60058 2,60662 2,60576 2,61202
Adjusted R 0,038 0,223 0,448 0,445 0,446 0,443
n 264 264 264 264 264 264
De individuele cofficint is statistisch significant op een *5%-niveau of **1%-niveau, gebruikmakend van een tweezijdige
hypothesetest
-
7/27/2019 Opdracht Gravity
10/13
Interpretatie?
c. Consider model (2) again. A researcher might be interested in analyzing whether the
income elasticities (b1 and/or b2) are dierent according to some criteria (size of thecountry, rich/poor, distant versus non-distant). Create a dummy variable that controlsfor such heterogeneity.HINT: To create a dummy! This can be done in "transform" menu and choosing "newvariable". First, you generate a new variable "Size" =0. Then you choose the "transform"menu and choosing "new variable" and select the new variable that you just created.
You let this variable be "1" if "using your own judgment".On the basis of table 8.4. (Key Concept 8.4.) there are three possibilities in which thecreated dummy "Size" can be used in the estimating model (2): same intercept/dierentslope; dierent intercept/same slope; dierent slope/dierent intercept). So there are atotal of three regressions that needs be regressed. Based on your estimation, whichmodel do you prefer, and why?
-
7/27/2019 Opdracht Gravity
11/13
Model 1: Verschillende intercept, dezelfde helling:
Model Summary
Model R R SquareAdjusted R
SquareStd. Error of the
Estimate
1 ,675a
,456 ,446 2,60573
a. Predictors: (Constant), Size, logGDPreporter, logDistance,
logGDPpartner
ANOVAb
Model Sum of Squares df Mean Square F Sig.
1 Regression 1190,479 4 297,620 43,833 ,000a
Residual 1419,076 209 6,790
Total 2609,555 213
a. Predictors: (Constant), Size, logGDPreporter, logDistance, logGDPpartner
b. Dependent Variable: logExport
Coefficientsa
Model
Unstandardized Coefficients
Standardized
Coefficients
t Sig.B Std. Error Beta
1 (Constant) -2,942 3,835 -,767 ,444
logGDPpartner ,602 ,241 ,232 2,494 ,013
logGDPreporter 1,458 ,139 ,554 10,499 ,000
logDistance -1,433 ,156 -,493 -9,208 ,000
Size ,283 ,685 ,039 ,412 ,681
a. Dependent Variable: logExport
Xij = -2,942 + 0,602 Yi + 1,458 Yj 1,433 Dij + 0,283 Si
-
7/27/2019 Opdracht Gravity
12/13
Model 2: Verschillende intercept, verschillende helling:
Model Summary
Model R R Square
Adjusted R
Square
Std. Error of the
Estimate
1 ,688a
,474 ,461 2,56885
a. Predictors: (Constant), GDPpartnerXsize, logGDPreporter,
logDistance, logGDPpartner, Size
ANOVAb
Model Sum of Squares df Mean Square F Sig.
1 Regression 1236,962 5 247,392 37,489 ,000a
Residual 1372,594 208 6,599
Total 2609,555 213
a. Predictors: (Constant), GDPpartnerXsize, logGDPreporter, logDistance, logGDPpartner, Size
b. Dependent Variable: logExport
Coefficientsa
Model
Unstandardized Coefficients
Standardized
Coefficients
t Sig.B Std. Error Beta
1 (Constant) 20,639 9,656 2,137 ,034
logGDPpartner -1,150 ,702 -,444 -1,639 ,103
logGDPreporter 1,475 ,137 ,560 10,761 ,000
logDistance -1,653 ,174 -,569 -9,481 ,000
Size -25,375 9,691 -3,478 -2,618 ,009
GDPpartnerXsize 1,998 ,753 4,109 2,654 ,009
a. Dependent Variable: logExport
Xij = 20,639 - 1,150 Yi + 1,475 Yj 1,653 Dij 25,375 Si + 0,032 (Yi * Si)
-
7/27/2019 Opdracht Gravity
13/13
Model 3: Dezelfde intercept, dezelfde helling:
Model Summary
Model R R Square
Adjusted R
Square
Std. Error of the
Estimate
1 ,676a
,457 ,446 2,60459
a. Predictors: (Constant), GDPpartnerXsize, logGDPreporter,
logDistance, logGDPpartner
ANOVAb
Model Sum of Squares df Mean Square F Sig.
1 Regression 1191,718 4 297,929 43,917 ,000a
Residual 1417,837 209 6,784
Total 2609,555 213
a. Predictors: (Constant), GDPpartnerXsize, logGDPreporter, logDistance, logGDPpartner
b. Dependent Variable: logExport
Coefficientsa
Model
Unstandardized Coefficients
Standardized
Coefficients
t Sig.B Std. Error Beta
1 (Constant) -2,095 4,284 -,489 ,625
logGDPpartner ,538 ,281 ,208 1,915 ,057
logGDPreporter 1,459 ,139 ,554 10,506 ,000
logDistance -1,442 ,157 -,497 -9,197 ,000
GDPpartnerXsize ,032 ,053 ,065 ,594 ,553
a. Dependent Variable: logExport
Xij = -2,095 + 0,538 Yi + 1,459 Yj 1,442 Dij + 0,032 (Yi * Si)
Op basis van bovenstaande tabellen verkiezen we model omdat dit model de hoogste
adjusted R (0.868) en een lagere SER (0.61) hebben. Bovendien zijn in beide modellen 4 van
de 5 cofficinten significant op 1%-niveau, terwijl dit niet het geval is bij model 2.