2024年3月3日发(作者:)
_
用Eviews软件建立一元线性回归模型并进行相关检验的实验报告
1.数据
表1列出了某年中国部分省市城镇居民每个家庭平均全年可支配收入X与消费性支出Y的统计数据。
地区
北京
天津
河北
山西
内蒙古
辽宁
吉林
黑龙江
上海
江苏
浙江
山东
河南
湖北
湖南
广东
陕西
可支配收入X
10349.69
8140.50
5661.16
4724.11
5129.05
5357.79
4810.00
4912.88
11718.01
6800.23
9270.16
6489.97
4766.26
5524.54
6218.73
9761.57
5124.24
消费性支出Y
8493.49
6121.04
4348.47
3941.87
3927.75
4356.06
4020.87
3824.44
8868.19
5323.18
7020.22
5022.00
3830.71
4644.50
5218.79
8016.91
4276.67
_
甘肃
青海
新疆
4916.25
5169.96
5644.86
表1
4126.47
4185.73
4422.93
2.建立模型
应用EViews软件,以表1的数据可绘出可支配收入X与消费性支出Y的散点图(图2-1)。从该三点图可以看出,随着可支配收入的增加,消费性支出也在增加,大致程线性关系。据此,我们可以建立一元线性回归模型:
Y=β0+β1·X+μ
9,0008,0007,0006,000Y5,0004,0003,0004,0006,0008,000X10,00012,000
图2-1
对模型作普通最小二乘法估计,在Eviews软件下,OLS的估计结果如图(2-2)所示。
Dependent Variable: Y
Method: Least Squares
Date: 12/07/11 Time: 21:00
Sample: 1 20
Included observations: 20
_
Variable
X
C
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
Coefficient Std. Error
0.755368
271.1197
0.983198
0.982265
216.4435
843260.4
-134.8718
1053.318
0.000000
0.023274
159.3800
t-Statistic
32.45486
1.701090
Prob.
0.0000
0.1061
5199.515
1625.275
13.68718
13.78675
13.70661
1.302512
Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat
图2-2
OLS估计结果为
^Y=271.12+0.76X
(1.70) (32.45)
R2=0.9832 D.W. =1.3025 F=1053.318
3.模型检验
从回归估计的结果看,模型拟合较好。可绝系数R2=0.983198,表明城镇居民每个家庭平均全年消费性支出变化的98.3198%可由可支配收的变化来解释。从斜率项β1的t检验看,大于5%显著性水平下自由度为n-2=18的临界值t0.025(18)=2.101,且该斜率值满足0<0.755368<1,符合经济理论中边际消费倾向在0与之间的绝对收入假说,表明中国城镇居民平均全年可支配收入每增加1元,消费性支出增加0.755368元。
4.预测
假设我们需要关注2012年平均年可支配收入在20000元这一水平下的中国城镇居民平均年消费支出问题。由上述回归方程可得该类家庭人均消费支出的预测值:
Y0=271.1197+0.755368×20000=15378.4797
下面给出该类居民平均年消费支出95%置信度的预测区间。
^
_
由于平均可支配收入X的样本均值与样本方差为E(X)=6222.209 Var(X)=1994.033
于是,在95%的置信度下,E(Y0) 的预测区间为 (874.28,16041.68)。
而如果我们想知道某地区城镇居民年均可支配收入为20000元时,该居民消费支出的个值预测,则仍为15378.4797。同样地,在95%的置信度下,该居民年均消费支出的预测区间为(14581.14,16175.82)。
5.异方差性检验
对于经济发达地区和经济落后地区,消费支出的决定因素不一定相同甚至差异很大,比如经济越落后储蓄率反而会越高,可能就会出现异方差性的问题。
(1)G-Q检验
在对20个样本按X从大到小排序,去掉中间4个,对前后两个样本进行OLS估计,样本容量为n1=n2=8。
前一个样本的OLS估计结果如图5-1所示。
Dependent Variable: Y
Method: Least Squares
Date: 12/07/11 Time: 22:21
Sample: 1 8
Included observations: 8
Variable
X
C
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
Coefficient
0.762141
210.9340
Std. Error
0.060187
529.3998
t-Statistic
12.66299
0.398440
Prob.
0.0000
0.7041
6760.478
1556.814
14.58280
14.60266
14.44885
1.720479
0.963932 Mean dependent var
0.957920 S.D. dependent var
319.3541 Akaike info criterion
611922.2 Schwarz criterion
-56.33118 Hannan-Quinn criter.
160.3514 Durbin-Watson stat
0.000015
图5-1
后一个样本的OLS估计结果如图5-2所示。
_
Dependent Variable: Y
Method: Least Squares
Date: 12/07/11 Time: 22:26
Sample: 1 8
Included observations: 8
Variable
X
C
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
Coefficient
0.554126
1277.161
Std. Error
0.311432
1540.604
t-Statistic
1.779287
0.829000
Prob.
0.1255
0.4388
4016.814
166.1712
13.00666
13.02652
12.87271
3.004532
0.345397 Mean dependent var
0.236296 S.D. dependent var
145.2172 Akaike info criterion
126528.3 Schwarz criterion
-50.02663 Hannan-Quinn criter.
3.165861 Durbin-Watson stat
0.125501
图5-2
于是得到如下F统计量:
F=RSS1/(811)611922.2/6==4.84
RSS2/(811)126528.3/6在5%的显著性水平下,自由度为(6,6)的F分布的临界值为F0.05(6,6)=4.28。所以,拒绝无异方差性假设,表明原模型存在异方差。
(2)怀特检验
记e~2对原始模型进行普通最小二乘回归得到的残差平方项,将其与X及X2作辅助回归,得到结果如图5-3所示。
Heteroskedasticity Test: Breusch-Pagan-Godfrey
F-statistic
14.50681 Prob. F(2,17)
0.0002
0.0018
0.0631
Obs*R-squared
Scaled explained SS
Test Equation:
12.61088 Prob. Chi-Square(2)
5.525171 Prob. Chi-Square(2)
Dependent Variable: RESID^2
Method: Least Squares
Date: 12/09/11 Time: 19:30
_
Sample: 1 20
Included observations: 20
Variable
C
X
X^2
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
Coefficient
-176606.0
48.22291
-0.002044
Std. Error
102909.4
28.82429
0.001840
t-Statistic
-1.716130
1.672996
-1.111001
Prob.
0.1043
0.1126
0.2820
42163.02
44992.75
23.51937
23.66873
23.54853
0.982684
0.630544 Mean dependent var
0.587079 S.D. dependent var
28911.87 Akaike info criterion
1.42E+10 Schwarz criterion
-232.1937 Hannan-Quinn criter.
14.50681 Durbin-Watson stat
0.000211
图5-3
e~2
=–176606.0+48.22X–0.002044 X2
(–1.716) (1.673) (-1.111)
R2=0.6305
怀特统计量nR2=20×0.6305=12.61,该值大于5%显著性水平下、自由度为2的2 分布的相应临界值20.05= 5.99,因此,拒绝同方差的原假设。
(3)采用加权最小二乘法对原模型进行回归
为了寻找适当的权,作lne2关于OLS回归,结果如图5-4所示。
Dependent Variable: LOG(E^2)
Method: Least Squares
Date: 12/09/11 Time: 20:07
Sample: 1 20
Included observations: 20
Variable
X
C
R-squared
Adjusted R-squared
S.E. of regression
Coefficient
0.000459
6.829297
Std. Error
0.000165
1.128582
t-Statistic
2.786510
6.051218
Prob.
0.0122
0.0000
9.825601
1.784758
3.786518
0.301368 Mean dependent var
0.262555 S.D. dependent var
1.532654 Akaike info criterion
_
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
42.28250 Schwarz criterion
-35.86518 Hannan-Quinn criter.
7.764640 Durbin-Watson stat
0.012184
图5-4
3.886091
3.805956
2.216470
结果为:
lne2=6.829297+0.000459X
(6.0512) (2.7865)
R2=0.3014
于是,可生成权序列wi=1/exp(6.8292970.000459X)。对原模型进行加权最小二乘估计得到如图5-5所示。
Dependent Variable: Y
Method: Least Squares
Date: 12/09/11 Time: 20:25
Sample: 1 20
Included observations: 20
Weighting series: W
Variable
X
C
R-squared
Coefficient
0.740255
357.8106
Std. Error
0.035669
197.5751
t-Statistic
20.75368
1.811010
Prob.
0.0000
0.0869
4650.593
881.0317
13.22677
13.32634
13.24620
1.556017
5199.515
1625.275
865848.5
Weighted Statistics
0.959885 Mean dependent var
0.957657 S.D. dependent var
171.9364 Akaike info criterion
532118.2 Schwarz criterion
-130.2677 Hannan-Quinn criter.
430.7153 Durbin-Watson stat
0.000000
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
R-squared
Adjusted R-squared
S.E. of regression
Durbin-Watson stat
Unweighted Statistics
0.982748 Mean dependent var
0.981790 S.D. dependent var
219.3233 Sum squared resid
1.309635
_
图5-5
对原模型进行加权最小二乘估计(WLS)得到
^Y=357.81+0.74X
(1.811) (20.754)
R2=0.9599 D.W. =1.556 F=430.715
可以看出,与不加权的OLS相比,加权最小二乘估计使得X前的参数值略有下降,说明可支配收入对消费支出的影响被略微高估了,标准差增大了,说明OLS估计低估了X对应参数的标准差。
下面women检验是否加权的回归模型已不存在异方差性。记经wi加权的回归模型为
wY=β0w+β1X+μ*
该模型的普通最小二乘回归结果为
wY=357.81w+0.74wX
记该回归模型的残差估计的平方为e2*,将其与w,wX及其平方项作辅助回归,得
^e2*=-5519.69+
19027339w-50471wX-805000000w2-28.998(wX)2
(-1.42) (1.36) (-1.12) (-1.36) (20.42)
R2=0.153
怀特统计量nR2=20×0.153=0.306,该值小于5%显著性水平下、自由度为4的2 分布的相应临界值20.05=9.49,因此,不拒绝同方差的原假设。
(4)异方差稳健标准误法进行修正
异方差稳健标准误法修正的结果如图5-6所示
Dependent Variable: Y
Method: Least Squares
_
Date: 12/09/11 Time: 21:19
Sample: 1 20
Included observations: 20
Variable
X
C
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
Coefficient
0.755368
271.1197
Std. Error
0.031596
181.5470
t-Statistic
23.90741
1.493386
Prob.
0.0000
0.1527
5199.515
1625.275
13.68718
13.78675
13.70661
1.302512
White Heteroskedasticity-Consistent Standard Errors & Covariance
0.983198 Mean dependent var
0.982265 S.D. dependent var
216.4435 Akaike info criterion
843260.4 Schwarz criterion
-134.8718 Hannan-Quinn criter.
1053.318 Durbin-Watson stat
0.000000
图5-6
异方差稳健标准误法修正的结果为
Y=271.12+0.7554X
(1.493) (23.907)
R2=0.9832 D.W. =1.3025 F=1053.38
可以看出,估计的参数与OLS相比较,结果几乎相同,只是改变了标准差,标准差变大,从而t检验值变小。
^6.序列相关性检验
(1) D.W.检验法
在Eviews软件下,根据图2-2的OLS估计结果,D.W.值为1.3025,大于显著性水平为5%下,样本容量为20的D.W.分布的下限临界值dL=1.20,小于上限临界值dU=1.41,所以D.W.检验法不能确定该模型是否存在一阶自相关性。
(2)拉格朗日成数检验(LM)检验
在Eviews软件下,含1阶滞后残差项的LM检验如图6-1所示。
_
Breusch-Godfrey Serial Correlation LM Test:
F-statistic
1.097067 Prob. F(1,17)
0.3096
0.2709
Prob.
0.9870
0.9945
0.3096
-4.11E-13
210.6707
13.72464
13.87400
13.75380
1.796899
Obs*R-squared
Test Equation:
1.212426 Prob. Chi-Square(1)
Std. Error
0.023215
158.9555
0.236961
t-Statistic
-0.016491
0.006959
1.047410
Dependent Variable: RESID
Method: Least Squares
Date: 12/11/11 Time: 14:33
Sample: 1 20
Included observations: 20
Presample missing value lagged residuals set to zero.
Variable
X
C
RESID(-1)
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
Coefficient
-0.000383
1.106239
0.248195
0.060621 Mean dependent var
-0.049894 S.D. dependent var
215.8623 Akaike info criterion
792140.9 Schwarz criterion
-134.2464 Hannan-Quinn criter.
0.548534 Durbin-Watson stat
0.587687
图6-1
含1阶滞后残差项的辅助回归为
et
=1.106–0.000383X+0.248et-1
(0.00696) (-0.0165) (1.0474)
R2=0.0606
于是,LM=20×0.0606=1.212,该值小于显著性水平为5%、自由度为1的2 分布的相应临界值20.05(1)=3.84,由此判断原模型不存在1阶序列相关性。
所以,原模型没有违背随机扰动项的不序列相关性的假设。
~~
_
发布者:admin,转转请注明出处:http://www.yc00.com/news/1709448800a1627654.html
评论列表(0条)