投资额与生产总值和物价指数
投资额与生产总值和物价指数
问题
为研究某地区实际投资额与国民生产总值(GNP)及物价指数的关系,收集了该地区连续32年的统计数据(见表1),目的是由这些数据建立一个投资额的模型,根据对未来国民生产总值及物价指数的估计,预测未来的实际投资额。
表1的数据是以时间为序的,称时间序列数据。由于投资额、国民生产总值、物价指数等许多经济变量均有一定的滞后性,比如,前期的投资额对后期投资额一般有明显的影响。因此,在这样的时间序列数据中,同一变量的顺序观测值之间的出现相关现象(称自相关)是很自然的。然而,一旦数据中存在这种自相关序列,如果仍采用普通的回归模型直接处理,将会出现不良后果,其预测也会失去意义,为此,我们必须诊断数据是否存在自相关,如果存在,就要考虑自相关关系,建立新的回归模型。
年份序号 投资额 国民生产总值 物价指数
1 90.9 596.7 0.7167
2 94.7 621.2 0.7199
3 97.4 637.7 0.7277
4 106.5 651.8 0.7311
5 113.5 691.1 0.7436
6 120.4 722.6 0.7564
7 125.7 756.0 0.7676
8 122.8 799.0 0.7906
9 133.3 873.4 0.8254
10 140.8 887.8 0.8456
11 149.3 944.0 0.8679
12 144.2 992.7 0.9145
13 150.6 1045.9 0.9355
14 166.4 1077.6 0.9601
15 178.5 1100.7 0.9734
16 195.0 1185.9 1.0000
17 211.3 1206.4 1.0214
18 229.8 1326.4 1.0575
19 228.7 1434.2 1.1508
20 206.1 1549.2 1.2579
21 236.4 1623.8 1.2847
22 257.9 1718.0 1.3234
23 274.6 1828.6 1.3566
24 324.1 1918.3 1.4005
25 355.6 2054.9 1.4526
26 386.6 2163.9 1.5042
27 423.0 2417.8 1.6342
28 401.9 2631.7 1.7842
29 432.5 2865.3 1.7905
30 451.3 2789.6 1.8102
31 474.9 2954.7 1.9514
32 424.5 3073.0 2.0688
表1 某地区实际投资额(亿元)与国民生产总值(亿元)及物价指数数据
基本的回归模型建立
一、多重共线性检验
1.建立普通的回归模型。
记该地区第年的投资额为, 国民生产总值为,物价指数为(以第十六年的物价指数为基准,基准值为1),=1,2,…,n(=32)。
从表1中可以看出,随着国民生产总值的增加,投资额增大,而且两者有很强的线性关系,物价指数与投资额的关系也类似,因此可建立多元线性回归模型:
(1)
模型(1)中除了国民生产总值和物价指数外,影响的其他因素的作用都包含在随机误差项内,这里的假设(对)相互独立,且服从均值为零的正态分布=1,2,…,n(=32)。
(表2 ) 利用Eviews 对参数作OLS估计,输出回归结果:
Dependent Variable: Y
Method: Least Squares
Date: 06/07/04 Time: 22:32
Sample: 1 32
Included observations: 32
Variable Coefficient Std. Error t-Statistic Prob.
C 134.7327 44.65210 3.017387 0.0053
X1 0.333545 0.059365 5.618509 0.0000
X2 -339.0047 113.1687 -2.995569 0.0056
R-squared 0.978445 Mean dependent var 232.7875
Adjusted R-squared 0.976958 S.D. dependent var 123.2718
S.E. of regression 18.71213 Akaike info criterion 8.785281
Sum squared resid 10154.17 Schwarz criterion 8.922694
Log likelihood -137.5645 F-statistic 658.1864
Durbin-Watson stat 1.216500 Prob(F-statistic) 0.000000
将上述回归结果整理如下:
参数估计值
将参数估计值代入(1)得到
(2)
(3.0174) (5.6185) (-2.9956)
2.分析。
由 (显著性水平=0.05),表明模型从整体上看投资额和解释变量间线性关系显著。
3.检验
(表3)
1.000000 0.997349
0.997349 1.000000
由表3可以看出,解释变量之间存在高度线性相关。
4.修正(逐步回归法)
(1)用OLS方法逐一求出对各个解释变量的回归。
A.经分析在两个一元回归模型中投资额对国民生产总值的线性关系强,拟合程度较好,即
(0.3360) (32.1384)
B.将解释变量代入上式,得
(3.0174) (5.6185) (-2.9956)
(2)由上式中可知,,截距项对的影响都比较显著,虽然和 间存在共线性但它们之间的共线性对模型的影响不是很显著,对和的回归模型已为最优,所以保留原模型中的所有变量,得如下模型:
异方差检验:
用OLS估计法估计参数(见表2)。
异方差检验:
(1)图示法。
E2为残差的平方,由GNER命令生成。(见图1,图2)
(图1)
(图2)结论:由上图可以看出,X1与E2;X2与E2关系并不十分密切,可以初步判断该模型可能不存在异方差。
(2)Goldfeld-Quandt检验。
将各数据按解释变量的大小顺序排列,然后将排列在中间的8个数据删除掉,余下的数据分为两个部分。
在Sample菜单里,将时间定义为1—12,然后用OLS方法求得下列结果:
(3.0797) (5.2902) (-2.8977)
由以上回归可以看出为147.2631
再在Sample菜单里将将时间定义为21-32,然后用OLS方法求得下列结果:
(1.9904) (3.1741) (-1.7901)
由以上结果可以看出为7200.177
求F统计量:,
查F统计表,给定显著性水平为0.05,得临界值,比较,则拒绝,表明随机误差显著的存在异方差。
(3)ARCH检验。
设ARCH检验过程的阶数p=3,运用OLS方法对残差平方E2进行辅助回归,输出的结果为:
Dependent Variable: E2
Method: Least Squares
Date: 06/09/04 Time: 12:37
Sample(adjusted): 4 32
Included observations: 29 after adjusting endpoints
Variable Coefficient Std. Error t-Statistic Prob.
C 140.4022 120.6048 1.164151 0.2554
E2(-1) -0.103031 0.179031 -0.575493 0.5701
E2(-2) 0.256704 0.168178 1.526386 0.1395
E2(-3) 0.542445 0.178434 3.040031 0.0055
R-squared 0.347635 Mean dependent var 349.4096
Adjusted R-squared 0.269352 S.D. dependent var 603.9755
S.E. of regression 516.2660 Akaike info criterion 15.45856
Sum squared resid 6663264. Schwarz criterion 15.64716
Log likelihood -220.1492 F-statistic 4.440711
Durbin-Watson stat 1.820320 Prob(F-statistic) 0.012385
从输出的辅助回归函数中得到,从而可以计算出:
,查分布表,给定,自由度为P=3,得临界值
因为,所以拒绝,表明模型中随机误差项存在异方差。
异方差修正
模型对数变换
对于变量和,分别用和取代,则有
(3)
并对其使用OLS得到以下结果:
(表4)
Dependent Variable: LY
Method: Least Squares
Date: 06/08/04 Time: 15:25
Sample: 1 32
Included observations: 32
Variable Coefficient Std. Error t-Statistic Prob.
LX1 1.571511 0.244229 6.434575 0.0000
LX2 -0.888841 0.378298 -2.349579 0.0258
C -5.859048 1.714789 -3.416775 0.0019
R-squared 0.984995 Mean dependent var 5.316077
Adjusted R-squared 0.983960 S.D. dependent var 0.526034
S.E. of regression 0.066621 Akaike info criterion -2.490531
Sum squared resid 0.128713 Schwarz criterion -2.353118
Log likelihood 42.84850 F-statistic 951.8544
Durbin-Watson stat 0.934445 Prob(F-statistic) 0.000000
可以知道通过对数变换后,数值之间的.异方差大大的变小,又由检验结果的拟合度可以知道,该模型拟合效果很好。
三、自相关检验:
1.用OLS估计方法求模型(3)的参数估计
(3)
从表4可以得到以下估计值
从回归结果看,基本模型(3)的拟合度非常之高,应该是很满意了。但是,这个模型并没有考虑到我们的数据是一个时间序列。实际上,在对时间序列数据作回归分析时,模型的随机误差项有可能存在相关性,违背了模型关于(对时间t)相互独立的基本假设。如在投资额模型中,国民生产总值和物价指数之外的因素(比如政策等因素)对投资额的影响包含在随机误差项中,如果它的影响成为的主要部分,则由于政策等因素的连续性,它们对投资额的影响也有时间上的延续,即随即误差项可能会出现(自)相关性。
2.自相关性的诊断与模型的改进
(1)图示法。
残差可以作为随即误差项的估计值,运用Eviews可以直接得到模型(2)的残差,同时画出了 的散点图,能够从直观上判断的自相关性。(见图3)
图3 的散点图
从图3中可以看出残差呈线性自回归,表明随即误差项存在自相关。
(2)DW检验。
根据表4估计结果,由DW=0.9344,给定显著性水平,查Durbin-Watson表,n=32,k’(解释变量个数)=2,得下限临界值,上限临界值,因为DW统计量为0.9344<。根据判定区域知,这时随机误差项存在正的自相关。
相关的修正。
广义差分法。
由DW=0.9344,根据,计算出
GENR DY=LY-0.5328*LY(-1)
GENR DX1=LX1-0.5328*LX1(-1)
GENR DX2=LX2-0.5328*LX2(-1)
(表5)
Dependent Variable: DY
Method: Least Squares
Date: 06/08/04 Time: 18:57
Sample(adjusted): 2 32
Included observations: 31 after adjusting endpoints
Variable Coefficient Std. Error t-Statistic Prob.
C -3.602601 1.125913 -3.199715 0.0034
DX1 1.834636 0.342573 5.355460 0.0000
DX2 -1.299823 0.509904 -2.549152 0.0166
R-squared 0.948592 Mean dependent var 2.522311
Adjusted R-squared 0.944920 S.D. dependent var 0.242080
S.E. of regression 0.056814 Akaike info criterion -2.806297
Sum squared resid 0.090380 Schwarz criterion -2.667524
Log likelihood 46.49760 F-statistic 258.3306
Durbin-Watson stat 1.665688 Prob(F-statistic) 0.000000
然后再用OLS方法估计其参数,结果为:
(4)
(-3.1997) (5.3555) (-2.5492)
这是我们发现经用广义差分法后,DW值有明显的提高,DW=1.6657与上述的相比,已经不存在自相关。
模型的分析
我们进行了一系列检验和修正后的最终结果如下:
(4)
(-3.1997) (5.3555) (-2.5492)
从模型中可看出:
DX2不符合经济意义的检验(参数的大小及符号)。因为从经济意义上讲,投资额应随国民生产总值的增加而增加,随物价指数的增加而增加,即DX2的系数应为正值。
由上述分析可知,我们的模型并不成功。
总结:
综上所述,对带有滞后性的经济规律的时间序列数据,我们采用时间序列数据拟合的模型不能成功的反映投资额与各影响因素间的数量关系,是一个失败的模型。我们做了仔细分析,认为可能主要是出于以下几种原因:
(1)由于我们引入的时间序列数据带有滞后性,从而带来多重共线性问题。在修正多重共线性当中,我们采用了逐步回归法,也即剔除变量法,但是因为我们的投资模型只有两个解释变量,修正多重共线性会使得我们的解释变量被大部分剔除,因而导致我们的修正无效。
(2)我们在模型中所做的假定不合理。在投资额模型中,国民生产总值和物价指数之外的因素(比如政策等因素)对投资额的影响包含在随机误差项中。然而在实体经济中,很多变量对于投资额都有影响,不可能全都包括在随机误差项中,而这些重要变量在我们的模型中被忽略掉了。可能正是由于我们对这些重要因素所不得不作出的忽略,导致了模型的失败。
(3)由于我国的统计数据含有一定的水分,而导致了我们赖以进行参数估计的数字基础不具备可靠性,可能也是重要原因之一。
【投资额与生产总值和物价指数】相关文章: