案例三:时间序列分析
学习目的
通过本案例的学习,旨在使同学们达到以下几个方面的学习目标: 1、培养学习利用多种时间序列分析方法解决实际问题的能力
2. 掌握时间序列平滑方法:移动平均、加权移动平均等方法。了解这些平滑方法在处理时时序列数据时各自的优点和缺点,学会用这些方法来处理不同类型和特点的数据。
3、掌握时问序列的构成分析方法。影响时间序列的因素大体上可以分为四种,即长期趋势(T)、季节变动(s)、循环波动(c)和不规则波动(J),通过本案例的学习,学会如何将各种影响因素分别从时问序列中分离出来并用数量加以测定。
4、掌握利用模型对时间序列进行分析的方法。在假定现象未来的发展趋势能够与过去保持一致的前提下,同学们要学会利用以上建立的模型对未来进行预测。
数据文件
本案例的数据为我国1978至2006年居民收入年度数据资料。数据文件存为ExceI格式,使用时可直接点击cash3
对于本案例,可以用各种软件包括Excel、Eview、SPSS或SAS等进行分析。但我们建议使用Eview,因为这个软件在处理时间序列问题时更加方便也更为专业化。
案例分析所需统计知识
李洁明《统计学原理》(第四版)复旦大学出版社第130-168页
案例分析过程提示
首先用软件做出我国1978-2006居民收入时序图。观察数列按时间顺序变化的特点。由图中可以看出,收入有明显的向上发展趋势。在此基础上,我们可用进行以下方法进行分析。
1、对城乡居民的收入差异进行描述性分析.
文案大全
实用标准
2、时间序列平滑法。利用移动平均法对时间数列进行平滑,观察长期趋势 3、建立长期趋势模型,进行预测
需要讨论的问题
1、以上各种分析方法分别适用于什么特点的时间序列数据? 2、各种分析方法在分析过程中提供的信息有什么不同?
3、除了以上这几种时间序列分析方法之外,你还可以找到其他种类的时间序列分析方法吗?你认为还有哪种分析方法适用于本案例的数据特点?
4、利用上述案例资料以小组为单位写一分析报告,题目自拟。
附录:阅读案例
全国城镇居民收入差异的数量分析1
随着改革开放的不断深入,社会主义市场经济的进一步确立,我国城镇居民的收入普遍提高,人们生活水平明显改善。但是,在发展中另一种趋势也明显起来,即我国城镇居民收入两极分化的程度在加剧,本文试图借助计量经济学的有关理论,从全国城镇居民人均收入的差异着手讨论,通过模型从静态和动态的角度探讨城镇居民收入两极分化的形成过程、现状及发展趋势,进而讨论如何合理确定并及时调整我国城镇居民收入贫困线的标准。
一、城镇居民人均收入差异分析
几年来我国城镇居民生活有了可喜的变化,居民生活水平有了明显提高。
1990年--1996年我国城镇居民收入状况表
人均年收入 最高收入 困难户收入 人均年收入与 时间(年) (元) (元) (元) 困难户收入比例 1990 1991 1992 1993 1994 1522.79 1713.10 2032.00 2583.16 3502.31 2675. 2956.81 3663.00 4905.77 6837.81 782.93 928.86 1032.00 1239.35 1566.33 2.058 2.180 2.032 1.992 1.808 1
本案例来源:朱建平..全国城镇居民收入差异的数量分析
文案大全
实用标准
1995 1996 4288.09 4844.78 8231.31 9250.44 1984.92 2242.92 1.862 1.858 (如表)1996年我国城镇居民家庭人均年收入达到4844.78 元,比1990年增长218%,年均递增速度为21.28%,各年增长速度均超过了同期各项反项指标,如物价指数、通货膨胀指数的增长速度。可见,全国城镇居民不仅在名义货币收入上有了大幅度的提高,在实际水平上也同样实现了增长。全国困难户人均收入水平由1990年的782.93元提高到1996年的2242.92元,增长了1459.99元;最高收入户人均收入水平由1990年的2675.元提高为9250.44元,增长2.46倍。这一切都充分说明,社会主义市场经济的逐步确立,使我国城镇居民的收入水平有了明显的提高。
但是,应该看到,在全国城镇居民收入水平整体上得到提高的同时,收入的差距被拉大了。七年中,我国困难户与最高收入户居民人均年收入差异从1990年的12.71元扩大到1996年7007.52元,扩大了2.70倍。均增长速度为24.38%,超过人均收入水平的增长速度。这一结果清楚地说明:七年来全国城镇居民平均收入水平两极分化的程度加剧了。这并不是我们建立社会主义市场经济,全面振兴经济的初衷,我们不希望在国家经济明显趋好的大环境下出现更多的“穷人”,但这又是一个我们不得不接受的现实。进一步的分析我们可以看到,这种差距的拉大还伴随着收入中非工资性收入所占比重增大、灰色收入和资本收入增加的趋势。
二、我国城镇居民收入水平及差异的数量分析
在上面讨论的基上,根据19年─1997年《中国统计年鉴》的有关资料,对困难户与最高收入户居民人均年收入的差异及全国城镇居民人均年收入与困难户人均年收入比例分别进行了时间序列分析,建立模型为
CY295121.1626.33t654.32t248.45t3...........................1(7.33)(4.01)(3.73)(514.)标准差为138.63R20.9978
其中 CY─最高收入户与困难户人均年收入之差; t─时间。模型(1)均通过了总体与个体的检验显著性检验。
文案大全
实用标准
BY1831.0.056t......................................................226.653.625R20.725标准差为0.0813残差平方和为0.033
其中BY─全国城镇居民人均年收入与困难户人均年收入比例;t─时间。模型(2)虽然判定系数R= 0.725,但是个体检验相当显著,并且标准差和残差平方和都很小,这说明该比例值BY受时间变化的影响不大。
对模型(1)求二阶导数,即
d2CY1308.290.70t2dt.............................................32
令模型(3)等于零,便得到模型(1)所描述的曲线在t= 4.51处有拐点,如图所示。
上面的模型及图形清楚地表明:
1、全国城镇居民最高收入户与困难户人均年收入差距越拉越大,但是近年来,困难户人均年收入基本上是每年全国平均水平的一半。由于全国城镇居民人均年收入逐年提高,因此划分困难户的标准随之变化。由此可见,人均年收入低于全国城镇居民人均年收入一半的居民户为困难户。
2、全国城镇居民最高收入户与困难户人均年收入差距在这七年之内的变化可以分为三个阶段:第一阶段是1990年─1992年,从19年治理整顿后到1992年,收入差距拉大的速度不快;第二阶段是1992年─1994年,在1992年南巡讲话之后,全国经济出现高速发展,收入差距拉大的速度增加。由于模型
文案大全
实用标准
(1)描述的曲线在t=4.51处有拐点,那么说明在1993年中间速度最快,但从此之后,收入差距拉大的速度将趋于缓和;第三阶段是1994年─1996年,随着整个经济发展出现软着陆,全国城镇居民最高收入户与困难户人均年收入差距拉大的速度出现了缓和。
三、结论
1、随着我国城镇居民收入水平的继续提高,最高收入户与困难户人均年收入的差距进一步扩大的趋势将持续下去,这符合收入增长的“马太效应”理论,是一种正常的变动趋势。
2、城镇居民最高收入户与困难户年均收入差距扩大的速度将趋于缓和。这是全社会收入水平普遍提高,收入将逐步趋于规范化,社会再分配功能日益发挥作用的必须结果。随着城镇居民收入水平的不断提高,社会再分配手段的作用将日益增大,特别是对高收入阶层来说,将通过征收所得税的手段对其高额收入加以适当调节,使其与低收入水平的差距不致过大。另外,随着我国社会保障制度的日益完善,也能在对不同收入水平进行适度调节的前提下缩小收入差距,并提高全社会成员的生活质量。
附录:案例阅读
基于SARIMA模型的我国入境旅游人数时间序列分析
[摘要] 时间序列是一种按照时间顺序取得的一组数据,分析时间序列的常用方法为Box-Jenkins模型。Box-Jenkins模型不以经济理论为指导,依据时间序列自身结构特点建立模型,并利用外推进行预测。本文搜集了2001年1月至2007年9月的入境旅游人数,在此基础上根据Box-Jenkins建模的方法,建立了入境旅游人数带的SARIMA模型,对模型进行了适应性检验,比较了预测值与观测值的差别,证明模型是较合理的。
[关键词] 入境人数 时间序列 SARIMA模型 自相关函数 偏自相关函数
2
2
王丽英,刘后平,《基于SARIMA模型的我国入境旅游人数时间序列分析》,统计与咨询,2008(4)。
文案大全
实用标准
一、 关于本文时间序列模型的说明
时间序列是一种是按照时间顺序取得的一组数据,大多数的时间序列存在惯性,通过对这种惯性的分析就可以由现在值和过去值对未来值进行预测。时间序列分析是一种根据动态数据揭示系统动态结构和规律的统计方法,其基本思想是根据随机的时间序列建立能够比较精确的反映时间序列中所包含的动态依存关系的数学模型,并借以对未来进行预测。
分析时间序列的方法很多,本文主要讨论Box-Jenkins模型。Box-Jenkins模型不以经济理论为指导,依据时间序列自身结构特点建立模型,并利用外推进行预测。建立时间序列模型的前提条件时如果时间序列是平稳的,就可以用ARMA模型来刻划它。但通常经济时间序列都存在一定的趋势,是不平稳的时间序列,不能直接建立ARMA(p,q)模型,这时差分运算就是一种较好的处理方式,许多非平稳的时间序列差分后会显示出平稳序列的性质,我们称这个非平稳序列为差分平稳序列。对差分平稳序列可以使用ARIMA模型进行拟合。
ARIMA(p,d,q)模型称为求和自回归移动平均模型。其基本结构为
(B)dxt(B)t2E(t)0,Var(t),E(ts)0,st Ex0,stst式中:dXt1B B为滞后算子
d(B)11B2B2自回归系数。
pBp为平稳可逆ARMA(p,q)模型的
(B)11B2B2和移动平滑系数多项式
qBq为平稳可逆的ARMA(p,q)模型
p,d,q分别表示自回归阶数、差分阶数、移动平均阶数
当d0时,ARIMA(p,d,q)模型就是ARMA(p,q)模型。 当p=0时, ARIMA(p,d,q)模型可以简记为IMA(d,q)模型 当q=0时,ARIMA(p,d,q)模型可以简记为ARI(p,d)模型
ARIMA模型可以对具有季节效应的序列建模。乘积季节模型是随机模型与ARIMA
文案大全
实用标准
模型的结合,其形式为:
DdSxt(B)S(B)
(B)S(B)t式中:
D为周期步长,d为提取趋势信息所用的差分阶数
{t}为白噪声序列。
(B)11B2B2s(B)11Bs2B2s(B)11B2B2s(B)11Bs2B2spBp pBPs qBq qBQs
该模型简记为ARIMA(p,d,q)×(P,D,Q) 二、我国入境旅游人数SARIMA模型的建立
自从改革开放以来,我国的旅游事业蓬勃发展,入境旅游人数逐年递增。本文选取了2001年1月至2007年9月入境旅游人数共81个数据,我们利用2001年1月至2007年6月数据进行建模,为检验模型的效果,将2007年7月至9月的3个观测值留意出,作为评价预测精度的参照对象。数据的分析与处理均采用Eviews3.1软件。
表1 200年1月至2007年9月入境旅游人数(单位:万人)
时间 1月 2月 3月 4月 5月 6月 7月 8月 9月 10月 11月 12月 2001 717.38 611.6 753.26 779.7 707.87 711.8 745.4 809.1 741 758 750 815 2002 740.7 711 839.54 807.77 787.92 795.8 849.4 0.7 865 870 842 866 2003 848.43 737.6 785.13 5.92 543.83 652.6 776.9 884.4 808 855 828 877 2004 808.73 753.3 855.16 954.71 877.47 3.4 959 971.6 917 988 935 990 2005 938.06 855.1 1027.8 1024.8 995.14 9.4 1076 1067 9 1055 991 1018 2006 998.85 871.4 2007 1003 1097.1 1002.4 1000 1090 1115 1044 1138 1042 1093 1023 933.1 10.8 1151.7 1072.6 1067 1149 1157 1123 数据来源:http://www.cnta.gov.cn/wyzl/more.asp?newsid=004001。2003年3-5月
文案大全
实用标准
数据是作者根据资料推算。
(一)数据的平稳性及正态性检验
Box-Jenkins时序建模是基于平稳时间序列,因此首先检验数据的平稳性。 1、绘制观察值序列时序图
120010008006004000102030405RJRS0607图1: 入境旅游人数序列时序图
时序图显示该序列随时间的推移具有明显的递增趋势,又含有周期为12个月的季节波动。
2、图2为根据中国入境旅游人数所作的自相关及偏自相关分析图。从自相关图中可以发现,自相关系数衰减很慢,没有很快衰减到零,因此,该序列含有一定的趋势性。
文案大全
实用标准
图2:入境旅游人数的自相关分析图
3、正态性检验
Normal Q-Q Plot of 入境人数1300120011001000900800700600500400600800100012001400Expected Normal ValueObserved Value 图3:Q-Q图
从Q-Q图中我们可知该序列具有正态性 (二)数据的预处理和模型的识别
为了消除异方差,对原数列作对数处理得数列lnrjrs,为消除数列的趋性,对lnrjrs做一阶差分,得到序列dlnrjrs, 其时序图和自相关和偏见自相关图如图4-5。
文案大全
实用标准
0.040.020.00-0.02-0.04-0.0601020304050607DLNRJRS
图4:序列dlnrjrs的时序图
图5:dlnrjrs的自相关和偏自相关图
从图4中可以看出,作对数差分后的序列dlnrjrs,其均值在零点附近,原序列的线性递增趋势已被基本消除,该序列是平稳的。从图5 中发现,当滞后期K=12时,该序列的自相关系数和偏见自相关系数与零有显著差异,这表明序列具有周期为12个月的季节波动。对序列进行二阶季节差分后发现季节性并没有得到改善,故只做一阶季节差分。
经过对数一阶差分,序列的递增趋势基本消除,故d=1,自相关系数和偏见
文案大全
实用标准
自相关系数均显示出不截尾的性质,同时存在明显的季节效应,可考虑建立乘积季节效应模型(p,d,q)×(P,D,Q),由于实际建模时常用高阶的AR模型代替相应的MA和ARMA。综合考虑,可供选取择的 (p,q) 组合有:(1,1);(2,2)(2,0), (3,0),由于k=12,样本自相关系数和偏自相关系数显著不为0,故P=Q=1。由于是对对数一阶差分建模,我们选择不带截距项的模型
(三)模型的选择及参数估计 将四个模型的相关检验汇入表2。 表2 各模型的检验结果
模型
R2
R
2AIC SC -2.5371
参数显著性检验((0.05)
(1,1,1)(1,1,1)120.5700 0.5485 -2.6720
1,1没有通过显著性检验
(2,1,2)(1,1,1)120.5704 0.5327 -2.17
-2.4376
2没有通过显著性检验
(2,1,0)(1,1,1)120.1414 0.1046 -2.0603
-1.9357
1,2没有通过显著性检验
(2,1,1)(1,1,1)120.5684 0.5385 -2.6686
-2.4985
1,1没有通过显著性检验
(3,1,0)(1,1,1)120.5684 0.5385 -2.6686
-2.4985
1,2,3没有通过显著性检验
从表2中可见,几个模型的AIC和SC均差别不大,其调整后的决定系数除模型三外其余均在0.56附近。综合考虑可选择模型二进行优化,由于2不显著,剔除AR(2)重新进行估计。其估计结果1,1,2均不显著,经反复方试验,我们认为虽然模型二的2没有通过检验,但其拟合效果是最优的,因此选择
(2,1,2)(11,1,12)作为估计模型,其估计参数如下:
表3:参数估计表
Variable
CoefficienStd. Error t-Statistic
Prob.
文案大全
实用标准
t
AR(2) AR(1) SAR(12) MA(2) MA(1) SMA(12)
R-squared
Adjusted R-squared S.E. of regression
0.071598 0.5884 0.9082 -0.409399 -0.576354 -0.723997
0.132091 0.143429 0.056763
0.542037 4.0020 15.83922
0.59 0.0001 0.0000 0.0000 0.0000 0.0000 0.003801 0.090305 -2.1709
0.082450 -4.965417 0.082410 -6.993736 0.127404 -5.682706
0.570418 Mean dependent var 0.532736 S.D. dependent var 0.061730 Akaike info
criterion
Sum squared resid Log likelihood
0.217202 Schwarz criterion .21383 Durbin-Watson stat
-2.437601 2.020444
模型的调整可决系数为0.5704,AIC为-2.17,SC为-2.4376,除2外,各系数均通过显著性检验。因此可以认为不带截距项的ARIMA(2,1,2)(1,1,1)12模型更适合。其估计方程如下:
(10.57B0.0409B2)(10.7240B12)12dlnrjrst 122(10.91B)(10.5865B0.071598B)(四)模型的检验
对所建立的模型进行适应性检验,即对模型的残差序列t的性检验。
文案大全
实用标准
图6:残差的自相关及偏自相关图
通过直接观察残差序列的自相关和偏见相关分析图,其自相关系数和偏见自相关系数都落入随机区间,故认为与0无明显差异,表明残差序列是的。从拟合效果图中可以看出拟合效果较好。
0.20.0-0.2-0.40.20.10.0-0.1-0.2-0.3-0.420032004Residual2005Actual20062007Fitted
图7:dlnrjrs序列拟合效果图
(五)模型预测
利用Eviews软件,对原序列进行预测并作图(虚线表示预测值)。通过与实际值对比,二者基本吻合,这表示模型拟合效果良好。
文案大全
实用标准
1200100080060040001020304RJRS05RJRSF0607
图8:序列rjrs的观测值与预测值对比图
(五)结论
根据上述分析,证明我们建立的乘积季节模型是正确的,此模型可以为我国入境旅游人数的预测提供一些参考。
参考文献:
[1] 周雁.中国民航货的时间序列模型[J] .成都理工大学学报(自然科学版)2005.8 [2]刘颖,张智慧.中国人均GDP(1952-2002)时间序列分析[J].统计与决策.2005.2(下) [3]徐旭.基于ARMA模型的我国第三产业总产值时间序列分析[J].价值工程.2006.8 [4] 高铁梅.计量经济分析方法与建模Eviews应用及实例[M].北京:清华大学出版社.2006
[5] 张晓峒.计量经济学软件Eviews使用指南[M].天津:南开大学出版社.2004 [6]王燕.应用时间序列分析[M].北京:中国人民大学出版社.2005
[7] Edwards D. Introduction to graphical modeling [M] .New York: Springer, 2000 [8] Pearl J. Causality: Models, Reasoning and Inference [M] .UK: Cambridge, 2000
文案大全
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- 7swz.com 版权所有 赣ICP备2024042798号-8
违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务