基于多元线性回归分析餐饮业营业收入的影响因素
一、导论
餐饮业是国民经济的一个重要产业,“民以食为天\"。开门七件事,“柴米油盐酱醋茶\",件件事与吃有关。在现代社会,很难想象,没有餐饮业,社会将会是怎样。鉴于餐饮业在国民经济中有如此重要的作用,我尝试通过经济学的方法来分析一下影响餐饮业的因素,并期望为我国餐饮业健康发展思路提供一定基础。 餐饮业营业收入是衡量餐饮业发展水平的重要指标,本文着重研究影响餐饮业营业收入的因素来考察制约餐饮业发展的关键所在.
假定除我们考虑到的因素外,其他因素对餐饮业营业收入的影响可以忽略.有效的餐饮需求:指城乡居民愿意并能够消费的餐饮产品总和。 这里:①GDP:可以认为影响着餐饮业营业收入的总水平; ② 人均GDP:也可以认为影响着餐饮业营业收入的总水平,但这里我考虑到人口因素的影响;③ 从业人数:对餐饮业营业收入也有影响;④ 企业数:企业数越多,营业收入也会越高; ⑤城乡居民人民币储蓄存款余额:可以反映我国城乡居民的餐饮消费能力。
二、模型建立
根据经济学理论把模型设定为:
其中:Y 代表餐饮业营业收入2013(单位亿元)
X1代表GDP(单位亿元) X2代表从业人数(单位万人) X3代表企业数(单位个)
X4代表城乡居民人民币储蓄存款余额(单位亿元) X5 代表人口(单位万人) 数据如下:
北京市 天津市 河北省 山西省 内蒙古自治区 餐饮业营业额(亿元) 520.7 103。6 45.2 75 65.5 Gdp(亿元) 19800。81 14442.01 28442。95 12665。25 16916.5 餐饮业企餐饮业从业法人个业人数数(个) (人) 1822 423 467 568 427 233518 57577 40007 67599 36128 城乡居民人口 人民存款(万人) 余额(亿元) 23086。4 2115 7612.3 1472 23357.2 7333 13339。4 3630 2498 7455.2 辽宁省 吉林省 黑龙江省 上海市 江苏省 浙江省 安徽省 福建省 江西省 山东省 河南省 湖北省 湖南省 广东省 广西壮族自治区 海南省 重庆市 四川省 贵州省 云南省 自治区 陕西省 甘肃省 青海省 宁夏回族自治区 维吾尔自治区 142。7 20。2 24.6 469.5 399。5 261 100.1 158。9 31。8 335。9 150.4 225.8 109.3 604.1 32 10。4 163 231.3 21.1 49.6 0。9 27213.22 13046。4 14454.91 21818。15 59753。37 37756.59 19229.34 21868。49 14410。19 55230.32 32191.3 24791.83 24621.67 62474.79 14449.9 3177。56 12783。26 26392.07 8086。86 11832.31 815。67 715 162 210 1638 2402 1506 1032 797 241 2430 1374 1861 587 2883 303 84 1015 1611 304 360 13 958 346 37 90 77 46528 11016 15924 216755 228531 136523 72848 76123 25778 156808 777 126525 58591 337224 30456 19659.5 7745。3 10058.6 20486.3 33823。9 223 12924。9 11847。3 9725.2 29796.1 20232。1 15507 14539。7 491.3 9118.9 4390 2751 3835 2415 7939 5498 6030 3774 4522 9733 9413 5799 6691 104 4719 5 2970 8107 3502 4687 312 37 2582 578 654 22 8553 2465.4 80297 9622.3 140348 22597。3 195 5919.1 311 69。8 734 91202 24301 3537 8081 8870 496 12249.4 5878。5 1504.2 1887。2 5884.5 125.6 16205。45 30。7 6330.69 3.7 2122.06 8.6 12.2 2577.57 8443.84 数据标准化处理后: 餐饮业营业额(亿元) 北京市 Gdp(亿元) 城乡居民餐饮业企餐饮业从人民存款业法人个业人数余额(亿数(个) (人) 元) 人口 (万人) 2.29149 —0。1。20155 1.87475 0。79709 —0。04214 81002 —0。—1.04084 天津市 河北省 ——0。—0。5507 —0.26081 38325 —0。0。50798 —0.26829 62394 —0。4823 0.82196 1.06311 61817 山西省 0.49559 -0.43582 —0。-0。36908 —0。—0.098 -0.26617 49635 14621 -0。67253 内蒙古自治区 -0。49395 -0。22574 -0。54569 -0。52954 —0.63836 辽宁省 —0。0。4297 -0。18497 —0。0。48239 0。00665 02156 40287 -0。61172 -0.58171 吉林省 -0.77115 —0。-0.8776 —47209 0.83542 黑龙江省 —0。-0。38243 —0。-0.775 —74423 81748 0.39929 -0.19258 上海市 江苏省 浙江省 安徽省 1。97818 0.08628 0.97109 1.67057 0。55832 —0.70233 1.54984 2.50104 1.928 1.814 1。78315 1.28065 0.70234 1.10084 0.80576 0.69331 1。33309 0。40439 -0。28223 -0.07851 0.21208 —0.08228 -0.13606 0。59537 福建省 0.07758 0.048 —0。-0。04239 —08226 0.23502 -0。21448 江西省 山东省 河南省 湖北省 湖南省 广东省 广西壮族自治区 -0.70017 —0.38527 -0.77865 -0。65561 -0.4299 0。05403 1.16067 2.21312 1。96307 0。94039 1.41327 1。92465 0.02556 0。74658 0。043 —0.03808 0.48695 0.27557 1。2504 0。57153 0。10106 0。51244 —0。0.274 —0。—22594 34529 0.25593 0。01223 0.83265 0.53498 1。80978 2。80182 2.67427 2。53045 3。13793 3.25866 2.25168 —0。-0。38275 —0.701 —0。—0。0.12475 695 海南省 59863 48558 ——0。-1.10029 —83112 0.97529 -0.86542 —1.09659 1.24797 -0.5031 重庆市 四川省 贵州省 0。10266 -0。48884 0。19078 0。00845 —0.43935 0。5206 0.37743 0.93727 0。7399 0.75218 1.34096 -0。765 -0。78778 -0.69974 —0。-0。77943 -0.31212 73031 云南省 —0.59125 -0.54937 —0.6296 —0.57 -0.49927 0.11326 自治区 —0.825 -1。25063 -1.022 —0。—96066 1.27745 -1.45725 陕西省 —0。-0.271 12619 0.11939 0。14128 —0.1981 -0。21807 甘肃省 -0。7069 ———0.6736 -0.78316 —0。238 -1.18486 -1。36177 0.957 0.714 青海省 -0。87212 -1。16747 -1.03416 —0.92651 宁夏回族自治区 -0.84213 —1。-0.96778 -0。87117 -1.14969 -1。33448 13848 —0。7826 -0。75653 76506 -0.98406 —0。维吾-0。8201 -0。尔自治区 86156
三、 参数估计
利用Eviews6.0估计模型参数,最小二乘法的回归结果如下: 用Eviews估计结果为:
根据表中的样本数据,模型估计结果为:
t= (3。33E-05) (-0.111061) (1。617020) (4。861177) (1.004762) (—2。675348)
可以看出,可决系数,修正的可决系数.说明模型的拟合程度还可以.但是当时,X1、X2、X4系数均不能通过检验,且X1、X5的系数为负,与经济意义不符,表明模型很可能存在严重的多重共线性
四、模型检验
1。多重共线性的检验:
计算各个解释变量的相关系数,得到相关系数矩阵 表4。1 相关系数矩阵
由相关系数矩阵可以看出,解释变量X1、X2、X4之间存在较高的相关系数,证实确实存在严重的多重共线性。 2.多重共线性修正
表4.2 一元回归结果 变量 参数估计值 t 统计值 X1 0.752443 6。151980 0。566173 0。551213 X2 0。919239 12.57375 0.845002 0.839657 X3 0。983748 29。50603 0。9677 0。966652 X4 0。846699 8。569556 0.716900 0.707138 X5 0。486108 2。995510 0.236301 0。209967 其中,X3的方程最大,以X3为基础,顺次加入其它变量逐步回归。 表4。3 加入新变量的回归结果(一) X3,X1 X3,X2 X3,X4 X3,X5 X1 —0.054372 (—1。008505) -0.026179 X2 X3 1.0284 (19。03952) 1.008295 X4 X5 0。966672 0.965550 (—0.268539) (10.34290) 1。055460 -0。081541 0。967075 (15。108) (—1.171518) 1。028601 (27。30802) —0。081308 (-2。158633) 0。9703 经比较,新加入X5的方程=0.9703,改进最大,而且各个参数的t检验显著,选择保留X5,再加入其它新变量逐步回归.
表4.4 加入新变量的回归结果(二) X3,X5,X1 X3,X5,X2 0.179349 (1。531826) X3,X5,X4 0。971111 (12。0.091688 —0.123267 0.97004X1 0.0910 (1.152762) X2 X3 0。983546 (18。X4 X5 -0。140565 (—2。 0.970733 17055) 0.887519 (8.948776) 210221) —0。130404 0.97174(-2。672514) 8 (0.825091) (—1.943885) 7 24452) 当加入X1、 X2或X4时,均没有所增加,且其参数是t检验不显著.从相关系数可以看出X1、X3、X5之间相关系数较高,这说明X1、X3、X5引起了多重共线性,但是由于虑到X3对模型的影响蛮大的,可能存在异方差或自相关,保留X3、x1,剔除、X5。 修正多重共线性影响后的模型为:
t= (-1.620452) (3。619150) (1.538409) (8.823194) 在确定模型以后,进行参数估计
表4。5 消除多重共线性后的回归结果
五、异方差检验
在实际的经济问题题中经常会出现异方差这种现象,因此建立模型时,必须要注意异方差的检验,否则,在实际中会失去意义. (1) 检验异方差
表5.1 White检验结果
从上表可以看出,n= 20.48293,由White检验可知,在下,查分布表,得临界值,比较计算统计量与临界值n= 20。48293>,所以拒绝原假设,表明模型存在异方差。 (2)异方差的修正
分析数据取对数,设权重为X4
0。002851 0.662614 0.534865 0。219372 -0.721076
由于的系数为负数不符合经济规律,舍去 异方差修正后模型为: 六、结论
1) 从模型可以看出人均GDP、从业人数、企业数、,是影响餐饮业营业收入的最显著因素. (2) 系数解释:人均GDP提高1元,营业收入就会提高13.85万元;从业人数增加一万人,营业收入就会提高510.77万元;企业数增加一个,营业收入就会提高16.05万元.