基于多元线性回归分析餐饮业营业收入的影响因素
一、导论
餐饮业是国民经济的一个重要产业,“民以食为天”。开门七件事,“柴米油盐酱醋茶”,件件事与吃有关。在现代社会,很难想象,没有餐饮业,社会将会是怎样。鉴于餐饮业在国民经济中有如此重要的作用,我尝试通过经济学的方法来分析一下影响餐饮业的因素,并期望为我国餐饮业健康发展思路提供一定基础。 餐饮业营业收入是衡量餐饮业发展水平的重要指标,本文着重研究影响餐饮业营业收入的因素来考察制约餐饮业发展的关键所在。
假定除我们考虑到的因素外,其他因素对餐饮业营业收入的影响可以忽略.有效的餐饮需求:指城乡居民愿意并能够消费的餐饮产品总和. 这里:①GDP:可以认为影响着餐饮业营业收入的总水平; ② 人均GDP:也可以认为影响着餐饮业营业收入的总水平,但这里我考虑到人口因素的影响;③ 从业人数:对餐饮业营业收入也有影响;④ 企业数:企业数越多,营业收入也会越高; ⑤城乡居民人民币储蓄存款余额:可以反映我国城乡居民的餐饮消费能力。
二、模型建立
根据经济学理论把模型设定为:
其中:Y 代表餐饮业营业收入2013(单位亿元)
X1代表GDP(单位亿元) X2代表从业人数(单位万人) X3代表企业数(单位个)
X4代表城乡居民人民币储蓄存款余额(单位亿元) X5 代表人口(单位万人) 数据如下:
北京市 天津市 河北省 山西省 内蒙古自治区 辽宁省 餐饮业营业额(亿元) 520。7 103.6 45.2 75 Gdp(亿元) 19800.81 14442.01 28442.95 12665。25 餐饮业企业法人个数(个) 1822 423 467 568 427 715 餐饮业从业人数(人) 233518 57577 40007 67599 36128 46528 65.5 16916。5 142。7 27213。22 城乡居民人口 人民存款(万人) 余额(亿元) 23086.4 2115 7612.3 1472 23357。2 7333 13339。4 3630 2498 7455。2 19659.5 4390 吉林省 黑龙江省 上海市 江苏省 浙江省 安徽省 福建省 江西省 山东省 河南省 湖北省 湖南省 广东省 广西壮族自治区 海南省 重庆市 四川省 贵州省 云南省 自治区 陕西省 甘肃省 青海省 宁夏回族自治区 维吾尔自治区 20。2 24.6 469.5 399。5 261 100.1 158。9 31.8 335.9 150。4 225.8 109.3 604。1 13046.4 14454.91 21818.15 59753.37 37756。59 19229.34 21868。49 14410.19 55230.32 32191。3 24791。83 24621。67 62474。79 162 210 1638 2402 1506 1032 797 241 2430 1374 1861 587 2883 303 84 1015 1611 304 360 13 958 346 37 90 77 11016 7745。3 15924 10058.6 216755 20486。3 228531 33823。9 136523 223 72848 12924。9 76123 11847.3 25778 9725.2 156808 29796.1 777 20232.1 126525 15507 58591 14539.7 337224 491.3 30456 8553 80297 140348 195 311 734 9118。9 2465。4 9622。3 22597.3 5919。1 69.8 496 32 14449。9 10.4 163 231。3 21。1 49.6 0.9 3177。56 12783.26 26392.07 8086.86 11832.31 815.67 2751 3835 2415 7939 5498 6030 3774 4522 9733 9413 5799 6691 104 4719 5 2970 8107 3502 4687 312 37 2582 578 654 22 125。6 16205.45 30.7 6330.69 3.7 2122.06 8.6 12。2 2577.57 8443.84 91202 12249。4 24301 5878。5 3537 1504。2 8081 8870 1887.2 5884.5 数据标准化处理后: 餐饮业营业额(亿元) 北京市 Gdp(亿元) 城乡居民人口 餐饮业企餐饮业从人民存款(万人) 业法人个业人数余额(亿数(个) (人) 元) 1.20155 1。87475 0。79709 -0.81002 2.29149 —0.04214 天津市 —0.26081 -0.38325 -0。5507 -0.26829 -0。62394 —1。04084 河北省 —0。0.50798 -0。49559 —0.4823 0.82196 1。06311 61817 山西省 -0.43582 ——-0.14621 -0.098 -0。26617 0.49635 0.36908 内蒙古自治区 辽宁省 吉林省 -0.49395 -0。22574 —0。-0。52954 —54569 -0.02156 0.4297 —0。0.63836 67253 -0.18497 -0。40287 0。48239 0.00665 -0。77115 -0.47209 -0。8776 -0.83542 -0.61172 —0.58171 黑龙江省 ——-0。81748 -0.775 -0.39929 —0。19258 0.74423 0.38243 上海市 江苏省 浙江省 安徽省 1.97818 0.08628 0。97109 1.67057 0.55832 —0。70233 1.54984 2.50104 1。928 1.814 1。78315 1。28065 0.70234 1。10084 0.80576 0.69331 1。33309 0。40439 ——0.21208 -0.08228 —0.13606 0。59537 0.28223 0.07851 福建省 0.07758 0.048 -0。08226 -0.04239 —0。-0.21448 23502 江西省 山东省 河南省 湖北省 湖南省 广东省 广西壮族自治区 海南省 重庆市 -0.70017 ———0。-0.4299 0。05403 0.38527 0.77865 65561 1.16067 2.21312 1.96307 0.94039 1.41327 1.92465 0。02556 0。74658 0。043 —0。0.53498 1。80978 03808 0.48695 0。27557 1。2504 0。57153 0。10106 0。51244 -0.22594 0。274 -0.34529 -0.25593 0。01223 0.83265 2。80182 2。67427 2.53045 3.13793 3.25866 2.25168 -0.695 -0.38275 -0.701 -0。59863 -0。48558 0.12475 -0。83112 -1.10029 —0。-0。86542 -1.09659 -1.24797 97529 0。10266 —0。0。19078 0。00845 ——0.5031 48884 四川省 贵州省 0.43935 0。5206 0。37743 0。93727 0。7399 0。75218 1.34096 —0。—765 ———0。-0.31212 0.78778 0.69974 0.73031 77943 ——0.6296 —0.57 —0。0。11326 49927 —1。云南省 —0.59125 0.54937 自治区 -0。825 -1.25063 —1。-0。96066 —022 —0。-0.271 12619 1.27745 45725 陕西省 0.11939 0.14128 —0.1981 -0.21807 甘肃省 —0。7069 -0.957 —0。-0。6736 —0。—714 78316 0.238 青海省 -0。87212 —1。-1。03416 -0。92651 -1。18486 —1。16747 36177 ——宁夏回族自治区 —0。-1。13848 -0.96778 —84213 0.87117 1.14969 1.33448 —0。-0.86156 —0。7826 -0.75653 98406 8201 —维吾—0。尔自治区 0.76506
三、 参数估计
利用Eviews6.0估计模型参数,最小二乘法的回归结果如下: 用Eviews估计结果为:
根据表中的样本数据,模型估计结果为:
t= (3.33E—05) (-0。111061) (1.617020) (4.861177) (1。004762) (—2.675348)
可以看出,可决系数,修正的可决系数.说明模型的拟合程度还可以。但是当时,X1、X2、X4系数均不能通过检验,且X1、X5的系数为负,与经济意义不符,表明模型很可能存在严重的多重共线性
四、模型检验
1。多重共线性的检验:
计算各个解释变量的相关系数,得到相关系数矩阵 表4.1 相关系数矩阵
由相关系数矩阵可以看出,解释变量X1、X2、X4之间存在较高的相关系数,证实确实存在严重的多重共线性。 2.多重共线性修正
表4。2 一元回归结果 变量 参数估计值 t 统计值 X1 0.752443 6.151980 0。566173 0.551213 X2 0。919239 12.57375 0。845002 0.839657 X3 0。983748 29。50603 0.9677 0.966652 X4 0。846699 8。569556 0.716900 0。707138 X5 0.486108 2。995510 0.236301 0.209967 其中,X3的方程最大,以X3为基础,顺次加入其它变量逐步回归. 表4.3 加入新变量的回归结果(一) X3,X1 X3,X2 X3,X4 X3,X5 X1 -0.054372 (-1.008505) -0.026179 X2 X3 1。0284 (19。03952) 1.008295 X4 X5 0。966672 0.965550 (—0.268539) (10.34290) 1.055460 (15.108) 1.028601 (27.30802) -0.081541 (-1.171518) -0.081308 (-2。158633) 0.9703 0.967075 经比较,新加入X5的方程=0.9703,改进最大,而且各个参数的t检验显著,选择保留X5,再加入其它新变量逐步回归。
表4。4 加入新变量的回归结果(二) X1 X2 X3 0。983546 X4 X5 —0。140565 0.970733 X3,X5,0。0910 X1 (1。(18.17055) (—2。210221) 152762) X3,X5, X2 0.179349 0。887519 (1。(8。948776) —0。130404 0.971748 (-2.672514) 531826) X3,X5,X4 0.971111 0.091688 —0。123267 0。970047 (12。24452) (0。 825091) (-1。943885) 当加入X1、 X2或X4时,均没有所增加,且其参数是t检验不显著。从相关系数可以看出X1、X3、X5之间相关系数较高,这说明X1、X3、X5引起了多重共线性,但是由于虑到X3对模型的影响蛮大的,可能存在异方差或自相关,保留X3、x1,剔除、X5. 修正多重共线性影响后的模型为:
t= (—1。620452) (3。619150) (1.538409) (8。823194) 在确定模型以后,进行参数估计
表4.5 消除多重共线性后的回归结果
五、异方差检验
在实际的经济问题题中经常会出现异方差这种现象,因此建立模型时,必须要注意异方差的检验,否则,在实际中会失去意义。 (1) 检验异方差
表5。1 White检验结果
从上表可以看出,n= 20。48293,由White检验可知,在下,查分布表,得临界值,比较计算统计量与临界值n= 20.48293〉,所以拒绝原假设,表明模型存在异方差. (2)异方差的修正
分析数据取对数,设权重为X4
0.002851 0。662614 0。534865 0.219372
—0。721076
由于的系数为负数不符合经济规律,舍去 异方差修正后模型为: 六、结论
1) 从模型可以看出人均GDP、从业人数、企业数、,是影响餐饮业营业收入的最显著因素。 (2) 系数解释:人均GDP提高1元,营业收入就会提高13.85万元;从业人数增加一万人,营业收入就会提高510.77万元;企业数增加一个,营业收入就会提高16.05万元.