您的当前位置：首页出行方式选择_神经网络与多项Logit模型的比较研究

出行方式选择_神经网络与多项Logit模型的比较研究

来源：微智科技网

󰀁第12卷第4期󰀁2009年12月

上海电机学院学报

JOURNALOFSHANGHAIDIANJIUNIVERSITY

Vol.12No.4󰀁Dec.2009󰀁

文章编号󰀁1671󰀁2730(2009)04󰀁0323󰀁05

出行方式选择:神经网络与多项Logit模型的比较研究

鲜于建川

(上海电机学院经济管理学院,上海200245)

󰀁󰀁摘󰀁要:分析了多项Logit模型的固有缺陷和神经网络方法的良好性质,从两种方法的区别和联系入手,构造了用于出行方式分析的多项Logit模型和神经网络模型。并用同一调查数据,分析比较了两种模型对居民出行方式选择的预测效果。研究表明:含有隐层的BP神经网络模型能够描述属性变量之间的非线性关系,对个人出行方式选择行为的描述更准确,具有更好的预测精度。󰀁󰀁关键词:神经网络;离散选择模型;多项Logit模型;出行方式选择󰀁󰀁中图分类号:TP183󰀁󰀁󰀁文献标识码:A

TravelModeChoiceModeling:AComparisonofNeuralNetworksandMultinomialLogitModel

XIANYUJianchuan

(SchoolofEconomics&Management,ShanghaiDianjiUniversity,Shanghai200245,China)󰀁󰀁Abstract:Inrecentyears,neuralnetworkhasbeenwidelyappliedtothetraveldemandpredictionarea,withthediscretechoicemodelasthemainanalysismethod,ofwhichthepredictionperformanceisrarelydirectlycompared.Therefore,theinherentdisadvantagesofthelogitmodelandthegoodcharacteristicsoftheneuralnetworkmethodarefirstanalyzedinthispaper.Then,withthedifferenceandtheconnectionofthetwomethods,amultinomialLogitmodelandaneuralnetworkmodelarecomparedforthetravelmodeanalysis.ItisfoundthattheBPneuralnetworkmodelwiththehiddenlayercandescribethenonlinearrelationshipbetweenpropertyvariable,andcanachieveabetterpre󰀁dictionperformanceofthetravelmodechoicethanthemultinomiallogitmodel.

󰀁󰀁Keywords:neuralnetwork;discretechoicemodel;multinomiallogitmodel;travelmodechoice

󰀁󰀁对出行方式的预测一直是交通需求预测的重要组成部分,预测结果直接影响到交通需求管理和交通控制策略的有效实施。自19世纪70年代MNL(MultinomialLogit)模型出现以来[1],基于效用最

大化理论的离散选择模型,因其数据利用率高、可移植性强、能够完成对不同出行者群体的影响评价等优点而在出行行为分析中得到了广泛应用。然而研究人员也发现离散选择模型有其自身的弱

[2󰀁4]

收稿日期:2009󰀁10󰀁05

作者简介:鲜于建川(1976󰀁),女,讲师,博士,专业方向为运输系统规划与管理、物流管理,E󰀁mail:xianyjc@sdju.edu.cn

324

上󰀁海󰀁电󰀁机󰀁学󰀁院󰀁学󰀁报

Pjn=exp(Vjn)/

2009年第4期󰀁

点。离散选择模型的效用函数多设定为参数的线性函数,需根据研究领域的专业知识通过试错的方法来选择效用函数的形式,在属性变量较多时难以实现。

针对离散选择模型的上述缺陷,一些不需要函数结构的精确设定就能很好描述变量间非线性关系的半参数和非参数的非线性回归模型得到了深入研究。而神经网络就是其中的一种,在交通需求预测中取得了较好应用效果[5󰀁8]。这些应用大部分是以Logit类回归模型作为标准方法的,研究发现神经网络可以看作logistic回归、判别分析和聚类分析的非线性推广[9]。然而,却很少有关于两种方法应用效果的直接比较。为此,本文以出行方式预测为例,分析了应用最为成熟的MNL模型与神经网络方法的对应关系和差异,通过两种方法对同一组实际调查数据预测结果的比较得出不同方法的特点,同时提出了利用MNL模型设定神经网络结构,提高网络可解释性的方法。

i=1

󰀁exp(V

jnl

)(4)

通常假设效用函数确定项Vjn是属性xjnl(l=1,2,󰀁,L)的线性函数:Vjn=

l=0

󰀁󰀁x

(5)

󰀁󰀁选择概率与效用确定项之间的Logit函数关系呈S形,使得方案i相比于其他方案很好或很差时,其选择概率几乎不受Vin的小幅度变化的影响;而在概率0.5附近,其选择概率对Vin非常敏感(如图1所示)。Logit函数关系同时也将属性变量xjnl与确定项Vjn之间的线性关系转变成了属性变量与选择概率Pjn之间的非线性关系。

1󰀁MNL模型

MNL模型是应用最广的出行方式预测方法。模型假设出行者追求效用最大化,在特定条件下将选择其所认知的效用最大的方案,且选择方案因出行者特性(如年龄、性别、职业等)、选择方案特性(如所需费用、时间等)等因素而异。因此,若已知了这些因素对出行者感知到效用的影响就能对选择行为作预测。1.1󰀁模型结构

考虑出行者n的出行方式选择问题方案,假设其可选方案集合为An,包含K种不同方案,其中方案j的效用为Ujn,则根据效用最大化理论,出行者n从集合An中选择方案j的条件为

Ujn>Uin,i󰀁j,i󰀁An

(1)

jn两部󰀁󰀁方案的效用Ujn由确定项Vjn和随机项󰀁

分组成,分别为可观测因素和不可观测因素对效用

图1󰀁Logit曲线Fig.1󰀁Logitcurve

󰀁󰀁模型参数通过对数似然函数logL的极大似然估计得到。其中:L(Y|X,󰀁)=Yjn=

1,当方案j被选中时

0,方案j未被选中时

logL=

1.2󰀁局限性

MNL模型的局限性主要表现在2个方面。󰀁效用随机项相互的假设造成了模型的非相关方案相互(IndependentofIrrelevantAlterna󰀁tives,IIA)特性,使得任两方案选择概率的比值不受其他选择方案效用函数确定项的影响。󰀁线性效用函数假设,使得模型难以考察属性变量交互作用以及属性变量以分段形式对效用函数的影响[10]。

不同于MNL模型,神经网络方法不要求分析数据相互,且具有很强的非线性函数映射能力,为解决MNL模型的局限性提供了有利条件。

n=1j󰀁A

󰀁󰀁P

Yjn(6)

󰀁󰀁Y

ln(Pjn)(7)

的影响:

Ujn=Vjn+󰀁jn(2)

󰀁󰀁若假设随机项󰀁1n,󰀁2n,󰀁,󰀁kn同分布,且分布函数为参数为(0,1)的Gumbel分布:

F(󰀁jn)=exp[-exp(-󰀁jn)]

则得到出行者n选择方案j的MNL模型:

(3)

2󰀁神经网络方法

出行方式选择受到出行者自身特性、出行特性、运输系统特性以及出行区域和目的区域特性等因素󰀁2009年第4期

鲜于建川:出行方式选择:神经网络与多项Logit模型的比较研究󰀁󰀁

325

的影响,引入神经网络模型既能够识别线性指标的特性又能识别非线性指标的影响。2.1󰀁BP网络

BP神经网络具有优良的非线性逼近能力,近年来,在交通规划领域得到了广泛的应用。算法的基本思想是,学习过程由信号的正向传播与误差的逆向传播两个过程组成。正向传播时,模式作用于输入层,经隐层处理后,传向输出层。若输出层未能得到期望的输出,则转入误差的逆向传播阶段,将输出误差通过隐层向输入层逐层返回,并分摊给各层的所有神经元,获得误差信号,作为修改各连接权值的依据。此过程反复进行,直至网络输出的误差减少到可接受的程度为止。2.2󰀁BP网络与MNL模型的相似性

用前述出行方式选择问题来说明神经网络方法同MNL模型的联系。出行者n的选择集An中有K个方案,每个选择方案j用L个属性(xj1,xj2,󰀁,xjL)来描述。设定如下神经网络Net1(如图2所示):输入层有L个节点,与方案属性值对应;输出层有K个节点,与K个选择方案对应;输出层传递函数为Softmax函数,则输出层第K个节点的输出为

exp(

fk=

l=0

[11󰀁14]

络的非线性函数映射能力,则模型能够解决具有非线性效用函数的离散选择问题。故,神经网络模型可看作对MNL模型的扩展,网络结构的设定和学习结果的解释可以借鉴MNL模型过程。

3󰀁基于离散选择模型的神经网络

以某市2004年城市综合交通调查中的居民出行调查数据库为数据来源,研究被调查者通勤出行中步行、自行车、助动车、公共交通、小汽车等5种方式的选择情况。用于建模的通勤者数据共2350人,首先按出行方式归类。然后从各出行方式样本中随机抽取80%作为训练样本,另20%作为测试样本。各类出行方式的训练样本合并后作随机排列,得到最终的训练样本集。同理得到测试样本集。样本数据的方式划分情况如表1所示。为便于比较两种方法的分析效果,研究中选用相同的解释变量完成MNL模型和BP神经网络的标定。

表1󰀁样本统计表Tab.1󰀁Samplestatistics

出行方式步行(M1)自行车(M2)助动车(M3)公共交通(M4)小汽车(M5)合计

训练集254(13.51%)578(30.74%)105(5.59%)537(28.56%)406(21.60%)1880(100%)

测试集(13.67%)145(30.85%)26(5.53%)134(28.51%)101(21.49%)470(100%)

󰀁w

Ll=0[15]

xil)

(8)

j=1

󰀁exp(󰀁w

xil)

可看作方案K的选择概率有相似的结构。

。可见式(8)与式(4)

󰀁󰀁首先用MNL模型完成上述出行样本的方式选择分析,模型标定结果如表2所示。

󰀁󰀁以表2中的10个变量作为输入,建立具有单隐层的神经网络Net2。网络采用式(9)定义的相对熵误差函数,输出层有5个节点与5种出行方式对应,输出层的转移函数采用式(8)的Softmax函数。隐层转移函数和节点数通过对模型的反复训练比较得到,这里采用Sigmoid函数、21个节点。网络结构如上图3所示。

图2󰀁神经网络Net1结构图

Fig.2󰀁StructureofneuralnetworksNet1

󰀁󰀁出行方式选择模型主要用于分析个体或特定群体在进行某类出行时对不同出行方式的选择,并最终预测各种方式的出行量和所占比例。个体预测率(rij)和总体预测率(r)分别从对单个出行者的判断和对所有出行方式的预测两个方面评价模型的预测能力。研究中以个体和总体预测率为指标,评价两种方法的分析能力。󰀁󰀁算法中以相对熵作为误差函数,其定义如下:

n=1k=1

󰀁󰀁Y

ln(Snk)(9)

上式除符号外与MNL模型的对数似然函数(7)有相同的形式。若在网络Net1中增加隐层,利用网326

上󰀁海󰀁电󰀁机󰀁学󰀁院󰀁学󰀁报

表2󰀁MNL模型参数标定结果Tab.2󰀁MNLmodelestimates变量名

估计值1.15

tstatistic6.21

2009年第4期󰀁

j中正确预测样本数,Naj为实际选择方式j的样本数,N󰀁pj为预测结果是方式j的样本数。

󰀁󰀁表3和表4分别列出了MNL模型和神经网络模型对训练样本和测试样本的预测结果,表中的一行与一种出行方式的样本分布情况对应,表的一列为一种出行方式的预测情况。表5是对两种方法预测精度的比较。从总体上看,无论是对训练样本还是测试样本,神经网络模型的预测精度都高于MNL模型。

表3󰀁MNL模型的预测结果

Tab.3󰀁PredictionresultsofMNLmodel

训练集预测结果

M1(254)M2(578)M3(105)M4(537)M5(406)1624210209M25340941816M384578375M42567441457M5615948319rij/%63.7870.7674.2973.5177.0978.57rij/%.0668.28

84.6274.6876.8785.15

r/%r/%

自行车方式影响变量constant

cdis(通勤距离,km)

inc(家庭成员人均收入,元)age(年龄,周岁)

ledu(1:高中及以下学历0:其他)助动车方式影响变量constant

male(1:男性0:女性)inc(家庭成员人均收入,元)age(年龄,周岁)

-0.0002-2.68-0.0002-2.970.0220.261.480.25

4.074.985.294.27

-0.0001-5.33-0.033-7.76

-3.1.65

-6.01-3.19-8.606.375.545.58

公共交通方式影响变量

av(家庭成员人均拥有交通工具数)-0.05yp(1:有月票0:无)age(年龄,周岁)

ledu(1:高中及以下学历0:其他)小汽车方式影响变量

license(1:有驾照0:无)

hedu(1:本科及以上学历0:其他)bs(1:单位负责人0:其他)inc(家庭成员人均收入,元)

0.20-0.024-0.35-0.400.170.290.0002

训练集预测结果

M1()M2(145)M3(26)M4(134)M5(101)

416241

M21099132

M321422100

M4721110312

M54501486

Numberofcases=2350󰀁LL(0)=-3782.18LL(c)=-2706.78,󰀁LL(^󰀁)=-1739.80󰀁20=0.54

表4󰀁神经网络模型的预测结果

Tab.4󰀁Predictionresultsofneuralnetworks

训练集预测结果

M1(254)M2(578)M3(105)M4(537)M5(406)图3󰀁神经网络Net2结构图

Fig.3󰀁StructureofneuralnetworksNet2

1657070M22945632M32269452M45880842145M509078355rij/%.9678..5279.3178.4087.44rij/%73.4478.6288.4681.9182.84.11

r/%r/%

训练集预测结果

M1()M2(145)

472001

M25114223

M3072371

M4121911116

M50301490

两种预测率定义如下:

rij=Npj/Najr=

(10)(11)

󰀁N

M3(26)M4(134)M5(101)

其中,j=1,2,󰀁,5表示5种出行方式。Npj为方式

󰀁2009年第4期

鲜于建川:出行方式选择:神经网络与多项Logit模型的比较研究󰀁󰀁

327

表5󰀁MNL和神经网络的结果比较

Tab.5󰀁ComparisonofMNLandneuralnetworks方法MNL神经网络

输入层隐层输出层训练节点数节点数节点数次数

训练精度

测试精度

ProceedingsofIEEE󰀁INNS󰀁ENNSInternationalJointConferenceonNeuralNetworks[C].Como,Italy:SapienzaUniversityofRome,2000.

[6]󰀁HuiskenG,CoffaA.Neuralnetworksandfuzzylog󰀁

ictoimprovetripgenerationmodelling[C]//Univer󰀁sityofCaliforniaTransportationCenter.Proceedingsofthe9thInternationalAssociationforTravelBehav󰀁iorResearchConference[C].GoldCoast,Australia,2000.

[7]󰀁TillemaF,ZuilekonKMV,MaarseveenMFAM

V.ComparisonofNeuralNetworksandGravityModelsinTripDistribution[J].Computer󰀁aidedCiv󰀁ilandInfrastructureEngineering,2006,21:104󰀁119.

[8]󰀁董敬欣,吴建平.基于神经网络的交通平衡求解算法

[J].系统仿真学报,2005,17(6):1380󰀁1383.[9]󰀁RipleyB.Neuralnetworksandrelatedmethodsfor

classification[J].JournaloftheRoyalStatisticalSo󰀁ciety.B(Methodological),1994,56(3):409󰀁456.

[10]󰀁关宏志.非集计模型[M].北京:人民交通出版社,

2004.

[11]󰀁CantarellaGE.LucaSd.Multilayerfeedforward

networksfortransportationmodechoiceanalysis:Ananalysisandacomparisonwithrandomutilitymodels[J].

TransportationResearchPartC:

Emerging

Technologies,2005,13(2):121󰀁155.

[12]󰀁XieC,LuJ,ParkanyE.Worktravelmodechoice

modelingusingdatamining:decisiontreesandneuralnetworks[J].

TransportationResearchRecord,

2003,1854:208󰀁219.

[13]󰀁于江波,陈后金.基于分段学习的BP神经网络的交

通流量预测[J].ITS通讯,2006,2(7):28󰀁30.

[14]󰀁张玉梅,曲仕茹,温凯歌.高速公路动态交通流的BP

神经网络建模[J].计算机工程与应用,2007,43(15):9󰀁11.

[15]󰀁BishopCM.Neuralnetworksforpatternrecognition

[M].NewYork:OxfordUniversityPress,1995.

10215

73.51%74.68%

560079.31%81.91%

4󰀁结󰀁语

居民出行方式选择是一个复杂的系统,而神经网络具有良好的非线性映射能力,能识别特性变量的线性和非线性的影响,在方式选择预测中有很大的潜力。文章运用BP神经网络建立了用于城市居民出行方式选择的预测模型,应用居民出行调查的实际数据对模型进行了检验。通过与方式划分的离散选择方法MNL模型的区别和联系的比较研究发现,具有单隐层的BP神经网络能够描述输入变量的非线性影响,能够更好的预测出行方式选择。参考文献:

[1]󰀁McFaddenD.Conditionallogitanalysisofqualitative

choicebehavior[M]NewYork:1973:105󰀁142.

[2]󰀁CaoL.Amodelfortravelmodeswitching[D].New

Jersey:NewJerseyInstituteofTechnology,1998:1󰀁103.

[3]󰀁Hoogendoorn󰀁LanserS,VanNR,HoogendoornS

P,etal.Home󰀁activityapproachtomulti󰀁modaltrav󰀁elchoicemodeling[J].TransportationResearchRe󰀁cord,2006,1985:180󰀁187.

[4]󰀁MillerEJ,RoordaMJ,CarrascoJA.ATour󰀁based

modeloftravelmodechoice[J].Transportation,2005,32(4):399󰀁422.

[5]󰀁DantasA,YamamotoK,LamarMV,etal.Neural

networkfortraveldemandforecastusingGISandre󰀁motesensing[C]//AmariS,GilesL,GoriM,etal.

AcademicPress,

因篇幅问题不能全部显示，请点此查看更多更全内容

查看全文