第33卷第l期 2013年2月 水文 J0URNAL OF CHINA HYDROLOGY V01.33 No.1 Feb..2013 基于参数优化的集对分析月径流预测 刘 冀,徐 刚,彭 涛,明 波 (三峡大学水利与环境学院,湖北宜昌443002) 摘 要:采用集对分析法进行月径流预报时,针对级别划分较多时不易确定差异度分量系数的问题.建 立了基于SCEM—UA算法优化该系数的月径流预报方法。研究实例表明.本方法能够有效区分集对间不 同差异度的影响,优化所得的差异度分量系数是有效的、合理的,能够提高月径流预报精度并发布概率 预报。此外.分析表明集对分析预报中的参数不确定性在模型不确定性中占主导地位。 关键词:集对分析;径流预测;SCEM—UA;差异度分量系数 中图分类号:P338.2 文献标识码:A 文章编号:1000—0852(2013)01—0008—04 月径流预报因预见期较长,受天文、气象、自然地 合A和B构成集对H(A,B),联系度定义为 + ,+ ., 忍 12 : (1) 理特性和人类活动等众多因素的影响,径流变化极其 复杂,具有很大的不确定性。由赵克勤}lJ先生提出的不 确定性关系分析理论一集对分析(Set Pair Analysis, SPA)理论为水文中长期预报提供了一条新途径,丰富 了现有的水文预报方法。已取得了一些重要研究成 果【 。应用集对分析法进行径流预报时,首先需划分 式中:n为集合特性总数,n=S+F+P;S为同一性的个 数;F为差异性的个数;P为对立性的个数;,为差异不 确定系数,在(一1,1)区间视不同情况取值;.,为对立 系数,且.,三一l。令a=S/n,b=F/n,c= n分别称为集对 , 径流级别,构造径流集合并进行集对分析,然后计算联 系度,选取联系度较大的历史相似样本的后续值作为 预报结果。上述步骤的关键是如何确定适宜的差异度 分量系数用以计算联系度。而目前对于多个差异度分 量系数的确定还没有较为完善的方法,针对此问题,本 文尝试在一定的优化目标准则下采用SCEM—UA算法151 优化率定SPA中的差异度分量系数。验证该方法的可 行性.并进一步分析月径流的概率区间预报成果。 )的同一度、差异度和对立度,则式(1)可写为 埘=a+bI+cJ。当口越接近于1时,表明这两个集合的 关系越倾向于同一;当c越接近于l时,表明这两个集 合的关系越倾向于对立;当b越接近于1时,表明这两 个集合的关系越倾向于差异。 将式(1)进行拓展,对差异度进行细分可得 元联 系度 l^A加=0+6l,1+62,2+…+6 -Jk-2+cJ (2) 式中:叶6l+62+…+6 _2+c=1;61,b2,…,b -2称为差异度分 l模型原理 1.1 集对分析 量;,l',2,…, 之称为差异不确定分量系数,其取值合理 性对联系度影响较大。 基于哲学中的对立统一和普遍联系的观点,赵克 勤提出了集对分析理论,为分析解决水文与水资源中 的不确定性问题提供了一条新思路。集对分析的核心 思想是对不确定性系统的两个有关联的集合构建集 对。再对集对的特性做同一性、差异性、对立性分析,然 后用联系度描述集对的同、异、反关系。设有联系的集 对于差异不确定分量系数的确定常采用的方法有 经验取值法、均匀取值法口I等。前者需要与研究对象的 变化特性和研究人员的经验结合起来进行取值,经验 性较强,不易掌握。均匀取值法将差异度分量b 均匀 划分,方法简单,易于操作,但缺乏理论依据。本文尝试 采用优化方法率定参数b ,以期提高径流预报精度。 收稿日期:2012—03—23 基金项目:国家自然科学基金项目(41101511) 作者简介:刘冀(1980一),男,河北保定人,讲师,博士,主要从事水文预报与防洪调度研究。E—mail:liuji@ctgu.edu.cn 第1期 刘冀等:基于参数优化的集对分析月径流预测 9 1.2 SCEM—UA优化算法 SCEM—UA算法由VrugtI ̄等人为优化和评估模型 参数而提出的模拟搜索优化算法。SCEM—UA算法是 在SCE—UA算法的基础上。根据马尔可夫链蒙特卡罗 (MCMC)理论,以Metropolis—Hastings算法取代SCE— UA中的坡降算法(Downhill Simplex Method),估计出 最有可能的参数集及后验概率分布,并尽量避免算法 陷入局部极值点。SCEM—UA算法优化步骤如下: (1)选择样本群大小参数s和复合形数目q,那么 每个复合形中样本数目m=s/q; (2)产生s个样本,并根据所设定的目标函数计算 每个样本点的后验概率密度; (3)将样本点按后验概率密度递减方式排序,存储 在数组D[1:s,hn+l1中,其中n为估计参数个数,数组 中最右--N存储各样本点的后验概率密度; (4)初始化q个并行序列S ,Js ,…,5 的起始点, 即S 为O[k,l:n+1],此处k=l,2,…,9。将D[1:s,l: 十 1]划分为q个复合形C ,C ,…, ,每个复合形含有 m个样本点,使得第一个复合形包含次序为g(卜1)+1 的点,第二个复合形包含次序为q( 1)+2的点等,此 外 =1,2,…,m; (5)选择参数 , ,AR ,C 。对于每个复合形C , 调用SEM算法,运行L次: (6)将所有复合形放人数组D[1:s,I:n+l1,并将各 样本点依后验概率密度递减排列; (7)检查Gelman—Rubin(GR)收敛准则,如果 符合收敛条件则计算结束,否则转第(4)步。 2计算步骤 已知月径流序列{置} ,对其进行预测依赖于前m 个相邻历史值 ¨,置之…, 。首先对径流序列 划 分流量级别得到序列{S l ,定义A (S ,S 一.…,S¨)为 一个径流集合, 为A 的后续值(t=m+1,m+2,…,Ⅳ)。 这样,径流序列f } 就可以构成Ⅳ-m+1个径流集合。 要预报后续值 ,可将第N—m+1个径流集合分别与 其余Ⅳ_m个径流集合A 组成Ⅳ_,n个集对,对这Ⅳ-m 个集对进行同一性、差异性和对立性分析,并计算相应 的联系度。然后将联系度按降序排列,从中选择与当前 预测状态A川最接近的前k个径流集合A ,k为相似 集合样本数,建立A 与其后续值 的多元线性回归 方程,最后将A 代入该多元线性回归方程中即可得 到径流预报值 。 采用SCEM—UA算法对集对分析的差异不确定系 数 与相似集合样本数k进行优化率定,优化目标函 数为平均相对误差(MAE)最小化。 N l lMin MAE: 1∑ x100% (3) V i=1 yi 式中:Y 为第 时段实测流量; 为第i时段的预报 流量。 此外,利用该算法得到的“异参同效”(不同的参 数取值,但相应的MAE相差较小)参数可进行月径流 的概率预报,从而更好的量化参数不确定性。具体方法 为:以SCEM—UA算法的采样参数进行月径流模拟预 报,计算各组参数的似然值(目标函数值),设定一个临 界值,低于该临界值的参数似然值被赋为零。对高于临 界值的所有参数似然值重新归一化,然后将预报流量 按大小排序,计算累积似然权重,从而估算出一定置信 度下的模型参数不确定性区间。第t时段的模型不确 定性区间( )按式(4)计算。 UI=yo ±1.96 E (4) 厂—— r——————一 式中:RMSE为均方根误差,RMSE=1\/ (yr-ys ) , 其余符号同前。 3实例分析 采用某水电站1958~2005年共48a的实测月径 流资料作为研究对象,流域降雨主要集中于每年的6~ 9月,此阶段为丰水期,12月至次年4月为枯水期,该 时段径流主要由地下水补给.5月与11月为过渡期。 以月为时段,取前38a为训练期,余留10a为检验期。 首先对径流进行分级,考虑到年内径流的分期特性及 径流变幅的差异.将各分期(枯水期、过渡期与丰水 期)的径流均划分为10级,其中枯水期级别区问为 50m3/s.过渡期为100m3/s,丰水期为500m /s,若对应 级别处于同一状态定义为同。对应级别相差9级则定 义为相反,其它情况为相异。采用SCEM—UA算法对 集对分析的差异不确定系数,与相似集合样本数k 进行优化率定,算法参数设置为:样本群大小s=500, 复合型个数q=lO,迭代次数设为1 500。所得优化后 的参数称为优化参数。由于流量分级数目较多,采用 一般方法不易确定,值,为便于比较,采用均匀取值 法确定差异度分量系数,,所得参数称为经验参数,参 数取值见表1。 10 水文 第33卷 由表1可知,两种方法所得参数差别还是较为明 显的,特别是参数11-,4,即相异状态差别不大时(相差 1~4级),SCEM—UA算法所得到的优化参数相差不大 (0.99~0.64),从而便于更加合理的选取相似历史样本 进行预报,而当相异状态差别较大时( ~ ),差异度分 量系数变化较大,由0.09减小至一O.78,特别是厶到厶, 表明优化算法能够通过改变差异度分量系数达到有 效识别相似历史径流集合的目的。对比均匀取值法所 得的经验参数,由于是均匀取值,只能线性分配各差 异度分量系数,无法有效描绘不同级别差异度的影 响。取SCEM—UA算法参数收敛后所得的“异参同效” 参数进行分析,各参数的取值范围、优化参数及经验 参数见图1 1.0 0.5 0.0 一 一一’ 一、. …一优化参数区 、、 、 .. -0.5 。。-___・・区间均值 、、、 :’ . —★_优化参数 、、~ — —1.O 经验参数 ~…~~一~ 图1 差异度分量系数变化曲线 Fig.1 The variation CuFve of difference coefficient 由图1可见,经验参数与区间均值(“异参同效”参 数集的相应参数均值)相差较小,最大相差为0.17。“异 参同效”参数集中各参数的变幅较大,最大变幅达1.4, 表明参数的不确定性较大。通过比较各“异参同效”参 数集中的各组参数,,值均呈单调递减,表明SCEM— UA算法能够有效优化率定差异度分量系数,值。表2 为两类参数的径流模拟精度统计。 表2径流模拟精度对比 Table2 The results of monthly runoff simulation 由表2可知,采用SCEM—UA算法的优化参数进 行径流预报的精度明显高于经验参数的预报精度。在 训练期,利用优化参数的径流模拟MRE高于经验参 数4.5%,检验期则为5.8%,表明利用集对分析法进行 径流预报时,采用SCEM—UA算法优化差异度分量系 数是必要的,能够较大幅度提高模拟与预报精度。进一 步分析精度提高的原因,其一为在一定的优化目标函 数下对参数进行率定,必然比采用经验的均匀取值法 的预报精度有一定的提高,特别在需确定较多差异度 分量系数的情况下,应尽量采用优化方法确定参数:其 二为采用SCEM—UA算法时,该算法是一种全局搜索 算法,采用拉丁超立方体采样,并根据马尔可夫链自适 应的调整转移概率。从而保证参数后验概率密度的连 续更新与进化,最终达到识别非劣参数及后验分布的 目的。 图2为检验期径流区间预报结果,参数不确定性 区间为采用“异参同效”参数集进行径流预报的区间范 围。模型不确定性区问按式(4)计算得到。由图2可见, 参数不确定性区间并没有完全覆盖全部的实测流量, 特别是对于高流量,且模型不确定性区问变幅过大.参 数不确定性占全部不确定性的70%左右.但对于高流 量该比例相对较小,表明对于高流量预报,单独依赖径 流序列自身的单要素预报方法 其精度很难得到进一 步提高,需考虑多因素预报。 4结论 采用集对分析法进行径流预报时,针对流量分级 较多情况下差异度分量系数不易确定的问题,本文采 用SCEM—UA算法对参数进行优化率定,从而提高径 流模拟精度。实例计算表明: (1)采用SCEM—UA算法优化差异度分量系数, 以此进行径流预报,模拟精度较采用均匀取值法有 较大提高,基于优化参数的集对分析预测模型是有 效的: (2)参数不确定性在径流预报的全部不确定性中 占有较大比例,但在高流量预报中该比例显著减小; (3)仅采用径流时间序列进行单因素预报的预报 第1期 刘冀等:基于参数优化的集对分析月径流预测 11 120o0 lO0oO 8Oo0 6000 媛 40o0 2000 0 61 76 1O6 时段/月 图2基于优化参数的集对分析径流区间预报结果(检验期) Fig.2 Hydrograph prediction uncertainty derived using optimal parameters(Validation period) 精度还较低,且预报不确定性较大,应尽量采用具有物 [3]王文圣,李跃清,金菊良,等.水文水资源集对分析[M】.北京:科学出 理成因联系的因素进行多因素径流预报,以期进一步 版社.2010.(WANG Wensheng,LI Yueqing,JIN Juliang,et a1.Set Pair Analysis for Hydrology and Water Resources Systems[M].Bei— 提高预报精度。 jing:Science Press,2010.(in Chinese)) 参考文献: [4]李佳,王黎,马光文,等.基于SPA—ANN耦合模型的年径流预测[JJ.水 [11赵克勤.集对分析及其初步应用[M].杭州:浙江科学技术出版社, 力发电学报,2009,28(1):41-44.(LI Jia,WANG Li,MA Guangwen, 2000.(ZHAO Keqin.Set Pair Analysis and Its Prelimmary Applica。 et a1.Annual runoff forecasting based on SPA—ANN coupling mod— tion【M】.Hangzhou:Zhejiang Science and Technology Press,2000.(in el[J].Journal of Hydroelectric Engineering,2009,28(1):41—44.(in Chinese)) Chinese)) [2]邓红霞,李存军,赵太想,等.基于SPA的水文预测模型评估[J1.I ̄t/H [5】Vrugt J A,Gupta H V,Bouten W,et a1.A shuffled complex evo- 大学学报(工程科学版),2006,38(6):34—37.(DENG Hongxia,LI lution metropolis algorithm for optimization and uncertainty assess Cunjun,ZHAO Taixiang,et a1.Evaluation of hydrologic forecast ment of hydrologic model parameters[J].Water Resources Research. model based on SPA[J】.Journal of Sichuan uniVersity(Engineering 2003,39(8):18. Science Edition),2006,38(6):34—37.(in Chinese)) Monthly Runoff Prediction Based on Set Pair Analysis with Parameters Optimization LIU Ji,XU Gang,PENG Tao,MING Bo (College of Hydraulic and Environmental Engineering,China Three Gorges University,Yichaug 443002,China) Abstract:When predicting monthly runof with set pair analysis(SPA)method,it will become much diifcult to determine the dif- ference degree c0e伍cients as the number of runoff levels increased.To solve this problem,the SCEM-UA algorithm was employed for optimizing the difference degree coefifcients of SPA.This method was applied to forecast the monthly runoff.The results show that the proposed method can effectively distinguish the effects of difference degree among set pairs,and the difference degree CO— efifcient optimized bv the method is effective and reasonable,the runoff prediction accuracy is improved greatly.Also,the parame— ter uncertainty occupies the largest proportion in the model uncertainty. Key words:set pair analysis;runoff prediction;SCEM-UA;difference degree coefifcient