您好,欢迎来到微智科技网。
搜索
您的当前位置:首页动态测量数据的合理性检验方法研究

动态测量数据的合理性检验方法研究

来源:微智科技网
第20卷 第4期 2011年8月 运 筹 与 管 理 OPERATIONS RESEARCH AND MANAGEMENT SCIENCE Vo1.20,No.4 Aug.2011 动态测量数据的合理性检验方法研究 倪兴, 张韵华 (中国科技大学数学系,安徽合肥230051) 摘要:采样数据合理性检验,是数据处理中重要的一环,它的主要功能是鉴别采样数据中可能含有的异常值, 并进行相应的机理分析与修复工作。本文从飞行器外测系统工程应用的角度出发,给出了两种简单易行的判断 方法。 关键词:航天测控;采样数据;合理性检验;异常值 中图分类号:V557+.5 文章标识码:A 文章编号:1007—3221(2011)04—0l13-O3 The Logical Inspecting Method of Dynamic Measuring Data NI Xing,ZHANG Yun—hua (Department of Mathematics,University Science and Technology of China,Hefei 23005 1,China) Abstract:The logical inspection of sampling data is an important process of disposing data.Distinguishing excep- tional data,analyzing relevant principium and restoring exceptional data are its primary function.The article pres- ents two simple methods from the point of view of the application in the aircraft system. Key words:spaceflight meterage;sampling data;logical inspection;abnormal data 0 引言 在航天测控系统中,无论是外弹道测量数据事后综合处理中广泛采用的多项式滤波与微分平滑技术, 还是基于Kalman滤波公式的实时预报和控制技术,从统计学理论的角度都可以视为:在一定的公式或模 型假定下,依据对动态目标的一系列跟踪测量数据所组成的数据集合A,采用统计的或数值分析的方法去 分析或预报目标的运动状态及特性。由此可见,数据集合A是进行推断或决策的起点,A中数据的质量 如何,直接影响着我们判断的精度和可靠性。经验告诉我们,即使是高质量的原始采样数据,由于各种各 样偶然因素的影响,多少会有些数据严重偏离目标真值,这部分数据被称为异常点。大量的应用分析与仿 真结果表明:无论是基于最小二乘理论的线性滤波还是频谱分析中著名的极大熵谱估计,对采样数据中包 含的异常点都极为敏感。例如:Huber严格证明了线性模型Y= 十 的最小二乘估计/3 =(x )I1X Y 的小样本能溃点为占=0,也就是说,采样数据中哪怕只包含一个异常数据也足以使参数估计值/3‘严重偏 离真值JB。附表与图充分说明了这一点。 附表1是Anscombe于1973年给出的有名的仿真数据。直线厶是基于全部11个点的最dx-"乘拟合 直线多=3.0ll9+0.4983x,它的残差平方和R =13.49,复相关系数R =0.67;而直线 是剔除第10点 (其相应的Y值为12.7)后的10个点的最小而乘拟合直线Y=4.0057+0.345x,它残差平方和R =1.12 X 收稿日期:2010-O1—15 基金项目:中科院创新项目 作者简介:倪兴(1976.),男,江苏人,硕士研究生,主要从事数值分析、数据处理工作;张韵华(1949一),女。剐教授,研究方向:数值计算、 符号计算应用。 1 14 运 筹 与 管 理 2011年第2O卷 4.0 y 5.39 5.0 5.73 6.0 6.08 7.0 6.42 8.0 6.77 9.0 7.1I 10.0 7.46 l1.0 7.81 12.0 8.15 l3.0 12.7 14.0 8.84 y一 0.38 0.23 0.08 -0.08 -0.23 -0.39 -0.54 —0.69 -0.85 3.2 一1.16 y— 0.003 —0.002 0.004 —0.002 0.002 —0.OO4 0.000 0.O04 ● —0.002 (4.202) 一0.004 // Ll L2 一 6 一8 10 12  l4 图1仿真数据散点图 从图1可直观的发现,由于第l0点的参与,直线L 远不及直线 :拟合的好,或者说由于第l0点的较 大影响将拟合直线拉偏了。 上述例子表明,在工程数据的统计分析中,剔除数据集合A中包含的异常点是必要的。 1外推拟合法 在测量过程中观测数据是动态变化的,且在误差允许范围之内随时间连续变化。当观测数据存在异 常值时,就存在超范围的突变,因此,可以用下面的方法判断观测数据是否为可疑的异常值。 以前面连续正常的观测数据为依据,应用最小二乘估计和时间多项式外推后一时刻的观测数据估计 值,与该时刻的实际数据做差,识别差值是否超过给定的门限6。假若超过门限8,则认为该观测数据是可 疑异常值,否则认为是正常值。通常取前面4点或6点连续正常的观测数据,采用一阶或两阶多项式进行 计算 假设连续4个观测数据记为 值 为 , ㈡, 曼 : ,由最dx--乘估计线性外推获取第i时刻观测数据的估计 +1 1f Xi!TXi+  2一 i一_ 4 一 -(1)( ) 式中,观测数据 前面的系数在外推时为零。 l f一 i I≤艿 (2) 当获得第i时刻观测数据 时,则观察式(2) 是否成立。假如满足式(2),则认为 为正常值;否则认为是可疑异常值,应将它剔除,并用拟合后的 估计值来代替它。8一般为3 或5 ,而 为相应观测量测量误差的均方差。 当应用其它点数或二阶多项式外推时,只要将式(1)及其系数由最小二乘估计的外推原理所得到的 数值代替即可。 2异常点剔除的自适应算法 在采样数据中,如果有异常点的出现,则必然会导致误差的增大,于是,从误差的角度出发,提出下面 的算法。 第4期 倪兴,等:动态测量数据的合理性检验方法研究 Y‘= Yf= +e +or i=1,2,…,m i=1,2,…,//'/, 115 (3) (4) 考虑线性模型 由L—s拟合 记 则  l, 2,…, ),e=(eI,el,…,e ,), Y=(Y。,Y ,…,Y ), X(=(orI,or2,…,or ) (5) ( X) X Y 考虑拟合函数的方差 算法步骤: 。=∑or :∑(y 一 ) ftI f=I (6) Step 1输入观测数据{ ,Y },i±1,2,…,m;检验门限值6,N=m。 Ⅳ Step 2构造Ⅳ个点的拟合函数;计算or :∑(Y。一 置 ) 。 Step 3 if(or >8)then{比较Iro I,删除IoriI最大的点;Ⅳ卜Ⅳ一1;goto step2}。 Step 4输出计算结果。 自适应剔除方法在某些方面有一些像全子集回归,也有一点像leave.one.out Cross.Validation,但是有 以下不同: 第一,相对于全子集回归,我们不改变待估参数的个数和组合,整个过程中的待估参数不变。第二,相 对于leave—one—out Cross.Validation和全子集回归,我们计算量大大减少。原因在于我们在选择剔除哪个 点的时候,即第一步是直接在内部进行比较,从而减少了回归次数和计算量。 3 应用分析 需要进行合理性检验的仿真某设备记录的测量数据 如下图所示,从图2中可以看出,该数据虽然有非常明显 的变化规律,但存在非常明显的异常值,且为孤立型野值。 我们采样自适应算法对其进行合理性检验,找到异常 值两个,并且能判断异常点所在位置,费时不足一秒。从 计算过程、结果可以看出:该算法不但能判断有无异常点, 而且能找出异常点所在位置,计算方法简单,能节省大量 时间。 图2某设备仿真数据图 这两种判断方法也存在一定的局限性,对大多数异常点来说,这两种方法都可以判断出来,但仍有一 些异常值难以判断,如不满足“6”准则的数据段肯定包含异常值,但满足“8”准则的数据段也可能包含异 常值。因此,上诉算法只能识别性状明显的异常值,而对于不明显的异常值,需要另想办法。用自适应算 法对数据合理性检验方法在运筹学、计算数学、逼近论和控制论中都有广泛的应用意义。 参考文献: [1]刘丽生,等.外弹道测量数据处理[M].jE京:国防工业出版社,2002. [2]童丽,曾泳强,王正明.异常点剔除及其并行实现[J].数值计算与计算机应用,2000,3:171.177. [3]黄家贵,詹武平.合理性检验的方法研究[J].装备指挥技术学院学报,2002,4:93-97. [4]胡峰.曲线拟合的抗野值估计与动态数据合理性检验[J].导弹试验技术,1993,3:19-41. [5]牟志华,张慧娟.基于最小二乘的导弹外弹道精度分析系统[J].指挥控制与仿真,2007,(4):43。44 

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- 7swz.com 版权所有 赣ICP备2024042798号-8

违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务