实例介绍
剔除测量数据中异常值的若干方法,
第1期 何平:剔除测量数据中异常值的若干方法 21 表3n,a相应的Y 值 3.9 1-0 0.01 0.01 0.679 0.576 19 0.462 0.889 ).765 120.642 0.546 0.535 0.450 0.780 0.642 13 0.615 0.52l 21 0.524 0.440 60.698 0.560 14 0.641 0.546 0.514 0.430 0.637 0.507 15 0.616 23 0.505 8 0.683 0.554 160.595 0.507 0.413 0).406 10 0.447 180.561 0.475 表4Z,与n值的对应关系 345 89 0 2131415161820301050 zc1.381.541.651.731.801.881.921.962.002.032.072.102.132.152.202.242.392.492.58 表51组测量数据(已按顺序从小到大排好) 8 10 t20.3020.3920.3920.3920.4020.4020.4]20.4120.4220.4220.4220.4320.4320.4320.43 查表3得到临界值Y。(15,0.05)=0.525,根据也都有其局限性。例如:所有的准则都是以数据按正态 狄克逊准则,由于Y2>%(15,0.05),故t值是异常分布为前提的,当偏离正态分布时,判断的可靠性将受 值,应予舍弃。 影响。还有几个准则对n值的要求也各有不同:当大样 程序框图如图3所示 本测定时,使用莱因达准则最适合,但当小样本测定 24肖维勒准则应用软件流程图及实例 时,则一般推荐使用格拉布斯准则和狄克逊准则。而肖 计算算术平均值t=20.405 维勒准则在某种程度上讲仅仅是莱因达准则的补充 计算剩余误差v及均方差a=0.01498 在实际测量中,一般取测量次数n=5~20次,特 从表4中查得相应的Z值(n=15,故Z2=2.13) 别精密的测量,也很少超过100~200次。因此,使用 根据肖维勒准则检测l1是否为异常值 以上各种准则时,必须注意测量次数的限制。对于莱因 1-t|=0.105 达准则、一般建议测量次数大于或等于50次,而对于 而Zσ=2.13×0.01498≈0.03191 格拉布斯准则和狄克逊准则,则建议小于或等于20 次。但这一区别并不是十分严格的 由于|1-t1>z,则t1值异常,应予舍弃。程序框图 对小样本来说,由于格拉布斯准则能给出较严格 如图4所示。 的结果,狄克逊准则无需计算X和o,方法简便,且2 3几种方法的进一步讨论 者的概率意义明确。因此,它们能较好地适用于采样次 从以上的应用情况来看,似乎各种准则的应用实数不太多的一般测量列 践都很一致,但这只是个特例,并没有普遍性。举这个 设X为N(0,1),在1个大小为n的子样中混入 例子,只为了更好地说明几种准则都能得到很好的应 个Y:N(μ,δ)的子样。有研究结果表明:格拉布 用。需要指出的是,以上各准则都是人为主观拟定的, 斯方法的检出概率P略高于狄克逊方法的检出概率 直到目前为止,还没有统一的规定,因此,它们的应用 PD,如表6所示:(N(0,1)叫作标准正态分布) o1994-2012ChinaAcademicJournalElectronicpUblishingHouse.Allrightsreservedhttp://www.cnki.net 2 航空计测技术 第15卷 START START START START 输入数据 输入数据 输入数据 输入数据 计算算术平均值入 计x 根据n值, 及均方根偏差 从表2中计算出相应y 计算算术平均值 计算剩余误差;, 计算T值并选定 均方根偏差σ 危险率a 选定危险率a 计算剩余误差v, 均方根偏差 判别粗大误差 查表得相应的(n,a)从表3中查出%(n,a)值 从表4中查出相应Z值 打印输出结果 判别数据是否为异常?判别敦据是否异常 判别粗大误差 END ExD END END 图1莱因达准则应图2格拉布斯准则 图3狄克逊准则应 图4肖维勒准则应 用程序框图 应用程序框图 用程序框图 用程序框图 表6P与PD的比较 舍。但是,对待粗大误差,除从测量结果中及时发现和 利用剔除原则鉴别外,更重要的是提高工作人员的技术 a(%) 水平和工作责任心,不要在情绪不宁和极度疲劳的情况 5.0 1.0 下,进行重要的测量工作。另外,要保证测量条件的稳 定,防止因环境条件剧烈变化而产生的突变影响。只有 δ11221122这样,才能提高测量的精度,得到满意的测量结果 PG(%)10.240.429.854.22.515.712.731.3 参考文献 PD(%)9.335.726.850.02.212.910.526.3 1梁晋文等编著.误差理论与数据处理.北京:中国计 由于混入的Y不一定是子样中最大的数据,所以, 量出版社,1989 实际检出效果还要高一些 2何国伟编著,误差分析方法.北京:国防工业出版社, 4结束语 3王文松.测量列中离群值的判断.电测与仪表,1992, 从以上论述可以看出,在进行测量数据处理时,可 11) 以应用各种准则进行粗大误差判别,以决定数据的取 o1994-2012ChinaAcademicJournalElectronicpUblishingHouse.Allrightsreservedhttp://www.cnki.net 【实例截图】
【核心代码】
标签:
相关软件
小贴士
感谢您为本站写下的评论,您的评论对其它用户来说具有重要的参考价值,所以请认真填写。
- 类似“顶”、“沙发”之类没有营养的文字,对勤劳贡献的楼主来说是令人沮丧的反馈信息。
- 相信您也不想看到一排文字/表情墙,所以请不要反馈意义不大的重复字符,也请尽量不要纯表情的回复。
- 提问之前请再仔细看一遍楼主的说明,或许是您遗漏了。
- 请勿到处挖坑绊人、招贴广告。既占空间让人厌烦,又没人会搭理,于人于己都无利。
关于好例子网
本站旨在为广大IT学习爱好者提供一个非营利性互相学习交流分享平台。本站所有资源都可以被免费获取学习研究。本站资源来自网友分享,对搜索内容的合法性不具有预见性、识别性、控制性,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,平台无法对用户传输的作品、信息、内容的权属或合法性、安全性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论平台是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二与二十三条之规定,若资源存在侵权或相关问题请联系本站客服人员,点此联系我们。关于更多版权及免责申明参见 版权及免责申明
网友评论
我要评论