收藏本站
《燕山大学》 2012年
收藏 | 手机打开
二维码
手机客户端打开本文

异常数据检验的几种方法

张慧娟  
【摘要】:异常数据的检验是对一组样本是否含有异常数据进行的检验。异常数据是指一组数据里的个别值,其明显偏离该组数据的其他值。异常数据的出现在一定程度上降低了数据的质量,使相应的数据分析结果发生明显变异,最终导致人们对问题给出不正确的结论。因此,异常数据的检验是统计分析中首要的工作。 论文利用假设检验的基本原理和方法来检验样本中出现的异常数据。针对常见的几种分布,如均匀分布,极值分布,双参数指数分布,着重讨论了当样本数据中可能存在异常数据时的检验方法。主要利用顺序统计量或总体参数的优良估计来构造功效性较好的检验统计量,从而建立新的检验方法。主要内容如下: 首先,论文讨论了均匀分布下异常数据的检验,在顺序统计量的基础上构造了新的检验统计量,利用顺序统计量的分布性质,推导出了其精确分布及其相关性质,并针对Dixon型检验统计量进行比较,表明了新的检验统计量功效更好。 其次,论文讨论了极值分布下异常数据的检验,主要针对Dixon型检验统计量进行了改进,提出更高功效的检验统计量,推导出了改进后检验统计量在极值分布下的精确分布,讨论了两统计量的功效对比,表明改进后的统计量更具高功效。 最后,论文讨论了双参数指数分布下异常数据的检验,找出总体参数具有较好稳健性的估计量,在其基础上构造了新的检验统计量,推导出了在原假设成立下的精确密度函数,为假设检验临界值的计算提供了依据。
【学位授予单位】:燕山大学
【学位级别】:硕士
【学位授予年份】:2012
【分类号】:O212.1

【参考文献】
中国期刊全文数据库 前10条
1 熊燕;李艳红;;基于数据挖掘的电力系统异常数据辨识与调整[J];安徽电气工程职业技术学院学报;2010年03期
2 吴应清;;异常数据挖掘在实际中的应用[J];办公自动化;2011年10期
3 张珍花;路正南;;经济异常数据的挖掘方法与处理研究[J];商业研究;2007年05期
4 何朝兵;田彦伟;;顺序统计量的分布[J];成都大学学报(自然科学版);2008年02期
5 王伟;关于顺序统计量分布的一种证明[J];长春大学学报;2002年06期
6 李云飞,黄继伟,朱宏;双参数指数分布异常数据的检验[J];电子科技大学学报;2005年01期
7 朱宏;Ⅰ型极值分布样本多个异常值的检验[J];地质科技管理;1994年03期
8 李培军;;抽样调查中样本异常值的测量[J];大连海事大学学报(社会科学版);2009年01期
9 胡凯,于辰声,马东升,翟建平,张文兰,肖振宇;粤东北嵩溪银-锑矿有机质中银的异常富集及其矿床勘探意义[J];地质科学;2001年01期
10 潘高田,潘峰,王晖,杨雷;顺序统计量在小样本检验中的理论和方法研究[J];工程数学学报;2005年02期
中国博士学位论文全文数据库 前1条
1 姚卫新;智能数据分析中异常数据的集成化管理方法研究[D];复旦大学;2004年
【共引文献】
中国期刊全文数据库 前10条
1 董克;琚逸云;;广播电视大学开放教育学费回归分析[J];安徽广播电视大学学报;2011年02期
2 丁元耀;一类单边截断族中参数的渐近有效估计[J];安徽大学学报(自然科学版);1996年04期
3 吕晓光;崔可锐;李丹;周阳;;基于Plaxis的土质边坡稳定性影响因素分析[J];安徽建筑工业学院学报(自然科学版);2010年03期
4 朱成莲;;林木最近距离分布模型的参数估计[J];安徽农业科学;2008年24期
5 夏海峰;;小麦品种感染赤霉病的独立性检验[J];安徽农业科学;2010年23期
6 张红芹;高来斌;;用Chebyshev多项式预测粮食产量的研究——以吉林省粮食产量为例[J];安徽农业科学;2010年36期
7 张少华;;数学期望在农业生产中的应用[J];安徽农业科学;2011年16期
8 张少华;;存储论在农业生产中的应用[J];安徽农业科学;2011年19期
9 王振坤;李翠平;;洛伐他汀发酵培养基的改进[J];安徽医药;2009年06期
10 汤胜道,汪凤泉;负二项分布下参数的方差一致最小无偏估计及贝叶斯估计[J];安庆师范学院学报(自然科学版);2003年01期
中国重要会议论文全文数据库 前8条
1 韩涛;卢晓春;饶永南;王沛;张帆;吴杨扬;;导航卫星星座几何精度因子饱和值分析[A];第二届中国卫星导航学术年会电子文集[C];2011年
2 唐光武;廖敬波;刘怀林;赵岩;;传感器优化配置的一种统一方法[A];全国既有桥梁加固、改造与评价学术会议论文集[C];2008年
3 王蓉华;徐晓岭;顾蓓青;;几何分布产品步进应力加速寿命试验下的点估计[A];2011年全国机械行业可靠性技术学术交流会暨第四届可靠性工程分会第三次全体委员大会论文集[C];2011年
4 李凤;;逐步增加Ⅱ型截尾下Pareto分布的参数估计[A];数学·力学·物理学·高新技术交叉研究进展——2010(13)卷[C];2010年
5 郑小兵;董景新;;基于遥外差数据估算初始定位误差的新方法[A];2010年惯性技术 发展动态 发展方向研讨会文集[C];2010年
6 胡娟;;教师对教学质量影响的实证分析[A];2012管理创新、智能科技与经济发展研讨会论文集[C];2012年
7 苏培东;吴明军;刘卫华;;汉源新集镇滑坡影响因素敏感性的正交试验分析[A];第九届全国工程地质大会论文集[C];2012年
8 陶山山;董胜;吕红民;;海洋工程设计波高的区间估计方法初探[A];2012年度海洋工程学术会议论文集[C];2012年
中国博士学位论文全文数据库 前10条
1 刘文海;水下被动目标瞬态特征检测技术研究[D];哈尔滨工程大学;2010年
2 韩凤亭;珠江三角洲地区港口工程风险分析及经济评估[D];中国海洋大学;2009年
3 侯文杰;内生消费、消费行为和消费增长[D];南开大学;2010年
4 李天梅;装备测试性验证试验优化设计与综合评估方法研究[D];国防科学技术大学;2010年
5 纪芳;渤海和黄海北部沿岸海洋动力灾害研究[D];中国科学院研究生院(海洋研究所);2010年
6 李莲芝;汽车变速箱质量问题追溯的理论方法研究[D];吉林大学;2011年
7 马志勇;大型风电叶片结构设计方法研究[D];华北电力大学(北京);2011年
8 宋世明;广东大降坪和大宝山硫化物矿床多元同位素与稀土元素地球化学示踪研究[D];南京大学;2011年
9 吴茗;非简单随机抽样下的一些统计推断问题[D];华中师范大学;2011年
10 徐文科;基于微分方程的生态数学模型统计分析[D];东北林业大学;2009年
中国硕士学位论文全文数据库 前10条
1 刘辉;基于电子鼻的鱼粉新鲜度快速检测方法研究[D];华中农业大学;2010年
2 姜丽丽;重置期权的保险精算法定价[D];山东科技大学;2010年
3 蔡静颖;模糊c-均值算法的研究[D];辽宁师范大学;2010年
4 温泉;羊毛混色纺纱智能测色配料系统[D];浙江理工大学;2010年
5 黄博;微功耗水声遥控系统解码技术研究[D];哈尔滨工程大学;2010年
6 姚艳杰;水库除险加固效益的风险评估[D];中国海洋大学;2010年
7 孙平利;POT模型在风暴潮债券中的应用[D];华东师范大学;2010年
8 薛蕊;线性混合模型的参数估计[D];安徽师范大学;2010年
9 张云鹏;发动机机械故障诊断系统特征提取算法研究[D];长春工业大学;2010年
10 白海霞;蓄电池在线监测系统的研究与设计[D];北京交通大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 陈伟;刘思峰;邱广华;;计算机审计中一种基于孤立点检测的数据处理方法[J];商业研究;2006年17期
2 匡能晖;;关于两参数瑞利分布顺序统计量的分布性质[J];江西师范大学学报(自然科学版);2009年06期
3 何朝兵;田彦伟;;顺序统计量的分布[J];成都大学学报(自然科学版);2008年02期
4 王伟;关于顺序统计量分布的一种证明[J];长春大学学报;2002年06期
5 邵婷婷;马建仓;胡士峰;王超;;电子罗盘的倾斜及罗差补偿算法研究[J];传感技术学报;2007年06期
6 何义斌,吴书帮,谢洪燕,赵建虎;多波束异常测深数据检测方法实践[J];测绘科学;2004年01期
7 傅佩红;李雪飞;贺立源;;遗传算法在特异值识别与处理中的应用[J];测绘科学;2008年02期
8 余剑;高精度智能测量系统中粗大误差的处理技术[J];测试技术学报;2003年03期
9 李云飞,黄继伟,朱宏;双参数指数分布异常数据的检验[J];电子科技大学学报;2005年01期
10 朱宏;Ⅰ型极值分布样本多个异常值的检验[J];地质科技管理;1994年03期
中国博士学位论文全文数据库 前4条
1 殷瑞飞;数据挖掘中的聚类方法及其应用[D];厦门大学;2008年
2 沙朝锋;基于信息论的数据挖掘算法[D];复旦大学;2008年
3 任斐;基于数据挖掘的自适应异常检测研究[D];吉林大学;2009年
4 贾俊杰;空间数据挖掘中若干关键技术研究[D];长安大学;2009年
【相似文献】
中国期刊全文数据库 前10条
1 徐晓岭,王蓉华;Weibull分布异常数据检验[J];数理统计与应用概率;1996年02期
2 陆松澄;数理统计基础知识(四)[J];地震;1982年06期
3 李文东;张建军;乔昱亚;;指数分布场合异常数据的检验[J];长春大学学报;2006年08期
4 王蓉华,费鹤良,徐晓岭;异常数据检验的均值比方法[J];数理统计与应用概率;1998年01期
5 李文钧;格拉布斯法检出异常数据[J];玉溪师范学院学报;1986年01期
6 费鹤良,陆向薇,徐晓岭;异常数据检验的屏蔽效应[J];应用概率统计;2002年02期
7 宋宜容;测量数据中异常数据的检验比较[J];青海大学学报(自然科学版);2001年01期
8 宋宜容;测量数据中异常数据的检验比较[J];西北农林科技大学学报(自然科学版);2002年03期
9 李云飞;杨爽;;Ⅰ型极小值分布样本异常数据的检验[J];内江师范学院学报;2010年06期
10 吴国发;钟微明;;鉴别满足线性模型的样本中异常数据的一种方法[J];控制与决策;1988年04期
中国重要会议论文全文数据库 前10条
1 金莹;汤银才;;Weibull分布下异常数据的线性检验方法[A];中国现场统计研究会第12届学术年会论文集[C];2005年
2 韩秀英;;体育测量中剔除异常数据的方法[A];体质研究与健康促进论文集[C];2006年
3 孙舒;刘莉;张瑛;;基于典型负荷模式的异常数据处理[A];中国高等学校电力系统及其自动化专业第二十四届学术年会论文集(中册)[C];2008年
4 胡绍林;黄刘生;;非平稳信号的2(?)2型双重中值容错滤波算法[A];2003年中国智能自动化会议论文集(下册)[C];2003年
5 胡峰;孙国基;;线性模型系数的有界影响辨识[A];1998年中国智能自动化学术会议论文集(下册)[C];1998年
6 龚家军;刘国臻;;防雷检测异常数据产生的原因与解决方法[A];2006年湖北省气象学会学术年会暨湖北省第一届防雷论坛学术论文详细文摘汇集[C];2006年
7 孙亚;皮晓亮;;环形检测线圈采集信息数据预备技术的研究及应用[A];第一届中国智能交通年会论文集[C];2005年
8 彭惠英;姚斯里;卢伟东;蔡玲玲;王燕玲;王南燕;;地面气象记录人工与遥测异常数据的处理方法[A];第26届中国气象学会年会人工影响天气与大气物理学分会场论文集[C];2009年
9 王莉萍;王莉;孙效光;代伟;;极值分布模式在设计波高推算中的应用[A];第十五届中国海洋(岸)工程学术讨论会论文集(中)[C];2011年
10 郑凯;;建立多维数据异常点识别方法的尝试[A];第八届全国体育科学大会论文摘要汇编(一)[C];2007年
中国重要报纸全文数据库 前10条
1 萧文朱春凤 胡清水;发票异常数据定期通报[N];中国税务报;2007年
2 萧文钟再利 胡清水;分析电子档案 锁定异常数据[N];中国税务报;2008年
3 何晓华徐云翔;参数化执法检查:从异常数据中找问题[N];中国税务报;2007年
4 萧文李移风 韩冰 胡清水;信息比对锁定医药经销企业异常数据[N];中国税务报;2007年
5 通讯员 王文海 姜荣;盐城地税积极推进信息化[N];财会信报;2008年
6 黄晓锋季云;通州地税局六分局 深化数据应用[N];江苏经济报;2007年
7 熊志刚 韩天雪;异常数据挖掘与反保险欺诈[N];中国保险报;2006年
8 叶家全 向梅;ATC系统测试平台关键技术通过部级鉴定[N];中国民航报;2007年
9 阮力;北京完成住宿设施接待日报监测[N];中国信息报;2007年
10 向前贠相忠;管理前置:事前给数据作“健康检查”[N];中国税务报;2007年
中国博士学位论文全文数据库 前10条
1 姚卫新;智能数据分析中异常数据的集成化管理方法研究[D];复旦大学;2004年
2 杜宝军;最大顺序统计量的随机比较与判别分析[D];兰州大学;2012年
3 朱宏;异常观测数据处理及不确定大系统的鲁棒镇定[D];四川大学;2003年
4 曾绍华;支持向量回归机算法理论研究与应用[D];重庆大学;2006年
5 钟慧湘;基本矩阵计算方法的研究[D];吉林大学;2005年
6 刘彬生;基于小波和傅立叶变换的道路交通量预测研究[D];哈尔滨工业大学;2006年
7 温建宁;供应链管理及统计数据识别处理研究[D];兰州大学;2008年
8 赵鹏;条件顺序统计量和样本间隔的随机比较以及应用[D];兰州大学;2008年
9 李光强;时空异常探测理论与方法[D];中南大学;2009年
10 毛李帆;电网规划中长期负荷预测技术的研究[D];湖南大学;2011年
中国硕士学位论文全文数据库 前10条
1 张慧娟;异常数据检验的几种方法[D];燕山大学;2012年
2 高玉霞;多维数据异常点识别方法的研究[D];沈阳体育学院;2010年
3 王超;幂赋范顺序统计量极值分布的收敛速度[D];西南大学;2012年
4 徐晨;异常数据均匀分布检验法的研究[D];东北大学;2006年
5 乐立利;观测数据的异常值统计检验方法研究[D];中南大学;2008年
6 李云飞;异常观测数据的统计检测方法研究[D];电子科技大学;2005年
7 唐林俊;金融市场风险价值(VaR)的若干新方法及其应用[D];重庆大学;2003年
8 司波;长江流域短历时强降水极值分布的研究[D];南京信息工程大学;2012年
9 韩成栋;政府规模、政府的保护职能与经济增长[D];东北财经大学;2007年
10 汪秀元;基于异常检测的入侵检测系统设计与实现[D];北方工业大学;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026