收藏本站
《重庆大学》 2002年
收藏 | 手机打开
二维码
手机客户端打开本文

强影响点的数据挖掘和图示

张森  
【摘要】: 随着数据挖掘技术在现代商业中的广泛应用,对异常点和强影响点的挖掘成了经济、统计等领域广泛研究的课题。由于数据挖掘和统计诊断是近半个世纪才发展起来的新兴学科,虽然取得了很多研究成果,但仍有许多问题处于探索之中。 本文在分析研究国内外有关强影响点的挖掘方法及其研究现状的基础上,从探索性数据分析的角度出发,提出了挖掘强影响点的两个新方法:基于关联分析的离差法和贡献得分降维法。其主要工作和结论如下: ·基于关联分析的离差法:利用关联分析方法,计算第k个观测值与中心的偏差系数和偏离系数,并根据它们的内积求离差度,用来判断强影响点。文中,针对几个典型实例,并编写了相应的计算程序,理论分析与计算结果表明:(1)使用该方法判断强影响点与经典方法相比较,结论是一致的。(2)该方法需要的样本容量可以很小,大于3个数据就可进行离差度计算与分析。(3)该方法计算工作量小,算法的时间复杂度为O()。 ·贡献得分降维法:对变量作主成分分析,计算贡献得分,从而对高维数据降维,剔除数据后并利用K-均值聚类求影响距离,判断强影响点。通过实例的计算分析,结果表明:(1)降维前后,使用影响距离和Cook距离所求得的强影响点是一致的,说明降维是可行的。(2)使用影响距离判断强影响点与经典方法-Cook距离相比较,结论是一致的,说明本文提出的影响距离法也是可行的。(3)通过降维,就可对高维数据的强影响点进行图示。 ·设计并开发了一个强影响点的挖掘系统。
【学位授予单位】:重庆大学
【学位级别】:硕士
【学位授予年份】:2002
【分类号】:O213

免费申请
【引证文献】
中国期刊全文数据库 前2条
1 刘大成;;回归诊断的可视化分析[J];黑河学院学报;2011年06期
2 夏天翊;;应用数学促信息化应用深入发展[J];软件产业与工程;2011年03期
中国硕士学位论文全文数据库 前2条
1 刘鲁宁;科技项目同行评议体系反评估模型分析与设计[D];哈尔滨工业大学;2007年
2 翟爽;基于数据删除的广义线性模型诊断方法[D];东北林业大学;2012年
【参考文献】
中国期刊全文数据库 前10条
1 龙蓓,林路;线性模型和广义线性模型中的一种强影响点的显著性检验法[J];广西科学;1998年03期
2 杨虎;单参数主成分回归估计[J];高校应用数学学报A辑(中文版);1989年01期
3 蒋盛益;线性回归模型强影响点的判定[J];怀化师专学报;1997年05期
4 周斌,吴泉源,高洪奎;用户访问模式数据挖掘的模型与算法研究[J];计算机研究与发展;1999年07期
5 童春发;线性回归模型中自变量变换与强影响点[J];南京林业大学学报;1997年04期
6 张继歌;回归分析中的异常点和影响点[J];统计研究;1994年02期
7 马秀兰;动态模型的跳点与强影响点[J];天津商学院学报;1996年04期
8 焦万堂;线性回归模型中强影响度量的一种新方法[J];太原重型机械学院学报;1997年01期
9 谢开贵,周家启;变权组合预测模型研究[J];系统工程理论与实践;2000年07期
10 王松桂;;回归诊断发展综述[J];应用概率统计;1988年03期
【共引文献】
中国期刊全文数据库 前10条
1 肖维品;建筑业科技进步预测与规划模型[J];四川建筑科学研究;1993年01期
2 陈建兵,顾祥林,敖鸿斐;矩阵迭代法求结构自振特性的初始向量及循环控制[J];四川建筑科学研究;2000年01期
3 孙泽宇;赵国增;舒云星;;二叉树后序遍历的递归和非递归算法[J];安徽电气工程职业技术学院学报;2006年01期
4 邹颖;郭世平;;基于灰色关联分析的高等数学教学质量评价[J];合肥师范学院学报;2009年06期
5 孙洪美;焦传兵;李永胜;张蒙蒙;臧德奎;;山东省紫薇品种观赏价值的灰色评价[J];山东农业科学;2011年04期
6 朱五英;;关于刻度参数的两样本的检验[J];安徽电子信息职业技术学院学报;2006年02期
7 陈华友;全距在确定组合预测最优权系数中的应用[J];安徽大学学报(自然科学版);2001年03期
8 陈华友;固定资产投资动态模型及优化分析[J];安徽大学学报(自然科学版);2002年04期
9 王海贤,陈思宝,陈桂景;“线性回归参数的固定大小序贯置信域的渐近理论”的改进[J];安徽大学学报(自然科学版);2003年03期
10 吴本忠,熊怀陆;关于X~2,T,F统计量的抽样分布[J];安徽大学学报(自然科学版);1995年04期
中国重要会议论文全文数据库 前10条
1 黄建宇;钟伦珑;吴仁彪;张春田;;一种用于民航地空通信系统载波频率实时监测的自适应陷波器设计[A];第十三届全国信号处理学术年会(CCSP-2007)论文集[C];2007年
2 李兴阔;李树广;周建梅;;重点城市反核生化恐怖防化装备能力的灰色多层次综合评判模型[A];中国运筹学会第九届学术交流会论文集[C];2008年
3 刘良季;;中国商品混凝土二十年[A];2007'中国商品混凝土可持续发展论坛论文集[C];2007年
4 许申来;陈利顶;;生态恢复的环境效应评价研究进展[A];第五届中国青年生态学工作者学术研讨会论文集[C];2008年
5 梅波;;三比值法与灰关联分析法在色谱分析技术中的运用[A];贵州省电机工程学会2010年优秀论文集[C];2010年
6 李建兰;黄树红;;发电设备状态评价的灰色模型[A];2007年鄂、皖、苏、冀四省电机工程学会汽轮机专业学术研讨会论文集(湖北卷)[C];2007年
7 陈德春;毛丹红;汪乐强;;渔港鱼货年卸港量的灰色对偶映射预测模型研究[A];第十二届中国海岸工程学术讨论会论文集[C];2005年
8 王金梅;张吉春;;基于VB语言编写测量程序的应用[A];吉林省测绘学会2008年学术年会论文集(下)[C];2008年
9 唐光武;廖敬波;刘怀林;赵岩;;传感器优化配置的一种统一方法[A];全国既有桥梁加固、改造与评价学术会议论文集[C];2008年
10 李俊峰;戴文战;;基于灰色关联度和神经网络的变权组合预测模型研究[A];2006中国控制与决策学术年会论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 罗彬;基于MMOI方法的电信客户流失预测与挽留研究[D];电子科技大学;2010年
2 宫轶松;粒子滤波算法研究及其在GPS/DR组合导航中的应用[D];解放军信息工程大学;2010年
3 纪芳;渤海和黄海北部沿岸海洋动力灾害研究[D];中国科学院研究生院(海洋研究所);2010年
4 赵彤;我国突发自然灾害应急救灾物资配送系统优化研究[D];大连海事大学;2011年
5 吴茗;非简单随机抽样下的一些统计推断问题[D];华中师范大学;2011年
6 徐文科;基于微分方程的生态数学模型统计分析[D];东北林业大学;2009年
7 林淋;汶川地震地面运动场估计及地震烈度与地震动参数相关性分析[D];中国地震局工程力学研究所;2011年
8 蒋贤海;智能远程健康监护系统生理参数数据分析及预报的研究[D];华南理工大学;2011年
9 刘强;三维振动主动隔离智能结构中的若干关键技术研究[D];南京航空航天大学;2009年
10 王守宝;科技进步与经济发展的相关性研究[D];天津大学;2010年
中国硕士学位论文全文数据库 前10条
1 蔡浩;基于Web使用挖掘的协同过滤推荐算法研究[D];浙江理工大学;2010年
2 刘建东;基于Web访问信息挖掘的数字图书馆个性化服务研究[D];浙江理工大学;2010年
3 周霞;基于粗糙集的电子商务交易知识获取研究[D];哈尔滨工程大学;2010年
4 黄博;微功耗水声遥控系统解码技术研究[D];哈尔滨工程大学;2010年
5 刘龙;渔船节能技术及其评价体系研究[D];中国海洋大学;2010年
6 王自强;海洋经济监测预警模型研究[D];中国海洋大学;2010年
7 姚艳杰;水库除险加固效益的风险评估[D];中国海洋大学;2010年
8 李新;支持向量机的核方法及其多核聚类算法的研究[D];中国海洋大学;2010年
9 孔茗;基于模糊灰色理论家电产品生命周期绿色性评价方法的研究[D];苏州大学;2010年
10 孙平利;POT模型在风暴潮债券中的应用[D];华东师范大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 王元明;熊伟;;异常数据的检测方法[J];重庆工学院学报(自然科学版);2009年02期
2 黄有余;数据分析中的异常点诊断[J];长沙铁道学院学报;1997年02期
3 孙文爽;异常点和影响分析及其在地质中的应用[J];楚雄师专学报;1999年03期
4 李培军;;抽样调查中样本异常值的测量[J];大连海事大学学报(社会科学版);2009年01期
5 张玉秀;;浅谈数据加密技术的发展[J];电脑学习;2008年02期
6 林飞,江志斌,许淑君;重大建设项目评审专家遴选及其绩效评价体系架构[J];工业工程与管理;2003年05期
7 凌佳;夏乐天;;具有异方差的线性回归模型的统计诊断[J];河海大学学报(自然科学版);2008年02期
8 蒋盛益;线性回归模型强影响点的判定[J];怀化师专学报;1997年05期
9 叶川;伍川辉;张嘉怡;;计量测试中异常数据剔除方法比较[J];计量与测试技术;2007年07期
10 贺祖斌;高等教育评价的元评价及其量化分析模型[J];教育科学;2001年03期
中国博士学位论文全文数据库 前2条
1 谢焕瑛;国家重点实验室评估体系研究[D];大连理工大学;2006年
2 曲久龙;科技计划项目评估理论与方法研究[D];吉林大学;2006年
中国硕士学位论文全文数据库 前4条
1 李延瑾;科技项目立项评审的同行评议方法研究[D];武汉理工大学;2002年
2 陈耿;数据挖掘技术及其在用户行为分析系统中的应用[D];西南交通大学;2003年
3 任宏涛;一种通用的项目评审平台研究[D];大连理工大学;2004年
4 王玉梅;线性回归模型中的异常点分析[D];华中科技大学;2006年
【二级引证文献】
中国期刊全文数据库 前1条
1 李光文;吴达;;同行评议专家反评估实证研究[J];天津科技;2011年04期
中国硕士学位论文全文数据库 前5条
1 徐洪峰;同行评议专家反评估模型的研究[D];中南大学;2011年
2 张鑫;科研项目同行评议中专家诚信体系建设研究[D];天津大学;2011年
3 李琦;J公司同行评审专家反评估模型设计研究[D];华南理工大学;2011年
4 贾晓丹;科技项目评估专家动态管理机制研究[D];吉林大学;2010年
5 刘大成;哈尔滨市城镇居民消费的定量研究[D];东北林业大学;2012年
【二级参考文献】
中国期刊全文数据库 前10条
1 唐小我,王景,曹长修;一种新的模糊自适应变权重组合预测算法[J];电子科技大学学报;1997年03期
2 虞克明,王静龙;约束线性模型异常值检验[J];高校应用数学学报A辑(中文版);1994年04期
3 林路;若干有偏估计的强影响点的显著性检验[J];数学的实践与认识;1997年03期
4 杨虎;强影响的分布与稳定性度量[J];数学研究与评论;1990年03期
5 王福林,张晋国;变权组合预测模型中最优权系数估计问题的研究[J];系统工程理论与实践;1996年10期
6 王明涛;非线性规划在确定组合预测权系数中的应用[J];预测;1994年03期
7 周传世,刘永清;变权重组合预测模型的研究[J];预测;1995年04期
8 曹长修,王景,唐小我;一种模糊变权重组合预测方法——FVW法的研究[J];预测;1996年05期
9 曾宪报;组合赋权法新探[J];预测;1997年05期
10 王松桂;;回归诊断发展综述[J];应用概率统计;1988年03期
【相似文献】
中国期刊全文数据库 前10条
1 王斌会,徐勇勇;回归诊断中几种影响诊断量的比较[J];数理统计与应用概率;1995年01期
2 龙蓓,林路;线性模型和广义线性模型中的一种强影响点的显著性检验法[J];广西科学;1998年03期
3 林路;复共线情况下强影响点的判别法[J];邵阳学院学报(社会科学版);1997年02期
4 李英英;基于预测值均方的影响分析方法[J];山西师范大学学报(自然科学版);1995年01期
5 赵进文;;异常值点对单位根检验的致命影响[J];商业经济与管理;2009年01期
6 段清堂;线性回归诊断中的影响问题[J];郑州轻工业学院学报(自然科学版);1991年03期
7 常宝娴;;变系数线性模型的影响分析[J];苏州科技学院学报(自然科学版);2008年02期
8 段清堂;剔除数据对于基于一种特殊变换的线性模型的影响及统计量的分布[J];郑州轻工业学院学报(自然科学版);1993年01期
9 林路;若干有偏估计的强影响点的显著性检验[J];数学的实践与认识;1997年03期
10 刘鹤飞;张波;;基于外围股市对上证综指多元回归模型的统计诊断[J];商业文化(下半月);2011年10期
中国重要会议论文全文数据库 前4条
1 李国重;归庆明;杜院录;张国芹;;岭估计影响分析的新方法[A];中国现场统计研究会第12届学术年会论文集[C];2005年
2 余红梅;王彤;刘桂芬;王琳娜;张岩波;仇丽霞;赵晋芳;;Cox回归模型诊断及其医学应用研究报告[A];2005—2006山西省统计科研成果汇编[C];2006年
3 吴翰青;王忠郴;;模糊识别方法在贷款风险与质量分类中的应用[A];发展的信息技术对管理的挑战——99’管理科学学术会议专辑(下)[C];1999年
4 金莹;汤银才;;Weibull分布下异常数据的线性检验方法[A];中国现场统计研究会第12届学术年会论文集[C];2005年
中国重要报纸全文数据库 前1条
1 ;县域可持续发展决策支持系统[N];光明日报;2003年
中国博士学位论文全文数据库 前2条
1 张亚军;绝经后骨质疏松症及其影响因素与中医体质相关性研究[D];北京中医药大学;2009年
2 李朝奎;非线性模型空间测量数据处理理论及其应用[D];中南大学;2001年
中国硕士学位论文全文数据库 前10条
1 张森;强影响点的数据挖掘和图示[D];重庆大学;2002年
2 李兵;线性回归模型参数有偏估计的进一步探讨[D];桂林电子科技大学;2008年
3 张浩;广义半参数模型的参数估计与影响分析[D];华东师范大学;2007年
4 周影辉;非线性分位点回归模型的统计诊断[D];东南大学;2006年
5 王玉梅;线性回归模型中的异常点分析[D];华中科技大学;2006年
6 杨莲;数据挖掘的统计模型和算法的研究[D];重庆大学;2005年
7 余火军;纵向数据线性模型的统计诊断和影响分析[D];华东师范大学;2004年
8 许晶;半参数模型基于经验似然的统计诊断[D];南京理工大学;2012年
9 陶芸;线性模型中回归参数的影响分析[D];北京交通大学;2009年
10 朱连华;混合效应模型的Bayes局部影响分析[D];东南大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026