收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于区间数的不确定性数据挖掘及其应用研究

任世锦  
【摘要】: 尽管数据挖掘技术已经成功应用到很多领域,但是由于测量手段的局限性以及客观对象本身不确定性等原因,在自然和社会科学领域中存在大量待挖掘的数据是不准确、不确定的。如果不充分考虑这些数据的不确定性,不采用合适的数据挖掘方法,那么必然会导致挖掘模型性能下降,甚至是不可接受的。如何从大量不确定性数据中找出隐藏的知识,仍然是人们研究的主要课题。根据待挖掘数据所依据的不确定理论,不确定性数据挖掘方法可分为4种类型:随机数据挖掘、灰色数据挖掘、模糊数据挖掘和区间数数据挖掘方法。 本文以国家863项目钢铁生产过程的质量控制为研究背景,为解决生产过程数据不完整、不确定、大数据量的数据挖掘困难问题,提出基于SVM以及核方法的区间数数据挖掘建模方法,并用于钢铁生产过程的质量预测和质量分析。 本文主要工作包括以下几个方面: 1.提出了两种区间数回归建模方法。针对钢铁工业过程中的实际需要,本文提出两种区间数回归建模方法:(1)基于SVM的区间数输入、区间数输出回归建模方法。该方法把SVM从实数回归分析推广到区间数回归分析,同时继承了SVM的优点;(2)基于SVM的精确数输入、区间数输出的回归分析建模方法。该方法对区间数上下界逼近回归建模的同时还考虑了上下界之间的相互信息。本算法能通过解凸二次最优化问题得到全局最优解,有效地避免了回归模型的上界小于下界的问题。 2.提出了基于多尺度径向基小波SVM的精确数输入、区间数输出的鲁棒回归分析建模方法。首先提出并使用基于多尺度径向基小波SVM方法对带有离群点的多尺度区间数样本数据集进行训练,分别得到区间数上下界初始回归模型,初始回归模型不仅能够有效地逼近多尺度样本信号、具有较好的鲁棒性和推广性能,而且在正常样本点处残差较小,在离群点处残差较大;然后以加权M—估计函数作为代价函数,并使用梯度下降法同时调整区间数上下界回归模型参数,且根据间数上下界模型输出关系改变加权系数,消除了离群点对区间数回归模型的影响,解决了区间数模型输出上界小于下界的问题。 3.提出了基于SVM的区间数分类建模方法。根据区间数的比较定义,该方法把区间数线性分类器转化为精确数输入的线性分类器,从而能够建立基于SVM的区间数分类器模型。本文通过设计合适的核函数,把区间数数据样本映射到高维特征空间,然后在高维空间中对样本数据进行线性分类,顺利地解决了区间数样本线性不可分问题,克服了现有的区间数分类算法对输入维数敏感以及不适合大量数据样本等问题。 4.提出一种基于核方法的区间数模糊聚类算法。本文通过设计合适的核函数,有效地扩大样本模式之间的差异性,提高聚类算法对非对称数据以及混合数据模式的适应能力,且避免了直接在高维特征空间求解聚类问题。采用区间数遗传算法来求解非凸聚类优化问题得到聚类问题的全局最优解,大大提高了聚类质量。该方法解决了现有区间数聚类算法对多种聚类模式以及不对称数据聚类性能不理想的问题。 5.以钢铁生产过程为应用背景,阐述了基于区间数的不确定性数据挖掘在实际生产中的应用,并与其它方法相对比。结果表明,本文提出的数据挖掘方法能够克服现有算法的缺点,并在钢铁过程的数据挖掘中取得较好的效果。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 王双亭;艾泽天;都伟冰;康敏;;基于SVM不同核函数的多源遥感影像分类研究[J];河南理工大学学报(自然科学版);2011年03期
2 胡萍萍;;基于SVM的人脸检测研究[J];电脑编程技巧与维护;2011年16期
3 王红伟;董慧;;一种提高SVM分类精度的调制信号识别方法[J];机械与电子;2010年S1期
4 张野;杨建林;;基于KNN和SVM的中文文本自动分类研究[J];情报科学;2011年09期
5 邝神芬;李银;;集群SVM大规模数据分类算法[J];韶关学院学报;2011年08期
6 包日快;;复杂场景下的运动目标检测与分类的研究[J];福建电脑;2011年05期
7 秦成燕;李炜;;区间线性规划问题的可信度及其改进解[J];杭州电子科技大学学报;2011年03期
8 陈发鸿;;基于核方法的文本极性分类研究[J];海峡科学;2011年08期
9 翁宁龙;刘冉;吴子章;;一种改进的LBP特征的人脸识别方法[J];信息通信;2011年03期
10 肖永良;夏利民;;基于核的监督非保局投影镜头边界检测[J];控制工程;2011年04期
11 古雪鹏;艾家林;韩辉;;基于区间数灰色关联分析的测向能力评估研究[J];航天电子对抗;2011年03期
12 王玉松;;基于SVM的雷达故障预诊断技术研究[J];舰船电子工程;2011年08期
13 王刚;黄星元;施明智;胡挺;张旭炜;李焰;;光纤围栏扰动事件模式识别研究[J];光通信技术;2011年07期
14 张君昌;张译;;基于改进AdaBoost算法的人脸检测[J];计算机仿真;2011年07期
15 林川;潘盛辉;谭光兴;李梦和;;基于聚类与链码技术的交通标志检测[J];计算机测量与控制;2011年06期
16 马素萍;高洪波;;基于统计学的网络购物消费者行为分析[J];价值工程;2011年22期
17 马少斌;;基于区间联系数理论的网络安全风险评估方法及应用[J];自动化与仪器仪表;2011年04期
18 郭辉;徐浩军;周莉;;粗糙集和区间数空袭目标威胁评估[J];火力与指挥控制;2011年09期
19 黄萍;卢谢吉;;基于Gabor-SVM的文字识别方法[J];计算机与数字工程;2011年08期
20 田晶华;李翠平;陈红;;基于类标签聚类的动态问题分类集成学习算法[J];计算机科学与探索;2011年09期
中国重要会议论文全文数据库 前10条
1 蔡志理;姜桂艳;;多SVM分类器融合技术在高速公路AID中的应用[A];第二十七届中国控制会议论文集[C];2008年
2 宋鑫颖;周志逵;;一种基于SVM的主动学习文本分类方法[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
3 王红伟;董慧;;一种提高SVM分类精度的调制信号识别方法[A];2010年西南三省一市自动化与仪器仪表学术年会论文集[C];2010年
4 司爱威;冯辅周;江鹏程;饶国强;王建;;基于可变风险SVM模型的故障识别方法研究[A];第十届全国振动理论及应用学术会议论文集(2011)上册[C];2011年
5 ;A Tool Wear Predictive Model Based on SVM[A];Proceedings of 2010 Chinese Control and Decision Conference[C];2010年
6 ;A CDMA Signal Receiver Based on LS-SVM[A];第二十六届中国控制会议论文集[C];2007年
7 ;Improved Particle Swarm Optimized SVM for Short-term Traffic Flow Predication[A];第二十六届中国控制会议论文集[C];2007年
8 邵杰;叶宁;容亦夏;;基于SVM的多波束测深数据滤波[A];第二十九届中国控制会议论文集[C];2010年
9 于湘涛;周峰;张兰;魏超;;基于SVM和田口方法的石英挠性加速度计健壮性设计[A];质量——持续发展的源动力:中国质量学术与创新论坛论文集(下)[C];2010年
10 易畅;张祥松;刘晓;;基于SVM的PET脑肿瘤图像分割实现[A];中华医学会第九次全国核医学学术会议论文摘要汇编[C];2011年
中国博士学位论文全文数据库 前10条
1 任世锦;基于区间数的不确定性数据挖掘及其应用研究[D];浙江大学;2006年
2 渠瑜;基于SVM的高不平衡分类技术研究及其在电信业的应用[D];浙江大学;2010年
3 牟少敏;核方法的研究及其应用[D];北京交通大学;2008年
4 张婧;基于SVM的肺结节自动识别方法研究[D];华南理工大学;2011年
5 郭雷;宽带雷达目标极化特征提取与核方法识别研究[D];国防科学技术大学;2009年
6 杨旭;基于核方法的模式分类研究与应用[D];上海交通大学;2011年
7 宋国明;基于提升小波及SVM优化的模拟电路智能故障诊断方法研究[D];电子科技大学;2010年
8 严志永;在划分数据空间的视角下基于决策边界的分类器研究[D];浙江大学;2011年
9 冯爱民;结构驱动的单类分类器设计及拓展研究[D];南京航空航天大学;2011年
10 潘志松;基于神经网络的入侵检测研究[D];南京航空航天大学;2003年
中国硕士学位论文全文数据库 前10条
1 赵行;SVM分类器置信度的研究[D];北京邮电大学;2010年
2 吴迪;基于SVM分类器的分步定位算法研究[D];哈尔滨工业大学;2010年
3 刘莹;基于SVM维吾尔文印刷体识别分类器设计[D];新疆大学;2011年
4 张岩;基于SVM算法的文本分类器的实现[D];电子科技大学;2011年
5 冯青;基因微阵列数据的SVM分类器优化方法[D];东北师范大学;2010年
6 陈燃燃;基于SVM算法的web分类研究与实现[D];北京邮电大学;2010年
7 严会霞;基于SVM的眼动轨迹解读思维状态的研究[D];太原理工大学;2010年
8 付婷婷;基于SVM的~(31)P磁共振波谱肝癌诊断[D];山东轻工业学院;2010年
9 杨晓鹏;普适计算环境下基于SVM的信息分类方法的研究[D];上海交通大学;2010年
10 邓昌葛;基于SVM的图像内容检索研究[D];中国科学技术大学;2010年
中国重要报纸全文数据库 前10条
1 黄明;精子分类器决定生男生女[N];广东科技报;2000年
2 郭涛;利用SVM虚拟化技术实现容灾[N];中国计算机报;2008年
3 万海波;用Excel完成批量评估函数汇总(上)[N];财会信报;2006年
4 谢季轲 徐新民;警惕危机突然降临[N];期货日报;2011年
5 张永法;新型便携式纺纱质量计算机在线监测装置填补国内空白[N];中国纺织报;2007年
6 记者 姜晓凌 见习记者 王毅俊;原来,科技也能如此美丽[N];上海科技报;2007年
7 中国科学院东北地理与农业生态研究所 李建平;保护地球之肾 遥感体检湿地健康[N];中国水利报;2008年
8 CPW 张戈;Aperto PacketMAX系列可同时服务2000个用户[N];电脑商报;2005年
9 本报记者 段佳;机器“品肉师”替您“尝鲜”[N];大众科技报;2010年
10 吕杰 温德成 邹振宇;用EXCEL处理质量数据[N];中国质量报;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978