收藏本站
《大庆石油学院》 2007年
收藏 | 手机打开
二维码
手机客户端打开本文

基于SVM的分类挖掘算法及其应用

张兴旺  
【摘要】: 随着数据库技术的应用越来越普及,各行各业在经营过程中收集了大量的业务数据,在这大量的数据中蕴藏着丰富的信息,如何挖掘出这些信息使其成为有用的知识,指导企业的经营决策,已经成为一个迫切需要解决的问题,数据挖掘技术在这种背景下应运而生。数据挖掘是在数据库中发现有用的、潜在的、最终可理解的模式的非平凡过程。分类是其中一种最常用的数据挖掘任务。 支持向量机(SVM)作为一种新兴的基于统计学习理论的分类算法,以其坚实的理论基础,巧妙的算法实现和突出的卓越性能脱颖而出。与其它分类算法相比,SVM方法具有全局最优、结构简单、推广能力强等优点,目前在很多领域获得了相对其它分类方法的最优的性能。鉴于此,结合参与自来水公司数据挖掘项目中遇到的问题,对基于SVM的分类算法在数据挖掘中的应用进行了研究。 本文首先讨论了数据挖掘的基本概念,挖掘任务以及挖掘的基本过程,并比较分析了几种常用的分类挖掘算法及其优缺点并简单介绍了评估分类模型的几种方法。然后详细阐述了统计学习理论及结构风险最小化原则,基于最大间隔分类超平面对SVM算法进行了理论推导,并分析了SVM作为一种新的分类方法所具有的优势。在此基础上,研究了把SVM应用于数据挖掘分类任务时需解决的问题,如适用于大数据集训练的选块算法、分解算法和序列最小化算法;基于二分类支持向量机构造多分类支持向量机的一对多、一对一及DDAG算法;结合随机分层采用技术改进了基于网格搜索的SVM模型参数寻优方法。 在作了充分的理论分析后,论文提出了一种基于SVM的水费欠费用户预测建模方案。结合数据挖掘理论阐述了数据预处理的过程,对建立的挖掘模型采用分层随机采样的交叉验证网格搜索方法确立模型参数进行了较为深入的研究。
【学位授予单位】:大庆石油学院
【学位级别】:硕士
【学位授予年份】:2007
【分类号】:TP311.13

手机知网App
【引证文献】
中国博士学位论文全文数据库 前1条
1 邵荃;突发事件应急平台模型库中模型链构建方法的研究[D];清华大学;2009年
中国硕士学位论文全文数据库 前2条
1 李一磊;服装设计风格决策模型的研究与实现[D];东华大学;2011年
2 李风云;隧道塌方风险预测与控制研究[D];中南大学;2011年
【参考文献】
中国期刊全文数据库 前6条
1 李琳;张晓龙;;基于RBF核的SVM学习算法的优化计算[J];计算机工程与应用;2006年29期
2 贾银山,贾传荧;一种加权支持向量机分类算法[J];计算机工程;2005年12期
3 王兴玲,李占斌;基于网格搜索的支持向量机核函数参数的确定[J];中国海洋大学学报(自然科学版);2005年05期
4 李建民 ,张钹 ,林福宗;序贯最小优化的改进算法[J];软件学报;2003年05期
5 张浩然,韩正之;回归支持向量机的改进序列最小优化学习算法[J];软件学报;2003年12期
6 骆剑承,周成虎,梁怡,马江洪;支撑向量机及其遥感影像空间特征提取和分类的应用研究[J];遥感学报;2002年01期
中国博士学位论文全文数据库 前2条
1 唐发明;基于统计学习理论的支持向量机算法研究[D];华中科技大学;2005年
2 郑恩辉;基于支持向量机的代价敏感数据挖掘研究与应用[D];浙江大学;2006年
中国硕士学位论文全文数据库 前1条
1 杨铁建;基于支持向量机的数据挖掘技术研究[D];西安电子科技大学;2005年
【共引文献】
中国期刊全文数据库 前10条
1 许高程;张文君;王卫红;;支持向量机技术在遥感影像滑坡体提取中的应用[J];安徽农业科学;2009年06期
2 杜子涛;颜树强;杨小明;王德军;任海峰;;基于TM影像的内蒙古奈曼旗土地利用/覆被变化分析[J];安徽农业科学;2011年21期
3 周志华;林维芳;许高程;谢先明;王松;;基于面向对象的滑坡快速识别技术研究[J];安徽农业科学;2012年05期
4 李飞;李红莲;;支持向量机大规模样本快速训练算法[J];北京信息科技大学学报(自然科学版);2012年02期
5 方辉;王倩;;支持向量机的算法研究[J];长春师范学院学报;2007年06期
6 杨晓伟;欧阳柏平;余舒;吴春国;梁艳春;;自适应迭代算法支持向量集的特性研究[J];吉林大学学报(信息科学版);2006年02期
7 陈波;张友静;陈亮;;结合纹理的SVM遥感影像分类研究[J];测绘工程;2007年05期
8 谭琨;杜培军;郑辉;;支持向量机在空间信息处理领域的应用研究[J];测绘科学;2007年02期
9 彭笃明;张安定;李德一;米姗姗;;基于LBV变换的遥感影像多步骤分类法研究[J];测绘科学;2008年03期
10 依力亚斯江·努尔麦麦提;塔西甫拉提·特依拜;舒宁;王伯超;买买提沙吾提;;基于Radarsat和TM图像融合与分类的土壤盐渍化信息遥感监测研究[J];测绘科学;2009年01期
中国重要会议论文全文数据库 前6条
1 郭健;张继贤;张永红;曹银璇;;多时相MODIS影像土地覆盖分类比较研究[A];中国测绘学会九届四次理事会暨2008年学术年会论文集[C];2008年
2 廖晓玉;刘兆礼;张继权;佟志军;;基于支持向量机的锡林郭勒盟草原火灾风险预测分析[A];“中国视角的风险分析和危机反应”——中国灾害防御协会风险分析专业委员会第四届年会论文集[C];2010年
3 徐达;武新星;胡俊彪;郭磊;李华;;最小二乘支持向量机回归预测模型研究与实现[A];全国先进制造技术高层论坛暨第八届制造业自动化与信息化技术研讨会论文集[C];2009年
4 林关成;李亚安;李国辉;;支持向量回归的连续过松弛训练算法研究[A];2010’中国西部声学学术交流会论文集[C];2010年
5 吕卓;谢松云;赵金;赵海涛;;基于SVM的手部运动fMRI图像分类方法研究[A];中国生物医学工程学会成立30周年纪念大会暨2010中国生物医学工程学会学术大会青年优秀论文[C];2010年
6 胡海清;;序列最小优化及其改进算法[A];第十届中国科协年会信息化与社会发展学术讨论会分会场论文集[C];2008年
中国博士学位论文全文数据库 前10条
1 郑大腾;柔性坐标测量机空间误差模型及最佳测量区研究[D];合肥工业大学;2010年
2 晁冰;基于支持向量机的软件可靠性模型分类及失效分析[D];武汉大学;2010年
3 黄丽霞;非特定人鲁棒性语音识别中前端滤波器的研究[D];太原理工大学;2011年
4 钱鹏江;大规模数据集聚类方法研究及应用[D];江南大学;2011年
5 赵鹏;离心泵振动故障诊断方法研究及系统实现[D];华北电力大学(北京);2011年
6 高田;基于领域知识的旅游突发事件状态评估与演化研究[D];北京邮电大学;2011年
7 黄静华;支持向量机算法研究及在气象数据挖掘中的应用[D];中国矿业大学(北京);2011年
8 孟磊;采煤驱动下平原小流域生态演变规律及评价[D];中国矿业大学;2010年
9 金珠;改进的支持向量机分类算法及其在煤矿人因事故安全评价中的应用[D];中国矿业大学;2011年
10 王开义;基于支持向量机的农产品生产关键控制点发现研究[D];北京工业大学;2011年
中国硕士学位论文全文数据库 前10条
1 李金华;基于SVM的多类文本分类研究[D];山东科技大学;2010年
2 王文栋;GEP及SVM融合的分类技术研究[D];广西师范学院;2010年
3 于洪霞;基于SVM的中文垃圾邮件过滤[D];哈尔滨工程大学;2009年
4 刘萍萍;灾难现场人手部分检测方法研究[D];哈尔滨工程大学;2010年
5 刘佳;带有降液管的多元精馏建模与仿真平台的开发[D];大连理工大学;2010年
6 梅丽;人类启动子识别算法研究[D];辽宁师范大学;2010年
7 徐晓丹;支持向量机在矿区遥感监测图像分类中的应用研究[D];辽宁工程技术大学;2009年
8 蒋桂莲;基于粗糙集和支持向量机的人脸识别[D];长沙理工大学;2010年
9 史小松;基于支持向量机的甲骨文字结构分析研究[D];华东师范大学;2010年
10 张宝华;支持向量机在入侵检测系统中的研究和应用[D];天津理工大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 赵国刚;袁春花;吴育忠;;省道S212线峰山隧道塌方处理[J];安徽建筑;2006年04期
2 张永强;刘茂;张董莉;;多米诺效应定量风险分析[J];安全与环境学报;2008年01期
3 袁立;穆志纯;刘磊明;;基于核主元分析法和支持向量机的人耳识别[J];北京科技大学学报;2006年09期
4 王晏民;多源GIS高斯投影快速换带算法研究[J];测绘工程;2002年01期
5 赵长胜;高斯投影坐标反算的迭代算法[J];测绘通报;2004年03期
6 冯利,刘晓刚;服装风格的量化方法初探[J];东华大学学报(自然科学版);2004年01期
7 纪晓燕,刘晓刚;服装款式设计零部件数字化问题[J];东华大学学报(自然科学版);2004年01期
8 孙科峰,孙根正,李洁;一种新的矩形网格生成等值线算法[J];东华大学学报(自然科学版);2005年04期
9 黄润秋,徐则民,许模;地下水的致灾效应及异常地下水流诱发地质灾害[J];地球与环境;2005年03期
10 代福仲,李正前,石胜伟,汪光宅;隧道塌方自动监测报警系统[J];地质灾害与环境保护;2000年02期
中国硕士学位论文全文数据库 前10条
1 赵丹;基于SVM分类机的DNA序列分类方法[D];南昌大学;2010年
2 吴迪;基于SVM分类器的分步定位算法研究[D];哈尔滨工业大学;2010年
3 周国浩;激光隧道围岩位移远程实时监测系统的研制[D];西安科技大学;2004年
4 王栋;基于SVM的分类方法在内容管理中的应用[D];西北大学;2006年
5 钟山;盾构法隧道施工监测数据处理与预警、报警研究[D];同济大学;2006年
6 梁燕;SVM分类器的扩展及其应用研究[D];湖南大学;2008年
7 魏丹;支持向量机多分类预测技术研究[D];西安科技大学;2008年
8 吴强;马垭口隧道塌方灾害发生机理及处治措施的研究[D];重庆大学;2009年
9 何晓东;软岩隧道围岩稳定性与塌方处置措施分析[D];长安大学;2009年
10 张连成;广福隧道塌方处治分析研究[D];长安大学;2007年
【二级引证文献】
中国期刊全文数据库 前2条
1 吴忠;夏志杰;;面向轨道交通应急管理的信息集成及应用研究[J];交通运输系统工程与信息;2011年05期
2 何美丽;刘霁;刘浪;周健;;隧道坍方风险评价的未确知测度模型及工程应用[J];中南大学学报(自然科学版);2012年09期
中国博士学位论文全文数据库 前2条
1 刘艺;应急云环境下任务导向的应急组织敏捷协作机制研究[D];暨南大学;2012年
2 鄂越;基于Agent的蜂产品质量控制研究[D];中国农业科学院;2012年
中国硕士学位论文全文数据库 前1条
1 陈宏;广甘高速公路隧道塌方及灾害治理措施研究[D];西南交通大学;2012年
【二级参考文献】
中国期刊全文数据库 前10条
1 杨尚宝,杨天钧,董一诚;铁水含硅量预报神经网络模型[J];北京科技大学学报;1995年06期
2 周明;秦民生;;高炉铁水含硅预报数学模型[J];钢铁;1986年05期
3 姚斌,杨天钧;铁水硅预报神经网络专家系统的遗传优化生成[J];钢铁;2000年04期
4 李家新,周莉英,唐成润;神经网络在梅山高炉铁水硅含量预报中的应用[J];钢铁;2001年05期
5 高小强,郑忠,黄庆周;高炉铁水含硅量和含硫量动力学预报研究[J];钢铁;1995年04期
6 王国鹏,翟永杰,封官斌,王东风;模糊支持向量机在汽轮机故障诊断中的应用[J];华北电力大学学报;2003年04期
7 李俊国,闫小林;高炉铁水含硅量神经网络预测模型[J];河北理工学院学报;2002年03期
8 张玉朵,闫小林;唐钢二炼铁厂3号高炉铁水硅含量神经网络预报模型[J];河北理工学院学报;2003年03期
9 周莉英,李家新;神经网络方法在高炉铁水硅含量预报中的应用[J];华东冶金学院学报;2000年04期
10 朱国强,刘士荣,俞金寿;基于支持向量机的数据建模在软测量建模中的应用[J];华东理工大学学报;2002年S1期
【相似文献】
中国期刊全文数据库 前10条
1 杨启仁;杜圣东;;支持向量机在分析型CRM中的应用研究[J];微型机与应用;2010年13期
2 付阳;李昆仑;;支持向量机模型参数选择方法综述[J];电脑知识与技术;2010年28期
3 杨佳;许强;曹长修;;基于数据挖掘的铁水硅质量分数SVM预测方法[J];华中科技大学学报(自然科学版);2009年05期
4 渐令;龚淑华;王义康;;基于支持向量机的高炉铁水硅含量多类别分类[J];浙江大学学报(理学版);2007年03期
5 朱恒民;刘文杰;王宁生;;数据挖掘技术在优化中药提取工艺中的应用[J];计算机与应用化学;2006年03期
6 周欣;许建华;;基于遗传算法与经验误差最小化的SVM模型选择方法[J];南京师范大学学报(工程技术版);2009年02期
7 王凯;侯著荣;王聪丽;;基于交叉验证SVM的网络入侵检测[J];测试技术学报;2010年05期
8 赵洪波;;基于遗传算法的进化支持向量机研究[J];绍兴文理学院学报(自然科学版);2004年03期
9 刘浩洋;陈德运;李谋遵;;基于支持向量机的电容层析成像图像重建算法[J];哈尔滨理工大学学报;2006年04期
10 赵虹;韦丽华;;基于支持向量机的说话人识别研究[J];现代电子技术;2007年06期
中国重要会议论文全文数据库 前10条
1 门洪;武玉杰;李小英;高艳春;;基于支持向量机的分类算法研究[A];第六届全国信息获取与处理学术会议论文集(3)[C];2008年
2 应自炉;张有为;李景文;;基于GDA和SVM的人脸表情识别[A];第十三届全国信号处理学术年会(CCSP-2007)论文集[C];2007年
3 刘耀年;王浩;何昌浩;何萍;;基于支持向量回归机的短期电力负荷预测[A];第十届全国电工数学学术年会论文集[C];2005年
4 高荣;刘晓华;;基于小波变换的支持向量机短期负荷预测[A];第16届中国过程控制学术年会暨第4届全国故障诊断与安全性学术会议论文集[C];2005年
5 曹兆龙;万福永;;SVM算法及其在多类字母图像识别中的应用[A];第25届中国控制会议论文集(下册)[C];2006年
6 王永春;;一种复合的支持向量机模型在电力系统短期负荷中的应用[A];第十届全国电工数学学术年会论文集[C];2005年
7 贺皓;罗慧;;基于模式识别的支持向量机大雾预报方法[A];陕西省气象学会2006年学术交流会论文集[C];2006年
8 蒋友宝;贺艺华;;支持向量机技术在可靠度分析中的应用[A];第17届全国结构工程学术会议论文集(第Ⅲ册)[C];2008年
9 乔立岩;彭喜元;彭宇;;基于支持向量机的键盘密码输入异常检测方法研究[A];2004全国测控、计量与仪器仪表学术年会论文集(上册)[C];2004年
10 常涛;;支持向量机在大气污染预报中的应用研究[A];中国气象学会2006年年会“大气成分与气候、环境变化”分会场论文集[C];2006年
中国重要报纸全文数据库 前10条
1 陈晓 山西财经大学教师;数据挖掘技术在高校教学管理中的应用[N];山西经济日报;2010年
2 记者 吕贤如;大力加强数据挖掘技术研究应用[N];光明日报;2006年
3 主持人 李禾;数据挖掘技术如何驱动经济车轮[N];科技日报;2007年
4 首之;数据挖掘并不神秘[N];金融时报;2006年
5 ;IBM公司推出新型数据挖掘技术[N];中国高新技术产业导报;2001年
6 刘红岩、何军;利用数据挖掘技术获得商业智能[N];中国计算机报;2003年
7 山西银行学校 王林芳;数据挖掘在银行业务中的应用[N];山西科技报;2005年
8 任中华;财务数据挖掘六步走[N];中国计算机报;2007年
9 诺达咨询高级咨询顾问 周连升;数据挖掘拓展3G增值空间[N];通信产业报;2007年
10 徐扬;如何从数据中“挤出”效益[N];中国计算机报;2002年
中国博士学位论文全文数据库 前10条
1 任东;基于支持向量机的植物病害识别研究[D];吉林大学;2007年
2 孙蕾;医学图像智能挖掘关键技术研究[D];西北大学;2005年
3 邢永忠;最小二乘支持向量机的若干问题与应用研究[D];南京理工大学;2009年
4 常群;支持向量机的核方法及其模型选择[D];哈尔滨工业大学;2007年
5 梁力文;基于支持向量机的小波滤噪短波近红外光谱在药品定量分析中的研究[D];吉林大学;2009年
6 许增福;DL环境下的信息资源管理及知识发现研究[D];哈尔滨工程大学;2005年
7 李兴;高光谱数据库及数据挖掘研究[D];中国科学院研究生院(遥感应用研究所);2006年
8 杨金芳;支持向量回归在预测控制中的应用研究[D];华北电力大学(河北);2007年
9 张永;基于模糊支持向量机的多类分类算法研究[D];大连理工大学;2008年
10 武国正;支持向量机在湖泊富营养化评价及水质预测中的应用研究[D];内蒙古农业大学;2008年
中国硕士学位论文全文数据库 前10条
1 曹杰;面向数据挖掘的支持向量机技术研究[D];西安电子科技大学;2007年
2 邓士娟;基于数据挖掘技术的轴承寿命预测的研究[D];大连海事大学;2006年
3 刘森华;基于SVM的数据挖掘技术研究[D];长春理工大学;2009年
4 张文良;基于支持向量机的甲醛浓度软测量[D];大连理工大学;2008年
5 刘艳伟;支持向量机方法在感潮河段洪峰水位预报中的应用[D];浙江大学;2010年
6 赖迪辉;数据挖掘在科技项目评估中的应用[D];天津大学;2005年
7 王启超;基于组合核函数支持向量机的软测量技术及其应用研究[D];江西理工大学;2011年
8 张华斌;基于不平衡数据挖掘的远程故障诊断研究[D];华中科技大学;2007年
9 牟晓丹;不均衡支持向量机参数选取的两种优化方法[D];大连理工大学;2007年
10 步新玉;基于数据挖掘的智能入侵检测系统研究[D];西安电子科技大学;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026