收藏本站
《哈尔滨工程大学》 2005年
收藏 | 手机打开
二维码
手机客户端打开本文

SVM在Web文本挖掘中的应用与研究

杨翔宇  
【摘要】:Web已经成为获取信息的最重要手段之一。海量的网页在为人们提供包罗万象、无比丰富的信息资源同时,也向人们提出了如何快速地从信息海洋中获取所需信息的挑战。Web文本挖掘技术是解决上述问题的一种方法。Web文本挖掘借鉴数据挖掘的基本思想和理论方法,从大量非结构化、异构的Web文档的集合中发现有效的、新颖的、潜住可用的及最终可理解的知识。但是,现有的Web文本挖掘技术应用效果不够理想,并且不能适应于Web上文档高速膨胀的需要。因此,开发新的Web文本挖掘技术便成为研究热点。针对以上情况,本文主要做了以下方面的工作。 首先,本文介绍了Web数据挖掘的基本概念、分类和方法,以及Web文本挖掘的具体过程和相关理论。重点介绍了Web文本挖掘中的特征表示与特征提取技术,并提出了一种改进的类别区分词的特征选择方法。该方法能够在大大缩减特征空间的同时,选择出那些最具有类别指示意义因而也最利于分类的特征。 其次,本文认真研究了统计学习理论的主要内容和支持向量机算法的基本原理。并且就支持向量机的训练算法、分类算法、多类算法、核函数及选择等热点问题分别加以讨论。阐述了支持向量机研究和应用现状,以及所面临的问题。最后指出刘支持向量机进一步研究和应用需要解决的一些重要问题。 最后,本文将支持向量机与增量学习相结合应用到Web文本挖掘中,提出一种改进的支持向量机增量学习算法。该算法舍弃对最终结论无用的样本,使得学习对象的知识得到了积累。本算法在保证分类准确度的同时,在增量学习问题上比传统的支持向量机有效。
【学位授予单位】:哈尔滨工程大学
【学位级别】:硕士
【学位授予年份】:2005
【分类号】:TP393.092

【相似文献】
中国期刊全文数据库 前10条
1 苑敏;杨奎河;;基于支持向量机理论的多类分类算法[J];福建电脑;2007年02期
2 张汝雷;王保民;苏欣平;傅钰;;支持向量机(SVM)在机械故障诊断中的应用研究[J];军事交通学院学报;2009年03期
3 范秋凤;陈彦涛;;支持向量机及其应用研究[J];科技信息;2009年29期
4 谢长菊;;支持向量机新模型及其参数特性研究[J];计算机仿真;2010年04期
5 王华忠,张雪申,俞金寿;基于支持向量机的故障诊断方法[J];华东理工大学学报;2004年02期
6 李卓,刘斌,刘铁男,朱秀华,魏坤;支持向量机及其在油田生产中的应用[J];大庆石油学院学报;2005年03期
7 姚程宽;;SVM在不平衡样本集中的应用研究[J];计算机与数字工程;2007年10期
8 吕刚,吴朝晖,杨莹春;支持向量机的聚类补偿研究[J];广西师范大学学报(自然科学版);2003年01期
9 卢虎,李彦,肖颖;支持向量机理论及其应用[J];空军工程大学学报(自然科学版);2003年04期
10 姬水旺,姬旺田;支持向量机训练算法综述[J];微机发展;2004年01期
中国重要会议论文全文数据库 前10条
1 宋普云;沈雪勤;吴清;;一种改进的SMO算法[A];第六届全国计算机应用联合学术会议论文集[C];2002年
2 张钹;张铃;;统计学习理论及其应用[A];2001年中国智能自动化会议论文集(上册)[C];2001年
3 张国宣;孔锐;施泽生;郭立;;一种新的基于聚类的SVM迭代算法[A];第二届全国信息获取与处理学术会议论文集[C];2004年
4 孙向东;黄日波;;运用SVMs原理预测蛋白质二级结构研究[A];广西微生物学会2003年学术年会论文集[C];2003年
5 刘斌;魏贤龙;李卓;;基于支持向量机的Widrow自适应滤波器[A];2006中国控制与决策学术年会论文集[C];2006年
6 陈宇;王强;;聚类算法在Web文本挖掘中的应用研究[A];2009全国计算机网络与通信学术会议论文集[C];2009年
7 孟祥国;马军;段昕;;基于统计学习理论的支持向量机算法研究[A];2006年全国理论计算机科学学术年会论文集[C];2006年
8 王然风;姚海生;;基于统计学习理论的选煤过程关键工艺参数智能软测量建模研究综述[A];2005年全国选煤学术会议论文集[C];2005年
9 赵晶;高隽;张旭东;谢昭;;支持向量机综述[A];全国第十五届计算机科学与技术应用学术会议论文集[C];2003年
10 张瑞民;袁震东;;基于小波变换和支持向量机的心电图分类[A];2004中国控制与决策学术年会论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 冯云龙;统计学习理论中基于核的算法研究[D];中国科学技术大学;2012年
2 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
3 周绮凤;基于支持向量机的若干分类问题研究[D];厦门大学;2007年
4 孙宗海;支持向量机及其在控制中的应用研究[D];浙江大学;2003年
5 徐海祥;基于支持向量机方法的图像分割与目标分类[D];华中科技大学;2005年
6 唐发明;基于统计学习理论的支持向量机算法研究[D];华中科技大学;2005年
7 李忠伟;支持向量机学习算法研究[D];哈尔滨工程大学;2006年
8 李冬琴;船舶技术经济论证中的支持向量机方法研究及应用[D];武汉理工大学;2007年
9 武国正;支持向量机在湖泊富营养化评价及水质预测中的应用研究[D];内蒙古农业大学;2008年
10 尚福华;基于统计学习的油藏水淹层的识别技术[D];哈尔滨工业大学;2007年
中国硕士学位论文全文数据库 前10条
1 杨翔宇;SVM在Web文本挖掘中的应用与研究[D];哈尔滨工程大学;2005年
2 滕文凯;支持向量机反问题及其解法[D];河北大学;2005年
3 杜晓东;基于支持向量机的数据挖掘方法[D];山东大学;2005年
4 王李东;基于支持向量机(SVM)的短期负荷预测的研究[D];华中科技大学;2005年
5 郭得令;基于LS-SVM的围岩位移非线性预测应用研究[D];武汉理工大学;2006年
6 詹超;支持向量机在基因表达数据分类中的研究[D];武汉理工大学;2006年
7 马洁;基于支持向量机的股市预测问题研究[D];天津大学;2006年
8 高异;基于支持向量机的非线性系统建模与控制[D];西安理工大学;2006年
9 邓小文;基于SVM的柴油机机械故障诊断研究[D];厦门大学;2006年
10 王忠文;统计学习理论及其在地学中的应用研究[D];吉林大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026