收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于支持向量机的Web文本挖掘研究

徐华  
【摘要】:随着Internet的飞速发展,网上的信息资源空前的丰富。人们迫切需要拥有能够从中快速、有效地发现资源和知识的工具,提高在Web上检索信息、利用信息的效率。将传统的数据挖掘与Web结合进行Web挖掘,已成为数据挖掘的一个重要和繁荣的子领域。 支持向量机是由Vapnik及其领导的ATT实验室研究小组提出的一种新的非常有发展前途的机器学习算法。因为SVM具有较强的理论依据和较好的泛化性能,使得它成为继神经网络研究之后新的研究热点,并将推动机器学习理论和技术有重大的发展。 本文首先对Web挖掘的有关理论进行了论述,详细描述了Web文本挖掘系统的设计,包括Web文本挖掘系统的系统结构、模块功能等。接着对统计学习理论进行了介绍,深入探讨了建立在该理论基础上的SVM算法。最后将SVM算法应用到Web文本挖掘中,对Web文本进行分类。研究了一种用SVM进行主动学习的方法,该方法与普通的SVM方法相比,在保证分类性能的前提下,可有效的提高效率。同时表明了SVM算法在Web文本挖掘方面具有很好的应用前景。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 蒋良孝,蔡之华;文本挖掘及其应用[J];现代计算机(专业版);2003年02期
2 王娜;李云松;;基于概念格的文本挖掘[J];计算机技术与发展;2006年01期
3 程志;黄荣怀;;文本挖掘及其教育应用[J];现代远距离教育;2008年02期
4 郭洪涛;郑光;赵静;姜淼;何晓娟;吕爱平;;基于文本挖掘分析甲型H1N1流感的中医药治疗特色[J];世界科学技术(中医药现代化);2011年05期
5 邹权;林琛;刘晓燕;郭茂祖;;生物信息学中的文本挖掘方法[J];计算机工程与设计;2011年12期
6 陆宇杰;许鑫;郭金龙;;文本挖掘在人文社会科学研究中的典型应用述评[J];图书情报工作;2012年08期
7 湛燕,陈昊,袁方,王丽娟;文本挖掘研究进展[J];河北大学学报(自然科学版);2003年02期
8 常青;文本挖掘 挖掘知识[J];中国计算机用户;2004年24期
9 刘剑兰;用信息萃取进行文本挖掘的方法[J];情报杂志;2004年12期
10 唐明;张自力;;文本挖掘在多文化交流平台中的应用研究[J];西南师范大学学报(自然科学版);2006年03期
11 胡冰;胡东军;马文超;;文本挖掘研究及发展[J];电脑知识与技术;2008年31期
12 杨生举;蒙杰;赵昕辉;杜雨璐;;基于文本挖掘的科研项目网上评审系统研究与实现[J];甘肃科技;2012年15期
13 吴欣明,李春伟;文本挖掘探析[J];廊坊师范学院学报;2004年04期
14 谢冬;刘宏申;;文本挖掘中若干关键问题的研究[J];电脑知识与技术;2009年18期
15 袁芳;周艳红;王佳;;通过文本挖掘获取疾病相关功能信息[J];微计算机信息;2009年36期
16 姚轶;;浅谈网络文本挖掘分类[J];科技风;2009年03期
17 龚乐君;韦有兵;谢建明;袁志栋;孙啸;;一种面向基因与疾病关系的文本挖掘方法[J];东南大学学报(自然科学版);2010年03期
18 袁芳;王瑞春;管明祥;万学元;何国荣;周艳红;;基于文本挖掘与功能相似性的疾病基因预测[J];计算机工程;2011年04期
19 阮光册;;基于文本挖掘的网络新闻报道差异分析[J];情报科学;2012年01期
20 王丽坤;王宏;陆玉昌;;文本挖掘及其关键技术与方法[J];计算机科学;2002年12期
中国重要会议论文全文数据库 前10条
1 陈林;王晓华;李殿赟;文俊浩;;基于自增模式的文本挖掘研究[A];’2004计算机应用技术交流会议论文集[C];2004年
2 王巍;杨武;张乐君;郑军;;支持网络话题管理的文本挖掘算法分析[A];全国网络与信息安全技术研讨会论文集(下册)[C];2007年
3 王继成;孙颖;张福炎;;文本挖掘-数据挖掘研究的新课题[A];第十六届全国数据库学术会议论文集[C];1999年
4 高飞;荆继武;向继;;文本挖掘系统的可视化方法研究[A];全国网络与信息安全技术研讨会论文集(上册)[C];2007年
5 朱强生;田英;周延泉;何华灿;;基于非负因子分析的模糊文本挖掘[A];2006通信理论与技术新进展——第十一届全国青年通信学术会议论文集[C];2006年
6 钱程扬;龙毅;徐震;孙昊;;基于Web文本挖掘的地理位置信息重建技术[A];中国地理学会2007年学术年会论文摘要集[C];2007年
7 蒋子海;周斌;吴泉源;;基于UIMA AS的文本挖掘系统的性能分析与评估[A];全国计算机安全学术交流会论文集·第二十五卷[C];2010年
8 邱晓蕾;张聪超;;基于SVD和部分聚集分类的文本挖掘算法[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
9 武洪萍;周国祥;;Web文本挖掘研究[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
10 陈宇;王强;;聚类算法在Web文本挖掘中的应用研究[A];2009全国计算机网络与通信学术会议论文集[C];2009年
中国博士学位论文全文数据库 前10条
1 孙道军;文本挖掘预处理相关基础技术分析与应用研究[D];北京邮电大学;2008年
2 周雪忠;文本挖掘在中医药中的若干应用研究[D];浙江大学;2004年
3 王明春;基于粗糙集的数据及文本挖掘方法研究[D];天津大学;2005年
4 李芳;文本挖掘若干关键技术研究[D];北京化工大学;2010年
5 文翰;面向信息检索的Web文本挖掘方法研究[D];华南理工大学;2012年
6 卜东波;聚类/分类理论研究及其在文本挖掘中的应用[D];中国科学院研究生院(计算技术研究所);2000年
7 陈晓云;文本挖掘若干关键技术研究[D];复旦大学;2005年
8 檀敬东;文本挖掘的若干关键算法研究[D];中国科学技术大学;2010年
9 陈伟;基于时序文本挖掘的新闻内容理解与推荐技术研究[D];浙江大学;2010年
10 朱斐;文本数据的生物信息学模型及在前列腺癌中的应用研究[D];苏州大学;2013年
中国硕士学位论文全文数据库 前10条
1 高希瑞;基于文本挖掘的企业危机预警研究[D];华东师范大学;2011年
2 刘智勇;基于云计算的文本挖掘算法研究[D];电子科技大学;2011年
3 唐明;文本挖掘及其在多文化交流平台中的应用[D];西南大学;2006年
4 郭建永;聚类分析在文本挖掘中的应用与研究[D];江南大学;2008年
5 张庆;基于本体的文本挖掘结果的存储与表现[D];中国医科大学;2009年
6 王春锋;基于整合文本挖掘方法的中医证与分子生物学知识的关联分析系统[D];北京交通大学;2008年
7 邹振华;基于文本挖掘的量化投资系统[D];华南理工大学;2013年
8 郭飞;文本挖掘方法探讨及应用[D];成都理工大学;2006年
9 杨青;转录调控信息文本挖掘算法及实现[D];复旦大学;2009年
10 程春惠;公安犯罪案件文本挖掘关键技术研究[D];浙江大学;2010年
中国重要报纸全文数据库 前4条
1 本报记者 施鹏;非结构信息和文本挖掘[N];21世纪经济报道;2009年
2 周青 编译;文本挖掘工具实现非结构化数据价值[N];计算机世界;2004年
3 ;SAS公司收购Teragram 强化BI领域地位[N];计算机世界;2008年
4 ;用挖掘技术使学术资源利用效益最大化[N];中国计算机报;2007年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978