收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于支持向量机的Web文本挖掘研究

徐华  
【摘要】:随着Internet的飞速发展,网上的信息资源空前的丰富。人们迫切需要拥有能够从中快速、有效地发现资源和知识的工具,提高在Web上检索信息、利用信息的效率。将传统的数据挖掘与Web结合进行Web挖掘,已成为数据挖掘的一个重要和繁荣的子领域。 支持向量机是由Vapnik及其领导的ATT实验室研究小组提出的一种新的非常有发展前途的机器学习算法。因为SVM具有较强的理论依据和较好的泛化性能,使得它成为继神经网络研究之后新的研究热点,并将推动机器学习理论和技术有重大的发展。 本文首先对Web挖掘的有关理论进行了论述,详细描述了Web文本挖掘系统的设计,包括Web文本挖掘系统的系统结构、模块功能等。接着对统计学习理论进行了介绍,深入探讨了建立在该理论基础上的SVM算法。最后将SVM算法应用到Web文本挖掘中,对Web文本进行分类。研究了一种用SVM进行主动学习的方法,该方法与普通的SVM方法相比,在保证分类性能的前提下,可有效的提高效率。同时表明了SVM算法在Web文本挖掘方面具有很好的应用前景。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 刘高勇;汪会玲;;基于支持向量机的网站服务质量实时监控方法[J];武汉大学学报(理学版);2009年02期
2 石福斌;;一种基于多Agent技术的Web挖掘模型及应用[J];信息技术;2007年06期
3 何建民;刘明星;;面向特定主题的客户抱怨文本分类识别方法[J];合肥工业大学学报(自然科学版);2010年12期
4 杨小云;数字图书馆中数据挖掘研究[J];延安教育学院学报;2005年02期
5 王圆;孙铁利;李杨;;Web文本挖掘中的特征表示和特征提取[J];电脑知识与技术(学术交流);2006年14期
6 许高建;;基于Web的文本挖掘技术研究[J];计算机技术与发展;2007年06期
7 黄鲁成;赵盼;;关于采用Web挖掘方法分析技术发展趋势的思考[J];科技管理研究;2010年21期
8 张宏松;刘建辉;;面向Web的文本信息挖掘研究[J];计算机系统应用;2006年09期
9 邓英,李明;Web数据挖掘技术及工具研究[J];计算机工程与应用;2001年20期
10 王艳;数据挖掘在数字图书馆中的应用[J];现代图书情报技术;2002年05期
11 何海江;;一种适应短文本的相关测度及其应用[J];计算机工程;2009年06期
12 赵晓静;;Web文本挖掘综述[J];电脑学习;2008年05期
13 张涛;邓军;;现代远程教育个性化Web挖掘研究[J];科学技术与工程;2007年05期
14 史嘉陵;;数据挖掘在数字图书馆个性化服务中的应用[J];农业网络信息;2009年04期
15 王艳;数据挖掘在数字图书馆中的应用[J];情报科学;2003年02期
16 刘彦保;王文发;王文东;;基于聚类分析策略的Web文本挖掘方法[J];延安大学学报(自然科学版);2007年04期
17 朱东华;荆雷;徐建国;;计算机前沿技术在科技管理领域的应用研究[J];科技进步与对策;2003年09期
18 李颖,阎保平;Web文本挖掘在互联网信息统计中的研究与设计[J];微电子学与计算机;2005年01期
19 赵卫军;;数据挖掘技术在高校图书馆中的应用[J];图书馆论坛;2007年04期
20 姜传菊;试论Web中的数据挖掘[J];现代图书情报技术;2003年S1期
中国重要会议论文全文数据库 前10条
1 林杰华;张斌;李冬森;宋华茂;余志强;王浩;;支持向量机在电力客户信用评级中的应用[A];全国第21届计算机技术与应用学术会议(CACIS·2010)暨全国第2届安全关键技术与应用学术会议论文集[C];2010年
2 蒋铁军;张怀强;李积源;;多变量系统预测的支持向量机方法研究[A];管理科学与系统科学研究新进展——第7届全国青年管理科学与系统科学学术会议论文集[C];2003年
3 黄淑云;孙兴玉;梁汝萍;邱建丁;;基于小波支持向量机预测蛋白质亚细胞定位研究[A];第十一届全国计算(机)化学学术会议论文摘要集[C];2011年
4 谢湘;匡镜明;;支持向量机在语音识别中的应用研究[A];现代通信理论与信号处理进展——2003年通信理论与信号处理年会论文集[C];2003年
5 涂冬成;薛龙;刘木华;赵进辉;沈杰;吁芳;;基于支持向量机的鹅肉肉色客观评定研究[A];中国农业工程学会电气信息与自动化专业委员会、中国电机工程学会农村电气化分会科技与教育专委会2010年学术年会论文摘要[C];2010年
6 杨凌;刘玉树;;基于支持向量机的坦克识别算法[A];第三届全国数字成像技术及相关材料发展与应用学术研讨会论文摘要集[C];2004年
7 师旭超;巴松涛;;基于支持向量机方法的深基坑变形预测[A];科技、工程与经济社会协调发展——河南省第四届青年学术年会论文集(上册)[C];2004年
8 张军;;支持向量机方法在地下水位干扰排除中的初步应用[A];2007年地震流体学术研讨会论文摘要集[C];2007年
9 许建生;盛立东;;基于改进的支持向量机和BP神经网络的识别算法[A];第八届全国汉字识别学术会议论文集[C];2002年
10 荣海娜;张葛祥;张翠芳;;基于支持向量机的非线性系统辨识方法[A];中国自动化学会、中国仪器仪表学会2004年西南三省一市自动化与仪器仪表学术年会论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 杜小芳;基于CPFR的农产品采购模型研究[D];华中科技大学;2005年
2 刘育明;动态过程数据的多变量统计监控方法研究[D];浙江大学;2006年
3 栾锋;支持向量机(SVM)和径向基神经网络(RBFNN)方法在化学、环境化学和药物化学中的应用研究[D];兰州大学;2006年
4 孙薇;市场条件下抽水蓄能电站效益综合评价及运营模式研究[D];华北电力大学(河北);2007年
5 常群;支持向量机的核方法及其模型选择[D];哈尔滨工业大学;2007年
6 朱燕飞;锌钡白回转窑煅烧过程智能建模研究[D];华南理工大学;2005年
7 田英杰;支持向量回归机及其应用研究[D];中国农业大学;2005年
8 燕忠;基于蚁群优化算法的若干问题的研究[D];东南大学;2005年
9 任东;基于支持向量机的植物病害识别研究[D];吉林大学;2007年
10 杨金芳;支持向量回归在预测控制中的应用研究[D];华北电力大学(河北);2007年
中国硕士学位论文全文数据库 前10条
1 徐华;基于支持向量机的Web文本挖掘研究[D];哈尔滨工程大学;2004年
2 崔鹏;一种基于支持向量机的直推式WEB挖掘[D];大连海事大学;2006年
3 刘静;基于Web文本挖掘的SVM网页文本分类研究[D];东北财经大学;2006年
4 易高翔;Web文本挖掘研究与实现[D];武汉科技大学;2004年
5 刘岩;基于Web的文本挖掘技术的研究[D];哈尔滨工程大学;2004年
6 黄娟;基于文本挖掘技术的蛋白质相互作用预测方法研究[D];中南大学;2009年
7 应伟;基于支持向量机的文本分类方法研究[D];天津大学;2006年
8 王栋;基于SVM的分类方法在内容管理中的应用[D];西北大学;2006年
9 刘艳伟;支持向量机方法在感潮河段洪峰水位预报中的应用[D];浙江大学;2010年
10 杨镭;支持向量机算法设计及在高分辨雷达目标识别中的应用[D];国防科学技术大学;2010年
中国重要报纸全文数据库 前10条
1 本报记者 施鹏;非结构信息和文本挖掘[N];21世纪经济报道;2009年
2 周青 编译;文本挖掘工具实现非结构化数据价值[N];计算机世界;2004年
3 张德政;信息挖掘商业智能之“芯”[N];中国计算机报;2002年
4 ;SAS公司收购Teragram 强化BI领域地位[N];计算机世界;2008年
5 本报记者 张晶;怎样挖掘专家的活的经验和智慧[N];科技日报;2011年
6 汪洋 编译;BI平民化[N];计算机世界;2004年
7 王培森;从Web挖到竞争情报[N];中国计算机报;2003年
8 靳辉;垂直搜索:呼叫经济发展的核心动力[N];通信产业报;2007年
9 涂序彦 陈泓娟;在网络信息海洋中淘金[N];计算机世界;2001年
10 缪其浩记者 江世亮;非官方信息源担当应急预警器[N];文汇报;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978