收藏本站
《哈尔滨工程大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

基于人工免疫算法的Web文本挖掘研究

尹丽玲  
【摘要】: 随着上世纪90年代初信息化社会的到来,网络已经变得越来越普及,它已经成为了人们获取各类数据的有效手段和方法。那么如何从海量的文本数据中找到人们所需的信息就成为了亟待解决的问题。文本挖掘研究由此应运而生。文本聚类是文本挖掘领域中一个重要分支,研究它有着重要而深远的意义。 本文先是通过结合了改进的人工免疫算法去解决K-Means算法初始聚类中心敏感的问题,使得其聚类中心更加的合理以便得到更优的聚类结果。这是第一个阶段,目的是得到优化的初始聚类中心。第二阶段利用了De Castro于2002年提出的aiNet网络模型对已经具有相对优化的中心的Web文本进行聚类。 本文首先阐述了Web文本聚类的国内外研究现状和现存的问题,然后介绍了文本聚类的相关过程,从预处理,文本模型表示,到常用的聚类算法,并对这些聚类算法的优缺点进行了评析。文中分析了传统人工免疫算法存在的问题,提出最佳策略对三个人工免疫遗传算子进行改造来加快算法的收敛速度,保证后代的最优性。最后改进了用于聚类的aiNet网络模型中亲和度的计算方法,对变异过程进行了部分控制,克服了其用于度量高维文本聚类相似度不精准的缺点。 实验结果表明,本文中改进的算法有较好的动态适应性,并且改善了聚类的质量。
【学位授予单位】:哈尔滨工程大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TP393.09

【相似文献】
中国期刊全文数据库 前10条
1 赵丽娜;周吉顺;;基于WEB的高校网上选课系统的设计与实现[J];电脑知识与技术;2011年18期
2 米新英;;基于Web的通用商品报价系统的研究与实现[J];北华航天工业学院学报;2011年03期
3 朱启英;李明霞;穆玉明;张源明;;基于WEB的考试系统在医学远程教育中的应用[J];中国高等医学教育;2011年06期
4 段静波;潘惠苹;;基于WEB的学院教务管理系统设计与应用[J];电脑知识与技术;2011年17期
5 范毅君;马永威;;浅谈门户网站的设计与在油田中的应用[J];中国石油和化工标准与质量;2011年07期
6 潘生;;基于WEB的人力资源管理专业亲验式教学资源库系统设计[J];电脑知识与技术;2011年23期
7 杜婷;陶克斌;夏勤;;基于Web的无刷新即时通讯设计与实现[J];重庆科技学院学报(自然科学版);2011年04期
8 王玉华;;Unix平台下的数据库查询开发工具(Web-DTools)的设计与实现[J];信息与电脑(理论版);2011年06期
9 张爱军;;电子商务技术的创新发展趋势[J];电脑知识与技术;2011年26期
10 钟寿福;吴伟信;;中学研究性学习网络支撑平台的设计与实现[J];福建电脑;2011年07期
中国重要会议论文全文数据库 前10条
1 石晶;龚震宇;裘杭萍;;基于Web挖掘的个性化服务技术[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
2 李利波;刘明利;;一种改进的无回溯反向Web服务动态组合方法[A];2011年全国通信安全学术会议论文集[C];2011年
3 游争光;刘建勋;唐明董;;分布式Web服务测试系统的设计与实现[A];CCF NCSC 2011——第二届中国计算机学会服务计算学术会议论文集[C];2011年
4 殷华蓓;李通;唐常杰;张天庆;左志松;;从Web文件中挖掘个性化导航知识[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
5 ;基于广义对话的Web用户的聚类(英文)[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
6 邓长寿;郭景峰;杨焱林;邓安远;;下一代Web搜索引擎初探[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
7 ;WTCA:A Web Text Clustering Algorithm Based on DFSSM[A];第二十七届中国控制会议论文集[C];2008年
8 胡建强;周斌;尹刚;邹鹏;;基于角色的Web服务访问控制技术研究[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
9 黄建波;丁扬;方芳;;基于代理服务器的Web加速的实现[A];2010通信理论与技术新发展——第十五届全国青年通信学术会议论文集(上册)[C];2010年
10 陶冶;刘建勋;唐明董;;基于Map/Reduce的分布式Web服务搜索引擎设计与实现[A];CCF NCSC 2011——第二届中国计算机学会服务计算学术会议论文集[C];2011年
中国重要报纸全文数据库 前10条
1 赵晓涛;Web安全 服务为王[N];网络世界;2008年
2 本报特约撰稿 张娟;用Web 2.0提升知识管理效率[N];计算机世界;2008年
3 厉民;金融风暴冲击Web2.0产业[N];人民邮电;2008年
4 电脑商报记者 周雪;Web安全市场须冷却慎行[N];电脑商报;2008年
5 郭川;Web2.0:新花样层出不穷[N];人民邮电;2008年
6 本报记者 赵晓涛;Web安全:历史的命题[N];网络世界;2008年
7 本报记者 李飞虎;Web 2.0[N];中国计算机报;2008年
8 彭敏;企业级Web2.0迎来应用高潮[N];电脑商报;2009年
9 商报记者 吴辰光;Web2.0凸显空洞概念[N];北京商报;2009年
10 本报记者 毛江华;安启华联手赛门铁克 掘金Web安全[N];计算机世界;2009年
中国博士学位论文全文数据库 前10条
1 张建武;面向Web应用的安全评测技术研究[D];北京邮电大学;2012年
2 朱俊武;基于本体的Web服务语义支撑技术研究[D];南京航空航天大学;2008年
3 李常宝;基于索引的web服务发现研究[D];北京邮电大学;2011年
4 魏登萍;语义Web服务发现中匹配策略的研究与实现[D];国防科学技术大学;2011年
5 许笑;分布式Web信息采集关键技术研究[D];哈尔滨工业大学;2011年
6 杨卉;Web文本观点挖掘及隐含情感倾向的研究[D];吉林大学;2011年
7 马建斌;中文Web信息作者同一认定技术研究[D];河北农业大学;2010年
8 陈世展;服务网络:基于语义和社会化关系的Web服务计算基础设施[D];天津大学;2010年
9 胡佳;语义Web服务自动组合及验证的研究[D];天津大学;2010年
10 王辉;面向互联网的Web服务基础设施构建和应用[D];天津大学;2010年
中国硕士学位论文全文数据库 前10条
1 尹丽玲;基于人工免疫算法的Web文本挖掘研究[D];哈尔滨工程大学;2010年
2 张囡;基于概念的语义Web服务匹配算法的研究及其在配送中心系统的应用[D];华南理工大学;2010年
3 张敏;面向Web应用的测试适配技术研究[D];山东师范大学;2010年
4 涂丘;一种基于Web界面的协同文档管理系统的部署与实施[D];电子科技大学;2010年
5 崔宏亮;面向Web服务体系的协同办公系统的设计与实现[D];电子科技大学;2010年
6 高洁;基于Web信息的内容及其特征提取方法的研究[D];电子科技大学;2010年
7 李鹏;基于信誉度的Web服务选择研究[D];湖南工业大学;2009年
8 马丽莎;基于WEB操作平台下的办公自动化系统[D];电子科技大学;2009年
9 向剑峰;基于OWL-S的语义Web服务组合模型的研究[D];湖北工业大学;2011年
10 郭清军;P2P语义web服务研究与实现[D];广东工业大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026