收藏本站
《天津大学》 2006年
收藏 | 手机打开
二维码
手机客户端打开本文

基于遗传算法等技术的数据与文本聚分类研究

郝占刚  
【摘要】: 数据挖掘和文本挖掘是当前信息技术中的一个重要研究领域;将软计算方法之一的遗传算法应用于数据及文本挖掘方法研究,具有较大的理论意义和实用价值。本文研究了基于遗传算法和社会演化算法的数据挖掘和文本挖掘方法,主要包括数据挖掘和文本挖掘中的属性约简问题、聚类问题。所做主要工作内容包括: 提出一种基于遗传算法和k-medoids算法的新的聚类方法。该方法既可以很好地解决局部最优的问题,也可以很好地解决孤立点的问题,同时用于和k-medoids算法相结合,可以加快遗传算法的收敛速度,节约了时间成本。 采用遗传算法和模式聚合进行文本特征降维。模式聚合可以有效降低文本特征的维数,使得特征从几千维降为几百维,在此基础上采用遗传算法继续降维。 采用遗传算法和潜在语义索引进行文本特征降维。潜在语义索引通过奇异值分解可以有效地降低向量空间的维数。在此基础上采用遗传算法继续降维。 采用社会演化算法进行聚类。K均值聚类算法通常只能以局部最优结束,很难找到全局最优。本文提出一种基于社会演化算法和K均值算法相结合的聚类新方法。在该方法中提出了认知主体在聚类中对范式学习的新的方式。 采用混沌社会演化算法进行聚类。在认知主体对范式的背叛中采用混沌变异算子。实验证明该方法不但能提高聚类的效率而且能提高聚类的精度。
【学位授予单位】:天津大学
【学位级别】:博士
【学位授予年份】:2006
【分类号】:F224

【相似文献】
中国期刊全文数据库 前10条
1 李江龙;白雪;;基于粗糙集理论的复方拆方研究[J];太原师范学院学报(自然科学版);2005年04期
2 王宗军,李红侠,邓晓岚;粗糙集理论的最新应用[J];统计与决策;2005年22期
3 孙涛;董立岩;李军;张羽翔;;用于粗糙集约简的并行算法[J];吉林大学学报(理学版);2006年02期
4 丁卫平;邓伟;管致锦;;基于粗糙集的属性约简优化算法研究[J];苏州大学学报(自然科学版);2008年02期
5 杨延娇;门维江;;基于异常点挖掘的聚类算法比较研究[J];甘肃联合大学学报(自然科学版);2008年01期
6 王宗军;李红侠;邓晓岚;;粗糙集理论研究的最新进展及发展趋势[J];武汉理工大学学报(信息与管理工程版);2006年01期
7 李永丽;任辉明;董立岩;李威;陈思国;赵宇;;基于数据模式聚类算法的离群点检测[J];吉林大学学报(理学版);2007年03期
8 王会;;基于WWW聚类引擎的研究现状及问题[J];科技信息;2009年18期
9 武志峰;陈冬霞;;基于粗糙集方法的知识发现[J];河北省科学院学报;2006年04期
10 李萍;李法朝;;基于决策树的知识表示模型及其应用[J];河北科技大学学报;2009年02期
中国重要会议论文全文数据库 前10条
1 刘斓冰;魏桂英;;Web文本信息挖掘技术[A];全国第十届企业信息化与工业工程学术年会论文集[C];2006年
2 盛立;刘希玉;高明;;基于粗糙集理论的数据挖掘算法研究[A];山东省计算机学会2005年信息技术与信息化研讨会论文集(二)[C];2005年
3 代广珍;徐超;;基于Web的数据挖掘研究综述[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
4 佘晓华;单汨源;任斌;;基于数据挖掘的项目族工作分解结构模型构建研究[A];信息化、工业化融合与服务创新——第十三届计算机模拟与信息技术学术会议论文集[C];2011年
5 李仁璞;黄道;高茂庭;;一种快速的决策规则抽取方法[A];2005中国控制与决策学术年会论文集(下)[C];2005年
6 沈勇;颜建军;王忆勤;许朝霞;刘国萍;夏春明;李福凤;燕海霞;郭睿;;基于数据挖掘的中医信息处理方法研究概述[A];中华中医药学会中医诊断学分会第十次学术研讨会论文集[C];2009年
7 郭学军;陈晓云;;粗集方法在数据挖掘中的应用[A];第十六届全国数据库学术会议论文集[C];1999年
8 徐慧;;基于Web的文献数据挖掘[A];第十七届全国数据库学术会议论文集(技术报告篇)[C];2000年
9 孙迎;;医院信息的数据挖掘与方法研究[A];中华医学会第十次全国医学信息学术会议论文汇编[C];2004年
10 薛晓东;李海玲;;数据挖掘的客户关系管理应用[A];科技、工程与经济社会协调发展——河南省第四届青年学术年会论文集(下册)[C];2004年
中国重要报纸全文数据库 前10条
1 李开宇 黄建军 田长春;把“数据挖掘”作用发挥出来[N];中国国防报;2009年
2 华莱士;“数据挖掘”让银行赢利更多[N];国际金融报;2003年
3 记者 晏燕;数据挖掘让决策者告别“拍脑袋”[N];科技日报;2006年
4 □中国电信股份有限公司北京研究院 张舒博 □北京邮电大学计算机科学与技术学院 牛琨;走出数据挖掘的误区[N];人民邮电;2006年
5 张立明;数据挖掘之道[N];网络世界;2003年
6 中圣信息技术有限公司 李辉;数据挖掘在CRM中的作用[N];中国计算机报;2001年
7 田红生;数据挖掘在CRM中的应用[N];中国经济时报;2002年
8 王广宇;数据挖掘 加速银行CRM一体化[N];中国计算机报;2004年
9 周蓉蓉;数据挖掘需要点想像力[N];计算机世界;2004年
10 张舒博;数据挖掘 提升品牌的好帮手[N];首都建设报;2009年
中国博士学位论文全文数据库 前10条
1 郝占刚;基于遗传算法等技术的数据与文本聚分类研究[D];天津大学;2006年
2 王明春;基于粗糙集的数据及文本挖掘方法研究[D];天津大学;2005年
3 黄定轩;企业核心能力智能挖掘应用基础研究[D];西南交通大学;2005年
4 熊赟;生物序列模式挖掘与聚类研究[D];复旦大学;2007年
5 戴维迪;非监督知识发现过程中若干关键问题研究[D];天津大学;2005年
6 孙丽;工艺知识管理及其若干关键技术研究[D];大连交通大学;2005年
7 胡志坤;复杂有色金属熔炼过程操作模式智能优化方法研究[D];中南大学;2005年
8 耿焕同;范例推理与互联网文本信息处理研究[D];中国科学技术大学;2006年
9 李芳;文本挖掘若干关键技术研究[D];北京化工大学;2010年
10 刘革平;基于数据挖掘的远程学习评价研究[D];西南师范大学;2005年
中国硕士学位论文全文数据库 前10条
1 李祝平;扩展粗糙集模型及其属性约简算法的研究[D];太原理工大学;2005年
2 李伯阳;文本聚类方法研究及其应用[D];厦门大学;2008年
3 覃志华;可变精度粗糙集合模型研究与应用[D];中南大学;2005年
4 杨占华;聚类分析研究及其在文本挖掘中的应用[D];西南交通大学;2006年
5 仇丽青;粗糙集在数据挖掘中的应用研究[D];山东师范大学;2005年
6 葛丽;粗糙集在海量科学数据挖掘中的应用[D];电子科技大学;2005年
7 刘翠娟;基于数据挖掘的网络入侵检测方法研究[D];华北电力大学(河北);2006年
8 陈可赢;属性约简算法CARRDG的改进及其实现技术研究[D];厦门大学;2008年
9 李明;数据清洗技术在文本挖掘中的应用[D];南京理工大学;2008年
10 杨斌;中文文本数据挖掘研究[D];湘潭大学;2002年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026