收藏本站
收藏 | 论文排版

基于粗糙集的数据及文本挖掘方法研究

王明春  
【摘要】:数据挖掘和文本挖掘是当前信息技术中的一个重要研究领域;将软计算方法之一的粗糙集理论应用于数据及文本挖掘方法研究,具有较大的理论意义和实用价值。本文研究了基于粗糙集的数据挖掘和文本挖掘方法,主要包括数据挖掘和文本挖掘中的属性约简问题、聚类问题;文本挖掘中的分类规则抽取问题;以及粗糙集同模糊集相结合的数据挖掘方法。所做主要工作内容包括: 将粗集和遗传算法相结合成功应用于文本模糊聚类。在聚类过程中,将权重参数的设定也通过编码由遗传算法确定,从而使得权重参数的设定具有科学性和可操作性。 给出了近似规则的定义,并对χ~2值的意义进行了讨论。在此基础上提出了一种将特征选取和粗集方法相结合的文本分类规则抽取方法。该方法大大提高了文本规则抽取的效率,并使其更趋实用化。 对相关文献中隶属函数的定义进行了改进,并且利用隶属函数的性质提出了一种从定量决策表转换为定性决策表的转换规则,利用此转换规则可以将原来的定量决策表转换为一个同样大小的定性决策表,这样大大减少了后面利用粗集理论进行规则抽取的计算量,而且提取的规则质量也有了很大提高。 将模式聚合理论和潜在语义索引理论相结合,提出了一种文本降维新方法。它首先用PA理论对文本特征进行初步降维,在此基础上利用LSI方法对文本特征进一步降维,抽取隐藏在文本中的主要语义信息。 提出了一种改进的基于粗集和Tabu搜索的属性约简算法。改进后的算法既具有较高的算法效率,又能以较大的概率得到最小属性约简。 提出了基于知识简洁度的粗集聚类方法,它首先计算对象集合在每个属性下的划分;然后在对初始划分进行合并时,引进了不可分辨度的概念;在形成最终聚类结果时,引进了知识简洁度作为凝聚的终止条件。 将基于次胜对手惩罚的竞争学习算法应用于文本聚类,这种方法既能自动确定聚类的数目,又具有较好的算法复杂度。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 孙涛;董立岩;李军;张羽翔;;用于粗糙集约简的并行算法[J];吉林大学学报(理学版);2006年02期
2 丁春荣;李龙澍;;一个基于粗集的决策树规则提取算法[J];计算机技术与发展;2007年11期
3 彭云;丁树良;;基于属性约简的聚类分析技术[J];计算机工程与应用;2009年09期
4 樊持杰;陈丽敏;夏春艳;;基于粗糙集的属性约简算法[J];微计算机信息;2010年06期
5 杨春亮;;基于信息粒度的属性约简算法研究[J];电脑知识与技术;2009年10期
6 李智玲;张亦军;胡彧;;基于粗糙集的遗传算法在数据挖掘中的应用[J];科技情报开发与经济;2009年09期
7 胡彧;张亦军;杨冬梅;;粗糙集结合遗传算法在数据挖掘中的应用[J];计算机应用;2006年S1期
8 马昕;林丽清;;蚁群算法在面向属性的数据约简中的应用[J];计算机仿真;2007年09期
9 陈丽雯,陈燕,任宏旺;基于粗糙集的属性约简算法改进[J];微机发展;2003年12期
10 谭耀武;;基于数据挖掘粗糙集技术的电信运营商客户价值评价[J];沿海企业与科技;2006年01期
11 陈思睿;张永;杨志勇;;基于粗糙集的特征选择方法的研究[J];计算机工程与应用;2006年21期
12 白秀玲;王平;普杰信;;一种粗糙集值约简算法及其应用[J];微计算机信息;2006年33期
13 胡启韬;袁志平;周忠海;;基于粗糙集和遗传算法的数据挖掘方法[J];电脑知识与技术;2008年11期
14 胡启韬;袁志平;周忠海;;基于粗糙集和遗传算法的数据挖掘方法[J];江西蓝天学院学报;2008年S1期
15 李翠霞;林楠;;浅析文本挖掘技术[J];科技信息;2007年10期
16 王斌;朴顺姬;邵华清;;基于粗糙集的KNN的WEB文本分类的研究[J];数字技术与应用;2011年08期
17 翟素兰;郑诚;;用于入侵检测的基于粗糙集的贝叶斯分类器[J];计算机技术与发展;2006年01期
18 张燕;寒枫;楚红涛;;文本挖掘简述[J];中国电力教育;2006年S3期
19 吴微微;施祖平;;一种垂直分布环境下的特征选择及规则提取算法[J];荆门职业技术学院学报;2008年06期
20 张华;魏文军;;粗糙集和决策树方法在微机监测中的应用研究[J];科技信息;2011年13期
中国重要会议论文全文数据库 前10条
1 陈楚湘;沈建京;陈冰;尚长兴;王运成;;运用粗糙集理论建立中老年肺炎中医症候诊断标准[A];第二十九届中国控制会议论文集[C];2010年
2 易向军;宋威;;数据挖掘技术在冶金MES中的应用探讨[A];冶金自动化信息网年会论文集[C];2004年
3 葛丽;傅彦;;粗糙集在科学数据属性约简中的应用[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
4 王令群;郑应平;周爱华;;数据挖掘技术在半导体生产过程数据分析中的应用[A];2005年中国智能自动化会议论文集[C];2005年
5 余嘉元;;粗糙集在心理测量数据挖掘中的应用[A];第十届全国心理学学术大会论文摘要集[C];2005年
6 陈昭炯;叶东毅;;粗糙集在一类林业数据决策分析中的应用[A];中国运筹学会第六届学术交流会论文集(下卷)[C];2000年
7 齐晓轩;纪建伟;韩晓微;原忠虎;;基于FCM的粗糙集属性约简方法在汽轮机故障诊断中的应用[A];全国第21届计算机技术与应用学术会议(CACIS·2010)暨全国第2届安全关键技术与应用学术会议论文集[C];2010年
8 王旭阳;王彤;李明;;基于粗糙集理论的分类规则挖掘方法[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
9 刘永红;薛青;郑长伟;;基于粗糙集理论的C4ISR评估方法[A];第13届中国系统仿真技术及其应用学术年会论文集[C];2011年
10 郭建文;黄燕;印鉴;杨小波;梁兆辉;;建立中风病“阴阳类证”辨证规范的数据挖掘研究[A];中华医学会第十三次全国神经病学学术会议论文汇编[C];2010年
中国博士学位论文全文数据库 前10条
1 王明春;基于粗糙集的数据及文本挖掘方法研究[D];天津大学;2005年
2 王曙燕;医学图像智能分类算法研究[D];西北大学;2006年
3 刘洪波;汉语认知脑数据挖掘相关算法及应用研究[D];大连理工大学;2006年
4 马君华;粗糙集属性约简和聚类算法及其在电力自动化中的应用研究[D];华中科技大学;2010年
5 郝占刚;基于遗传算法等技术的数据与文本聚分类研究[D];天津大学;2006年
6 张国军;基于粗糙集的相对属性约简算法及决策方法研究[D];华中科技大学;2010年
7 黄定轩;企业核心能力智能挖掘应用基础研究[D];西南交通大学;2005年
8 刘业政;基于粗糙集数据分析的智能决策支持系统研究[D];合肥工业大学;2002年
9 丛蓉;作战指挥决策支持系统目标融合识别研究[D];大连理工大学;2010年
10 赵佰亭;混合决策系统的粗集模型及在转台故障诊断中的应用[D];哈尔滨工业大学;2010年
中国硕士学位论文全文数据库 前10条
1 葛丽;粗糙集在海量科学数据挖掘中的应用[D];电子科技大学;2005年
2 魏悦亮;粗糙集在数据挖掘不确定性问题中的研究[D];中国石油大学;2010年
3 王鹏;基于邻域粗糙集的属性约简算法研究[D];河北科技大学;2011年
4 任宏旺;基于粗糙集的数据挖掘模型的研究与应用[D];大连海事大学;2003年
5 李楠;基于邻域粗糙集的属性约简算法研究[D];陕西师范大学;2011年
6 于兴网;粗糙集属性约简算法在数据挖掘中的研究[D];重庆大学;2004年
7 杨柳;基于粗糙集的数据挖掘技术研究及其在智能软件中的实现[D];电子科技大学;2004年
8 梁蒙;基于粗糙集的属性约简算法研究[D];河南大学;2011年
9 陈展雄;基于多种群免疫量子粒子群的粗糙集属性约简与故障诊断[D];华东理工大学;2011年
10 李祝平;扩展粗糙集模型及其属性约简算法的研究[D];太原理工大学;2005年
中国重要报纸全文数据库 前10条
1 李开宇 黄建军 田长春;把“数据挖掘”作用发挥出来[N];中国国防报;2009年
2 华莱士;“数据挖掘”让银行赢利更多[N];国际金融报;2003年
3 记者 晏燕;数据挖掘让决策者告别“拍脑袋”[N];科技日报;2006年
4 □中国电信股份有限公司北京研究院 张舒博 □北京邮电大学计算机科学与技术学院 牛琨;走出数据挖掘的误区[N];人民邮电;2006年
5 张立明;数据挖掘之道[N];网络世界;2003年
6 中圣信息技术有限公司 李辉;数据挖掘在CRM中的作用[N];中国计算机报;2001年
7 田红生;数据挖掘在CRM中的应用[N];中国经济时报;2002年
8 王广宇;数据挖掘 加速银行CRM一体化[N];中国计算机报;2004年
9 周蓉蓉;数据挖掘需要点想像力[N];计算机世界;2004年
10 王玮 蔡莲红;数据挖掘走入语音处理[N];计算机世界;2001年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978