收藏本站
《天津大学》 2005年
收藏 | 手机打开
二维码
手机客户端打开本文

基于粗糙集的数据及文本挖掘方法研究

王明春  
【摘要】:数据挖掘和文本挖掘是当前信息技术中的一个重要研究领域;将软计算方法之一的粗糙集理论应用于数据及文本挖掘方法研究,具有较大的理论意义和实用价值。本文研究了基于粗糙集的数据挖掘和文本挖掘方法,主要包括数据挖掘和文本挖掘中的属性约简问题、聚类问题;文本挖掘中的分类规则抽取问题;以及粗糙集同模糊集相结合的数据挖掘方法。所做主要工作内容包括: 将粗集和遗传算法相结合成功应用于文本模糊聚类。在聚类过程中,将权重参数的设定也通过编码由遗传算法确定,从而使得权重参数的设定具有科学性和可操作性。 给出了近似规则的定义,并对χ~2值的意义进行了讨论。在此基础上提出了一种将特征选取和粗集方法相结合的文本分类规则抽取方法。该方法大大提高了文本规则抽取的效率,并使其更趋实用化。 对相关文献中隶属函数的定义进行了改进,并且利用隶属函数的性质提出了一种从定量决策表转换为定性决策表的转换规则,利用此转换规则可以将原来的定量决策表转换为一个同样大小的定性决策表,这样大大减少了后面利用粗集理论进行规则抽取的计算量,而且提取的规则质量也有了很大提高。 将模式聚合理论和潜在语义索引理论相结合,提出了一种文本降维新方法。它首先用PA理论对文本特征进行初步降维,在此基础上利用LSI方法对文本特征进一步降维,抽取隐藏在文本中的主要语义信息。 提出了一种改进的基于粗集和Tabu搜索的属性约简算法。改进后的算法既具有较高的算法效率,又能以较大的概率得到最小属性约简。 提出了基于知识简洁度的粗集聚类方法,它首先计算对象集合在每个属性下的划分;然后在对初始划分进行合并时,引进了不可分辨度的概念;在形成最终聚类结果时,引进了知识简洁度作为凝聚的终止条件。 将基于次胜对手惩罚的竞争学习算法应用于文本聚类,这种方法既能自动确定聚类的数目,又具有较好的算法复杂度。
【学位授予单位】:天津大学
【学位级别】:博士
【学位授予年份】:2005
【分类号】:TP311.13

【引证文献】
中国博士学位论文全文数据库 前1条
1 温有奎;基于语义挖掘的文本知识元模型与应用研究[D];武汉大学;2010年
中国硕士学位论文全文数据库 前10条
1 王飞;基于蚁群优化的模糊文本聚类算法研究[D];河南工业大学;2010年
2 王珍珍;基于粗糙集理论的文本分类算法研究及应用[D];山东师范大学;2007年
3 杨淑棉;粗糙集在文本分类系统中的应用研究[D];山东师范大学;2007年
4 陈界碑;基于粗糙集理论的聚类研究[D];安徽大学;2007年
5 邢丽莉;基于Web的中文文本分类技术的研究[D];河北工程大学;2008年
6 柴造坡;基于粗糙集的高职学生非智力学习因素研究[D];哈尔滨工程大学;2009年
7 周倩;基于RS-SVM的中文文本分类研究[D];天津财经大学;2009年
8 曾颖;基于粗糙集的聚类算法研究[D];长沙理工大学;2009年
9 徐红伟;GML空间数据挖掘技术研究[D];江西理工大学;2009年
10 宋太杰;粗糙集理论在文本挖掘中的应用研究[D];长春理工大学;2010年
【参考文献】
中国期刊全文数据库 前6条
1 赵卫东,盛昭瀚,何建敏;粗糙集在决策树生成中的应用[J];东南大学学报(自然科学版);2000年04期
2 孟庆春,王汉萍,魏天滨,葛艳,高云;一种基于粗糙集的文本分类规则抽取方法[J];青岛海洋大学学报(自然科学版);2003年06期
3 刘红岩,陈剑,陈国青;数据挖掘中的数据分类算法综述[J];清华大学学报(自然科学版);2002年06期
4 常犁云,263.net,王国胤,263.net,吴渝,263.net;一种基于Rough Set理论的属性约简及规则提取方法[J];软件学报;1999年11期
5 苗夺谦,王珏;基于粗糙集的多变量决策树构造方法[J];软件学报;1997年06期
6 钟根元,王方华,范小军,黄沛;基于变精度粗集模型的定量数据挖掘算法[J];上海交通大学学报;2004年05期
【共引文献】
中国期刊全文数据库 前10条
1 张世海,刘晓燕,欧进萍;高层结构智能选型知识发现及方法比较[J];四川建筑科学研究;2005年05期
2 吕俊;任雪萍;;一种基于粗糙集理论的变压器故障多变量决策树诊断方法[J];安徽电气工程职业技术学院学报;2011年01期
3 潘洁珠;半结构化数据及其数据模型[J];安徽教育学院学报;2003年06期
4 倪志伟;;BP网络中激活函数的深入研究[J];安徽大学学报(自然科学版);1997年03期
5 赵鹏,倪志伟,贾瑞玉;基于数据挖掘技术的范例库维护[J];安徽大学学报(自然科学版);2003年02期
6 孟庆全;金传山;梅灿华;胡学钢;;基于依赖度求解属性约简的方法[J];安徽大学学报(自然科学版);2008年04期
7 梁佩佩,杨丽萍;基于模糊关系数据库的聚类算法研究[J];安徽职业技术学院学报;2004年01期
8 杨萍,杨明;基于VPRS的重要属性评价方法研究[J];安徽工程科技学院学报(自然科学版);2003年01期
9 陶秀凤,唐诗忠,周鸣争;基于支持向量机的软测量模型及应用[J];安徽工程科技学院学报(自然科学版);2004年02期
10 江效尧,胡林生;基于粗糙集的RDT决策树生成算法的研究及应用[J];安徽工程科技学院学报(自然科学版);2004年03期
中国重要会议论文全文数据库 前10条
1 ;A Kind of Inference Method of Fault Diagnosis Based on the Fuzzy Logic System[A];Proceedings of the 5th International Symposium on Test and Measurement(Volume 1)[C];2003年
2 ;The Application of Minimal Reduction Based on GA to Weather Data[A];第七届国际测试技术研讨会论文集[C];2007年
3 宋贤钧;;Domino/Notes的知识管理与OAS的融合研究[A];OA’2005第九届办公自动化国际学术研讨会论文集[C];2005年
4 汤广富;马春实;刘欢;付强;;模糊聚类快速实用方法[A];第十四届全国信号处理学术年会(CCSP-2009)论文集[C];2009年
5 邹刚;滕书华;孙即祥;陈森林;敖永红;;一种粗糙集优化协同原型模式约简分类方法[A];第十四届全国信号处理学术年会(CCSP-2009)论文集[C];2009年
6 田松;侯妙乐;王晏民;郭宏;;基于面向属性归纳决策树的馆藏壁画病害信息提取[A];第二届“测绘科学前沿技术论坛”论文精选[C];2008年
7 刘妍;袁永博;张明媛;;基于数据挖掘的工程项目全面风险管理研究[A];第二届结构工程新进展国际论坛论文集[C];2008年
8 丁莉娟;;数据挖掘在财务风险分析中的应用[A];第三届全国软件测试会议与移动计算、栅格、智能化高级论坛论文集[C];2009年
9 鲁俐;;高校档案管理工作中的一种决策树分类算法研究[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(上)[C];2006年
10 由立真;穆志纯;;基于GHSOM网络预测客户欺诈行为[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(上)[C];2006年
中国博士学位论文全文数据库 前10条
1 王杰;基于人工智能的乒乓球比赛技战术诊断与评估研究[D];上海体育学院;2010年
2 刘家国;基于突发事件风险的供应链利益分配与行为决策研究[D];哈尔滨工程大学;2010年
3 徐森;文本聚类集成关键技术研究[D];哈尔滨工程大学;2010年
4 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
5 于翔;基于网格的数据流聚类方法研究[D];哈尔滨工程大学;2010年
6 孟宇龙;基于本体的多源异构安全数据聚合[D];哈尔滨工程大学;2010年
7 丁宝成;煤矿安全预警模型及应用研究[D];辽宁工程技术大学;2010年
8 高晓阳;甘肃河西大麦麦芽干燥控制系统研究[D];甘肃农业大学;2010年
9 孔令启;基于内外圈协同优化策略的间歇化工过程不确定性调度研究[D];华南理工大学;2010年
10 张克俊;基因表达式编程理论及其监督机器学习模型研究[D];浙江大学;2010年
中国硕士学位论文全文数据库 前10条
1 李金华;基于SVM的多类文本分类研究[D];山东科技大学;2010年
2 吴香庭;基于遗传算法的K-means聚类方法的研究[D];山东科技大学;2010年
3 李光远;基于在线聚类和最小二乘支持向量机的模糊建模方法研究[D];郑州大学;2010年
4 郭明;基于文本分类技术的文本情感倾向性研究[D];郑州大学;2010年
5 左维松;规则和统计相结合的篇章情感倾向性分析研究[D];郑州大学;2010年
6 李长鹏;基于CSTR温度系统的模糊神经网络预测控制研究[D];哈尔滨工程大学;2009年
7 雷斌;基于Java技术的智能化搜索引擎的研究与设计[D];哈尔滨工程大学;2010年
8 阎明;蒸汽发生器故障预报方法研究[D];哈尔滨工程大学;2010年
9 王颖芳;基于特定内容的敏感图像过滤技术的研究[D];哈尔滨工程大学;2010年
10 刘业明;潜艇位姿控制系统智能故障诊断技术研究[D];哈尔滨工程大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 秦奕青;杨炳儒;徐章艳;;基于Skowron分明矩阵的有效属性约简算法[J];北京科技大学学报;2009年03期
2 何元娇;张国英;;基于本体语义的简单向量距离分类方法[J];北京石油化工学院学报;2007年03期
3 邓芳;XML文档到数据库数据转换研究[J];北京邮电大学学报;2004年01期
4 董艳秋,纪凯,黄衍顺;波浪中船舶横摇稳性的研究[J];船舶力学;1999年02期
5 杨晓懿,刘嘉勇,陈淑敏;SVM在文本自动分类中的应用[J];成都信息工程学院学报;2005年02期
6 周海燕,王家耀,吴升;空间数据挖掘技术及其应用[J];测绘通报;2002年02期
7 周文生,毛峰;地理标记语言GML及其可视化[J];测绘通报;2003年09期
8 易韬辉;粗糙集理论的连续属性离散化的一种方法[J];长沙航空职业技术学院学报;2004年01期
9 沈华;船舶耐波性理论在航海中应用的探讨[J];大连海事大学学报;1999年04期
10 邵哲平,郑中义,杨丹,吴兆麟;90年代海上交通定量研究成果的统计分析[J];大连海事大学学报;1999年02期
中国重要会议论文全文数据库 前1条
1 柳长华;;基于知识元的中医古籍计算机知识表示方法[A];中国生物医学工程学会第六次会员代表大会暨学术会议论文摘要汇编[C];2004年
中国博士学位论文全文数据库 前10条
1 文华;海运安全评价研究[D];武汉理工大学;2003年
2 刘君强;海量数据挖掘技术研究[D];浙江大学;2003年
3 宋枫溪;自动文本分类若干基本问题研究[D];南京理工大学;2004年
4 马建国;具有内容标引的信息共享技术[D];电子科技大学;2004年
5 罗可;数据库中数据挖掘理论方法及应用研究[D];湖南大学;2005年
6 罗小楠;电子病历系统的研究:信息录入与质量监控电子化实现[D];第四军医大学;2005年
7 张雪英;基于粗糙集理论的文本自动分类研究[D];南京理工大学;2005年
8 李荣陆;文本分类及其相关技术研究[D];复旦大学;2005年
9 陈晓云;文本挖掘若干关键技术研究[D];复旦大学;2005年
10 肖怀志;基于本体的历史年代知识元应用研究[D];武汉大学;2005年
中国硕士学位论文全文数据库 前10条
1 罗思群;基于XML技术的数据转换[D];中国科学院软件研究所;2001年
2 罗芳;数据挖掘和XML技术的研究[D];武汉理工大学;2002年
3 罗强;基于粗糙集理论的知识发现在web文本挖掘上的应用研究[D];广西大学;2003年
4 王汉萍;粗糙集理论在文本挖掘的分类算法中的应用研究[D];中国海洋大学;2003年
5 李银花;基于粗糙集理论的属性约简算法研究及应用[D];华北工学院;2004年
6 熊文海;船舶耐波性评价及其在航海安全中的应用[D];武汉理工大学;2004年
7 陈利雄;影响渤海客滚船航行安全的气象海况条件研究[D];大连海事大学;2004年
8 苏晨;渤海湾客滚船风浪中航行安全性的研究[D];大连海事大学;2004年
9 关宏伟;基于数据挖掘技术的实时大容量数据分析的研究[D];哈尔滨工程大学;2004年
10 陈明;半结构化数据XML与结构化数据库之间转换的研究及应用[D];重庆大学;2004年
【二级引证文献】
中国期刊全文数据库 前2条
1 胡婕茹;杨小平;黄都培;;从百度百科挖掘领域知识相关度[J];广西师范大学学报(自然科学版);2011年04期
2 李生长;王凤武;刘强;齐壮;;基于BP神经网络的船舶耐波性评价[J];大连海事大学学报;2012年01期
中国硕士学位论文全文数据库 前10条
1 邓一平;基于粒计算的多智能主体任务分配研究[D];南昌大学;2007年
2 邢丽莉;基于Web的中文文本分类技术的研究[D];河北工程大学;2008年
3 刘静;基于双重特征选取和启发式约简的粗糙集文本分类研究[D];暨南大学;2008年
4 程博;Web文本分类方法研究与系统实现[D];电子科技大学;2010年
5 李生长;油船大风浪航行中的耐波性评价研究[D];大连海事大学;2011年
6 卞立兵;基于粗糙集的动态模糊神经网络结构研究[D];西南大学;2011年
7 黎源;基于粗糙集的中文文本分类在邮件过滤中的研究[D];暨南大学;2011年
8 吴国洋;GML时空离群点挖掘技术研究[D];江西理工大学;2011年
9 宋爱琪;GML时空聚类挖掘研究[D];江西理工大学;2011年
10 张艳;嵌入式浏览器用户行为感知技术的研究与实现[D];华南理工大学;2011年
【二级参考文献】
中国期刊全文数据库 前10条
1 张红云,石阳,马垣;数据挖掘中聚类算法比较研究[J];鞍山钢铁学院学报;2001年05期
2 管霖,曹绍杰;基于人工智能的大系统分层在线暂态稳定评估[J];电力系统自动化;2000年02期
3 吕志来,张保会,哈恒旭;模糊子集和Taylor级数相结合的快速事故筛选方法[J];电力系统自动化;2000年22期
4 张琦,韩祯祥,曹绍杰,顾雪平;用于暂态稳定评估的人工神经网络输入空间压缩方法[J];电力系统自动化;2001年02期
5 唐巍,陈学允;BP算法应用于电力系统暂态稳定分析的新策略[J];电力系统自动化;1997年03期
6 吴新根,柏毅,罗立民;一种基于概率神经网络模型的胃病诊断专家系统[J];东南大学学报;1999年04期
7 薛翠芳,郭炳炎;汉语文本特征词的抽取方法[J];情报学报;2000年03期
8 陈宁,陈安,周龙骧;大规模交易数据库的一种有效聚类算法(英文)[J];软件学报;2001年04期
9 苗夺谦,王珏;基于粗糙集的多变量决策树构造方法[J];软件学报;1997年06期
10 刘小虎,李生;决策树的优化算法[J];软件学报;1998年10期
【相似文献】
中国期刊全文数据库 前10条
1 孙涛;董立岩;李军;张羽翔;;用于粗糙集约简的并行算法[J];吉林大学学报(理学版);2006年02期
2 丁春荣;李龙澍;;一个基于粗集的决策树规则提取算法[J];计算机技术与发展;2007年11期
3 彭云;丁树良;;基于属性约简的聚类分析技术[J];计算机工程与应用;2009年09期
4 樊持杰;陈丽敏;夏春艳;;基于粗糙集的属性约简算法[J];微计算机信息;2010年06期
5 杨春亮;;基于信息粒度的属性约简算法研究[J];电脑知识与技术;2009年10期
6 李智玲;张亦军;胡彧;;基于粗糙集的遗传算法在数据挖掘中的应用[J];科技情报开发与经济;2009年09期
7 胡彧;张亦军;杨冬梅;;粗糙集结合遗传算法在数据挖掘中的应用[J];计算机应用;2006年S1期
8 马昕;林丽清;;蚁群算法在面向属性的数据约简中的应用[J];计算机仿真;2007年09期
9 陈丽雯,陈燕,任宏旺;基于粗糙集的属性约简算法改进[J];微机发展;2003年12期
10 谭耀武;;基于数据挖掘粗糙集技术的电信运营商客户价值评价[J];沿海企业与科技;2006年01期
中国重要会议论文全文数据库 前10条
1 陈楚湘;沈建京;陈冰;尚长兴;王运成;;运用粗糙集理论建立中老年肺炎中医症候诊断标准[A];第二十九届中国控制会议论文集[C];2010年
2 易向军;宋威;;数据挖掘技术在冶金MES中的应用探讨[A];冶金自动化信息网年会论文集[C];2004年
3 葛丽;傅彦;;粗糙集在科学数据属性约简中的应用[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
4 王令群;郑应平;周爱华;;数据挖掘技术在半导体生产过程数据分析中的应用[A];2005年中国智能自动化会议论文集[C];2005年
5 余嘉元;;粗糙集在心理测量数据挖掘中的应用[A];第十届全国心理学学术大会论文摘要集[C];2005年
6 陈昭炯;叶东毅;;粗糙集在一类林业数据决策分析中的应用[A];中国运筹学会第六届学术交流会论文集(下卷)[C];2000年
7 齐晓轩;纪建伟;韩晓微;原忠虎;;基于FCM的粗糙集属性约简方法在汽轮机故障诊断中的应用[A];全国第21届计算机技术与应用学术会议(CACIS·2010)暨全国第2届安全关键技术与应用学术会议论文集[C];2010年
8 王旭阳;王彤;李明;;基于粗糙集理论的分类规则挖掘方法[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
9 刘永红;薛青;郑长伟;;基于粗糙集理论的C4ISR评估方法[A];第13届中国系统仿真技术及其应用学术年会论文集[C];2011年
10 郭建文;黄燕;印鉴;杨小波;梁兆辉;;建立中风病“阴阳类证”辨证规范的数据挖掘研究[A];中华医学会第十三次全国神经病学学术会议论文汇编[C];2010年
中国重要报纸全文数据库 前10条
1 李开宇 黄建军 田长春;把“数据挖掘”作用发挥出来[N];中国国防报;2009年
2 华莱士;“数据挖掘”让银行赢利更多[N];国际金融报;2003年
3 记者 晏燕;数据挖掘让决策者告别“拍脑袋”[N];科技日报;2006年
4 □中国电信股份有限公司北京研究院 张舒博 □北京邮电大学计算机科学与技术学院 牛琨;走出数据挖掘的误区[N];人民邮电;2006年
5 张立明;数据挖掘之道[N];网络世界;2003年
6 中圣信息技术有限公司 李辉;数据挖掘在CRM中的作用[N];中国计算机报;2001年
7 田红生;数据挖掘在CRM中的应用[N];中国经济时报;2002年
8 王广宇;数据挖掘 加速银行CRM一体化[N];中国计算机报;2004年
9 周蓉蓉;数据挖掘需要点想像力[N];计算机世界;2004年
10 王玮 蔡莲红;数据挖掘走入语音处理[N];计算机世界;2001年
中国博士学位论文全文数据库 前10条
1 王明春;基于粗糙集的数据及文本挖掘方法研究[D];天津大学;2005年
2 王曙燕;医学图像智能分类算法研究[D];西北大学;2006年
3 刘洪波;汉语认知脑数据挖掘相关算法及应用研究[D];大连理工大学;2006年
4 马君华;粗糙集属性约简和聚类算法及其在电力自动化中的应用研究[D];华中科技大学;2010年
5 郝占刚;基于遗传算法等技术的数据与文本聚分类研究[D];天津大学;2006年
6 张国军;基于粗糙集的相对属性约简算法及决策方法研究[D];华中科技大学;2010年
7 黄定轩;企业核心能力智能挖掘应用基础研究[D];西南交通大学;2005年
8 刘业政;基于粗糙集数据分析的智能决策支持系统研究[D];合肥工业大学;2002年
9 丛蓉;作战指挥决策支持系统目标融合识别研究[D];大连理工大学;2010年
10 赵佰亭;混合决策系统的粗集模型及在转台故障诊断中的应用[D];哈尔滨工业大学;2010年
中国硕士学位论文全文数据库 前10条
1 葛丽;粗糙集在海量科学数据挖掘中的应用[D];电子科技大学;2005年
2 魏悦亮;粗糙集在数据挖掘不确定性问题中的研究[D];中国石油大学;2010年
3 王鹏;基于邻域粗糙集的属性约简算法研究[D];河北科技大学;2011年
4 任宏旺;基于粗糙集的数据挖掘模型的研究与应用[D];大连海事大学;2003年
5 李楠;基于邻域粗糙集的属性约简算法研究[D];陕西师范大学;2011年
6 于兴网;粗糙集属性约简算法在数据挖掘中的研究[D];重庆大学;2004年
7 杨柳;基于粗糙集的数据挖掘技术研究及其在智能软件中的实现[D];电子科技大学;2004年
8 梁蒙;基于粗糙集的属性约简算法研究[D];河南大学;2011年
9 陈展雄;基于多种群免疫量子粒子群的粗糙集属性约简与故障诊断[D];华东理工大学;2011年
10 李祝平;扩展粗糙集模型及其属性约简算法的研究[D];太原理工大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026