收藏本站
《浙江大学》 2007年
收藏 | 手机打开
二维码
手机客户端打开本文

基于偏序的频繁序列模式压缩算法研究

但红卫  
【摘要】: 伴随计算机应用的普及,特别是网络技术的高速发展,人们利用信息技术产生和搜集数据的能力大幅度提高,而现实世界中的数据也是越来越丰富,从大量的数据中提取知识也变得越来越困难。数据挖掘的发展大大的方便了知识的提取,但随着计算处理速度的提高,目前很多数据挖掘问题的研究瓶颈已不是在数据挖掘的效率,而是在挖掘的模式的质量上。 频繁模式挖掘是数据挖掘中的一项很关键的技术,为了提高频繁模式挖掘的质量,本文针对序列模式的特点,提出了基于偏序的频繁序列模式压缩算法ApproxPO(Towards Frequent Sequential Pattern Mining Compression Using Approximate Partial Order)。它以频繁序列模式为输入,可视化的偏序为输出。算法充分利用了序列之间的关联性和偏序在知识表达上的优越性,使得算法不但能够对序列模式进行精简,而且能够方便的分析所得到的挖掘结果。它主要包括如下的几个步骤: ·数据预备:生成,清理实验数据,使所得数据能够被算法所直接使用,本文一共对三种数据进行了清理。 ·距离定义:本文根据序列模式和偏序的特点,提出了三种序列模式间的距离,并对它们进行相关的比较和测试。 ·模式总结:以常用的k-中心聚类和层次聚类的方法为基础对模式进行了总结。 ·近似偏序生成:提出了近似偏序的概念,说明了生成近似偏序的过程,并对部分的近似偏序挖掘实例进行了分析 ·效果评估:定义了时间效率的评估和质量的评估方法,并将算法在多个的数据集上进行了实验,对所得的实验结果进行了分析。
【学位授予单位】:浙江大学
【学位级别】:硕士
【学位授予年份】:2007
【分类号】:TP301.6

手机知网App
【引证文献】
中国期刊全文数据库 前1条
1 逄玉俊;刘英;陈未如;;基于并发序列模式的偏序模式挖掘[J];沈阳化工大学学报;2011年04期
中国硕士学位论文全文数据库 前1条
1 李剑峰;基于数据仓库的新农合管理系统研究[D];浙江工业大学;2012年
【参考文献】
中国期刊全文数据库 前1条
1 刘君强,孙晓莹,庄越挺,潘云鹤;挖掘闭合模式的高性能算法[J];软件学报;2004年01期
【共引文献】
中国期刊全文数据库 前10条
1 郇正军;赵国富;;基于土地利用的空间数据挖掘系统的设计与实现[J];安徽农业科学;2011年07期
2 卢宏建;高永涛;吴顺川;潘贵豪;;石人沟铁矿露天转地下开采生产规模优化[J];北京科技大学学报;2008年09期
3 李侃,刘玉树;Mercer Kernel Based Fuzzy Clustering Self-Adaptive Algorithm[J];Journal of Beijing Institute of Technology(English Edition);2004年04期
4 雷筱珍;赖万钦;;一种基于URL路径的页面用户聚类方法[J];长春工程学院学报(自然科学版);2009年02期
5 董辉;方晓;方跃胜;;一种时序关联规则挖掘算法的研究与实现[J];长春工程学院学报(自然科学版);2012年01期
6 王立锟;王君;;流数据聚类中多属性的计算[J];重庆工学院学报(自然科学版);2009年06期
7 陈庆枝;陈国龙;郭文忠;陈仕涛;;信息安全评估日志数据的一种混合聚类算法[J];重庆工学院学报(自然科学版);2009年10期
8 韩晓慧;王联国;;一种基于改进混合蛙跳的聚类算法[J];传感器与微系统;2012年04期
9 潘怡;杜红燕;;数据流频繁闭项集挖掘研究[J];长沙大学学报;2010年05期
10 王宇,杨莉;模糊k-prototypes聚类算法的一种改进算法[J];大连理工大学学报;2003年06期
中国重要会议论文全文数据库 前10条
1 ;Incremental Clustering for Categorical Data Using Clustering Ensemble[A];第二十九届中国控制会议论文集[C];2010年
2 杨晓霞;朱庆;李海峰;;知识导航的遥感信息处理服务分类选择方法[A];中国测绘学会第九次全国会员代表大会暨学会成立50周年纪念大会论文集[C];2009年
3 单莘;;一种网络告警的增量式情景规则挖掘方法[A];中国通信学会第五届学术年会论文集[C];2008年
4 武森;张桂琼;王莹;吴玲玉;;容差集合差异度高维不完备数据聚类[A];第十二届中国管理科学学术年会论文集[C];2010年
5 钱卫宁;钱海蕾;周傲英;;聚类树合并——聚类超大规模数据库[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
6 王家耀;张雪萍;;基于遗传算法和K-均值算法相结合的空间聚类分析[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
7 ;Mining Cluster-Defining Actionable Rules[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
8 吴书;姜青山;董槐林;林景亮;;一种新的类属型数据模糊聚类算法[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
9 于娟;韩建民;郭腾芳;夏赞珠;;基于聚类的高效k-匿名化算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
10 黄国言;王立波;任家东;;一种基于滑动窗口的数据流频繁闭项集挖掘算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
中国博士学位论文全文数据库 前10条
1 张泽宝;空间数据库的索引技术研究[D];哈尔滨工程大学;2009年
2 李彤岩;基于数据挖掘的通信网告警相关性分析研究[D];电子科技大学;2010年
3 李晋江;海量数据点三维重构中一类关键问题研究[D];山东大学;2010年
4 苏晓珂;基于聚类的异常挖掘算法研究[D];东华大学;2010年
5 程文聪;面向大规模网络安全态势分析的时序数据挖掘关键技术研究[D];国防科学技术大学;2010年
6 魏小涛;在线自适应网络异常检测系统模型与相关算法研究[D];北京交通大学;2009年
7 王骏;无监督学习中聚类和阈值分割新方法研究[D];南京理工大学;2011年
8 李宝红;对应分析方法及其在肿瘤学中的应用研究[D];中南大学;2011年
9 朱辉生;基于情节规则匹配的数据流预测研究[D];复旦大学;2011年
10 林冠洲;网络流量识别关键技术研究[D];北京邮电大学;2011年
中国硕士学位论文全文数据库 前10条
1 史文财;省级政务网安全检测系统的设计与实现[D];哈尔滨工程大学;2010年
2 孙丽萍;流形学习算法ISOMAP的改进与实现[D];大连理工大学;2010年
3 姜荣;时间序列的聚类和关联规则挖掘研究[D];辽宁师范大学;2010年
4 刘琼;基于群体智能的聚类算法研究[D];长沙理工大学;2010年
5 李贤;混合属性聚类算法研究[D];长沙理工大学;2010年
6 陈凤萍;寿光人才求职招聘网站中资源检索算法的研究[D];中国海洋大学;2010年
7 冯兴祥;关联规则挖掘在高校招生录取中的应用[D];合肥工业大学;2010年
8 冯岩;基于小脑模型的二级倒立摆控制仿真[D];昆明理工大学;2009年
9 张春炉;LSA与SOM相结合的文本聚类算法应用研究[D];解放军信息工程大学;2010年
10 石华;基于系统文件特征属性分析的计算机取证研究[D];大连交通大学;2010年
【同被引文献】
中国期刊全文数据库 前6条
1 陈永强,胡雷芳;数据挖掘技术在人寿保险CRM系统中的应用研究[J];成组技术与生产现代化;2004年01期
2 王伟辉;耿国华;陈莉;;数据挖掘技术在保险业务中的应用[J];计算机应用与软件;2008年03期
3 田金兰,张素琴,黄刚;用关联规则方法挖掘保险业务数据中的投资风险规则[J];清华大学学报(自然科学版);2001年01期
4 冯玉才,冯剑琳;关联规则的增量式更新算法[J];软件学报;1998年04期
5 张朝晖,陆玉昌,张钹;发掘多值属性的关联规则[J];软件学报;1998年11期
6 戴稳胜,张阿兰,谢邦昌;数据挖掘的方法、流程及应用[J];中国统计;2004年07期
中国博士学位论文全文数据库 前1条
1 韩颖;新型农村合作医疗数据挖掘研究[D];山西医科大学;2009年
中国硕士学位论文全文数据库 前1条
1 曾德胜;数据库中Burst模式挖掘的研究与实现[D];广西师范大学;2006年
【相似文献】
中国期刊全文数据库 前10条
1 庄军;郭平;周杨;周劲;蔡日旭;;路由器日志序列模式挖掘[J];计算机科学;2005年11期
2 庄军;李峰;叶世清;刘侃;何皎;;HIS系统中药物医嘱序列模式挖掘[J];医疗卫生装备;2007年07期
3 张长海;梁国浚;吴磊;;序列模式挖掘在物流中的应用[J];潍坊高等职业教育;2009年01期
4 江伟;陈龙;王国胤;;用户行为异常检测在安全审计系统中的应用[J];计算机应用;2006年07期
5 魏琴;;Web日志挖掘方法的研究[J];制造业自动化;2009年12期
6 潘建生;胡孔法;;基于序列模式挖掘的入侵检测技术研究[J];电脑知识与技术;2009年36期
7 谭小球,徐妙君,张建科;基于改进FP-Tree的Web频繁序列模式挖掘技术[J];浙江海洋学院学报(自然科学版);2005年03期
8 胡孔法;张长海;陈崚;达庆利;;一种面向物流数据分析的路径序列挖掘算法ImGSP[J];东南大学学报(自然科学版);2008年06期
9 王晓锋;;时间序列数据挖掘在医疗领域的应用[J];软件导刊;2011年05期
10 阎娟;;Web使用挖掘技术的研究[J];文教资料;2006年24期
中国重要会议论文全文数据库 前10条
1 马洪杰;曲晓飞;;数据挖掘技术和过程的特点[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
2 戈欣;吴晓芬;许建荣;;数据挖掘技术在放射科医疗管理中的潜在作用[A];2009中华医学会影像技术分会第十七次全国学术大会论文集[C];2009年
3 魏元珍;杨沂凤;;数据挖掘技术及其在数字图书馆中的应用[A];网络信息资源的搜集与应用——全国高校社科信息资料研究会第十次年会论文集[C];2004年
4 肖健;沈彩霞;;浅谈数据挖掘技术现状[A];广西计算机学会2008年年会论文集[C];2008年
5 巩耀亮;邱晓东;孙丽君;李树强;;数据挖掘技术在企业竞争情报系统中的应用研究[A];信息时代——科技情报研究学术论文集(第三辑)[C];2008年
6 王洪锋;;数据挖掘在客户关系管理中的应用研究[A];河南省通信学会2005年学术年会论文集[C];2005年
7 姚小磊;彭清华;;数据挖掘技术在中医眼科应用的设想[A];中华中医药学会第七次眼科学术交流会论文汇编[C];2008年
8 张婧;;数据挖掘技术在进销存系统中的应用[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(下)[C];2006年
9 杨利军;勾学荣;;数据挖掘在移动客户流失预测中的研究和应用[A];2008年中国高校通信类院系学术研讨会论文集(上册)[C];2009年
10 孙义明;曾继东;;数据挖掘技术及其应用[A];全国计算机安全学术交流会论文集(第二十二卷)[C];2007年
中国重要报纸全文数据库 前10条
1 陈晓 山西财经大学教师;数据挖掘技术在高校教学管理中的应用[N];山西经济日报;2010年
2 记者 吕贤如;大力加强数据挖掘技术研究应用[N];光明日报;2006年
3 主持人 李禾;数据挖掘技术如何驱动经济车轮[N];科技日报;2007年
4 首之;数据挖掘并不神秘[N];金融时报;2006年
5 ;IBM公司推出新型数据挖掘技术[N];中国高新技术产业导报;2001年
6 刘红岩、何军;利用数据挖掘技术获得商业智能[N];中国计算机报;2003年
7 山西银行学校 王林芳;数据挖掘在银行业务中的应用[N];山西科技报;2005年
8 任中华;财务数据挖掘六步走[N];中国计算机报;2007年
9 诺达咨询高级咨询顾问 周连升;数据挖掘拓展3G增值空间[N];通信产业报;2007年
10 徐扬;如何从数据中“挤出”效益[N];中国计算机报;2002年
中国博士学位论文全文数据库 前10条
1 许增福;DL环境下的信息资源管理及知识发现研究[D];哈尔滨工程大学;2005年
2 庞淑英;三江并流带旅游地质景观数据挖掘及旅游价值评价研究[D];昆明理工大学;2008年
3 赵晨;过程控制中的数据挖掘技术研究及其智能控制策略探讨[D];浙江大学;2005年
4 高清东;复杂供矿条件矿山技术指标整体动态优化系统及应用[D];北京科技大学;2005年
5 李兴;高光谱数据库及数据挖掘研究[D];中国科学院研究生院(遥感应用研究所);2006年
6 王玉峰;变电站瞬态电磁环境及微机保护系统EMC研究[D];大连理工大学;2007年
7 潘海天;数据挖掘技术在聚合过程建模与控制的应用研究[D];浙江大学;2003年
8 程其云;基于数据挖掘的电力短期负荷预测模型及方法的研究[D];重庆大学;2004年
9 束志恒;化学化工数据挖掘技术的研究[D];浙江大学;2005年
10 孙蕾;医学图像智能挖掘关键技术研究[D];西北大学;2005年
中国硕士学位论文全文数据库 前10条
1 但红卫;基于偏序的频繁序列模式压缩算法研究[D];浙江大学;2007年
2 郭跃斌;基于序列模式的正负关联规则挖掘技术[D];山东轻工业学院;2008年
3 刘磊;基于序列模式挖掘的入侵检测算法的研究[D];中国科学技术大学;2009年
4 张圆圆;序列模式发现模型的研究[D];合肥工业大学;2007年
5 李春媚;基于序列模式挖掘的入侵检测研究及应用[D];长沙理工大学;2007年
6 贾宁;基于数据挖掘的软件测试技术研究[D];天津大学;2007年
7 陈景强;序列模式挖掘在Web日志挖掘中应用研究[D];重庆大学;2008年
8 张甲武;序列模式挖掘在软件开发信息库中的应用[D];大连理工大学;2009年
9 王峰;基于数据挖掘的入侵检测系统的设计与实现[D];山东大学;2006年
10 孟宪苹;基于序列模式挖掘的入侵检测系统的研究与实现[D];南京航空航天大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026