收藏本站
《哈尔滨工业大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

不确定序列模式发现与查询算法的研究

苗东菁  
【摘要】:随着数据采集、处理、预测等技术的不断进步,不确定序列数据普遍存在于科学、通信、物流、金融等领域的具体应用中。本文首先关注于一般形式的事务序列数据库中的频繁模式挖掘问题;其次,针对具体的局部相关性不确定数据库,我们研究了其快照序列上处理最近邻模式查询的算法。一个很重要的方面是在不确定序列数据中挖掘未知的序列模式从而将很多的有价值的信息提供给用户。某些序列模式会很有可能包含先前人们未知的有价值的规则。相比于确定序列数据库,不确定序列数据库中挖掘序列模式更加复杂,其通常有着更大的搜索空间。由于数据的不同,已知的目前被广泛应用的基于模式扩展的挖掘方法也不能够直接用来解决不确定序列模式挖掘问题。本文也提出了一种新颖的定义在不确定数据库的快照序列上的概率频繁近邻查询,目的是在快照序列上找到以一定概率频繁成为查询模式最近邻的那些对象。然而由于在局部相关性不确定数据库快照序列中处理概率频繁最近邻查询时,应用现有的基于传统数据和基于不确定数据上的近邻查询算法直接处理这种查询必须面对巨大的搜索空间和访问条件概率表的大量时间开销。针对第一方面问题,本文提出了多项式时间的快速ETP算法来处理不确定序列挖掘,以及相应的剪枝策略。其次,为了很好的解决第二方面问题,我们提出了针对概率频繁最近邻查询的一般的处理框架,及其相应的过滤方法。我们在人工的和真实的数据上都进行了充分的实验,并验证了给出的算法的有效性。
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:TP311.13

【共引文献】
中国期刊全文数据库 前10条
1 马帅,唐世渭,杨冬青,王腾蛟,高军;移动环境中的最大移动序列模式挖掘(英文)[J];北京大学学报(自然科学版);2004年03期
2 黄金;;基于频繁模式的蛋白质序列分类[J];东北农业大学学报;2008年05期
3 任家东;宗俊省;;一种基于规则表达式约束的序列模式增量式挖掘算法[J];燕山大学学报;2007年05期
4 任家东;周晓磊;;一种挖掘序列模式的增量式更新算法[J];燕山大学学报;2007年06期
5 龚振志;胡孔法;达庆利;张长海;;DMGSP:一种快速分布式全局序列模式挖掘算法[J];东南大学学报(自然科学版);2007年04期
6 胡孔法;张长海;陈崚;达庆利;;一种面向物流数据分析的路径序列挖掘算法ImGSP[J];东南大学学报(自然科学版);2008年06期
7 陈景强;翁正秋;;一种基于投影数据库的SPAM算法[J];电脑知识与技术;2010年07期
8 柴思跃;苏奋振;周成虎;;基于周期表的时空关联规则挖掘方法与实验[J];地球信息科学学报;2011年04期
9 殷脂;殷卫红;;DNA序列数据分析技术综述[J];上海电力学院学报;2011年04期
10 张长海;胡孔法;陈崚;宋爱波;;一种高效的基于位图序列模式挖掘算法[J];高技术通讯;2010年02期
中国重要会议论文全文数据库 前10条
1 姚伟力;王锡禄;宋俊德;;基于序列模式挖掘的告警相关性分析算法[A];2005年信息与通信领域博士后学术会议论文集[C];2005年
2 潘瑾;严勇;王晨;方晨;汪卫;施伯乐;;Chopper:一个高效的有序标号树频繁结构的挖掘算法[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年
3 吴先荣;杨冬青;唐世渭;王腾蛟;;基于序列树的告警相关性分析[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
4 吕静;陈未如;刘俊;Osei Adjei;;并发分支模式挖掘[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
5 吴铁峰;彭宏;张东娜;;一种网络告警的增量挖掘算法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
6 朱永泰;王晨;洪铭胜;汪卫;施伯乐;;ESPM——频繁子树挖掘算法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
7 牛兴雯;杨冬青;唐世渭;王腾蛟;;OSAF-tree——可迭代的移动序列模式挖掘及增量更新方法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
8 程银波;司菁菁;;带有间隔约束的序列模式挖掘算法[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
9 张锐;熊赟;陈越;朱扬勇;;MS-BioSM:一个基于多支持度生物序列模式挖掘算法[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
10 郭黎敏;丁治明;胡泽林;陈超;;基于路网的不确定性轨迹预测[A];第26届中国数据库学术会议论文集(A辑)[C];2009年
中国博士学位论文全文数据库 前10条
1 叶红云;面向金融营销问题的个性化推荐方法研究[D];合肥工业大学;2011年
2 朱辉生;基于情节规则匹配的数据流预测研究[D];复旦大学;2011年
3 林冠洲;网络流量识别关键技术研究[D];北京邮电大学;2011年
4 郑林江;基于智能对象的混流装配线敏捷生产管理技术研究[D];重庆大学;2010年
5 刘维;生物序列模式挖掘与识别算法的研究[D];南京航空航天大学;2010年
6 杨钤雯;序列模式挖掘方法及Web使用挖掘研究[D];天津大学;2010年
7 佘春东;数据挖掘算法分析及其并行模式研究[D];电子科技大学;2004年
8 马海兵;频繁模式挖掘相关技术研究[D];复旦大学;2005年
9 宋世杰;基于序列模式挖掘的误用入侵检测系统及其关键技术研究[D];国防科学技术大学;2005年
10 王进;基于本体的语义信息检索研究[D];中国科学技术大学;2006年
中国硕士学位论文全文数据库 前10条
1 任芳;时间序列数据挖掘研究[D];辽宁师范大学;2010年
2 吴凌琴;挖掘概率频繁模式恢复不确定RFID数据流[D];江西财经大学;2010年
3 陈晶;基于序列模式挖掘算法的入侵检测研究[D];华东师范大学;2011年
4 白霜;DNA序列的最大频繁模式挖掘[D];南昌大学;2010年
5 徐海兰;Web日志挖掘技术在个性化信息推荐中的应用[D];延边大学;2009年
6 严兆斌;序列模式挖掘在公路隧道交通中的应用研究[D];西安电子科技大学;2009年
7 李瑞华;数据挖掘在煤矿安全监测中的应用[D];西安电子科技大学;2010年
8 高磊;大规模铝电解日报数据中序列模式挖掘及其规则提取的研究[D];北方工业大学;2011年
9 董严冰;旅游信息数据挖掘和流量模型的研究[D];北方工业大学;2011年
10 翁玉霞;局域网环境下智能考试系统的设计与实现[D];河北科技大学;2010年
【相似文献】
中国期刊全文数据库 前10条
1 王兴鹏,沙金;利用Apriori算法进行序列模式挖掘[J];现代计算机;2002年10期
2 邹翔,张巍,蔡庆生,王清毅;大型数据库中的高效序列模式增量式更新算法[J];南京大学学报(自然科学版);2003年02期
3 吴卫华,袁宁;基于序列模式的关联规则Apriori算法的研究与优化[J];山东机械;2003年05期
4 宋世杰,胡华平,胡笑蕾;关联规则和序列模式算法在入侵检测系统中的应用[J];成都信息工程学院学报;2004年01期
5 王红侠;胡学钢;;基于可信度约束的序列模式发现研究[J];淮北煤炭师范学院学报(自然科学版);2008年01期
6 杨学兵,刘胜军,蔡庆生;一种实时过程控制中的数据挖掘算法研究[J];计算机应用;1999年09期
7 贺桂娇;;一种改进的序列模式挖掘算法[J];电脑知识与技术;2008年S1期
8 马传香;李庆华;简钟;;MAXSeq:一个新的最大频繁序列挖掘算法[J];小型微型计算机系统;2006年06期
9 谢清森;杨天奇;;改进的PrefixSpan算法在Web挖掘中的应用[J];科学技术与工程;2009年23期
10 胡笑蕾,胡华平,宋世杰;数据挖掘算法在入侵检测系统中的应用[J];计算机应用研究;2004年07期
中国重要会议论文全文数据库 前10条
1 童咏昕;张媛媛;袁玫;马世龙;于丹;赵莉;;一种挖掘压缩序列模式的有效算法[A];第26届中国数据库学术会议论文集(A辑)[C];2009年
2 周常恩;谢伙生;白清源;谢丽聪;张莹;;挖掘邻近序列模式的一个高效算法[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
3 丁祥武;;序列模式的可信度[A];第十六届全国数据库学术会议论文集[C];1999年
4 程银波;司菁菁;;带有间隔约束的序列模式挖掘算法[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
5 张琪;朱秋云;朱绍文;姬朝阳;魏苑琦;陈亮;;对一种序列模式的增量式算法的改进[A];2005年中国智能自动化会议论文集[C];2005年
6 朱扬勇;郭德培;施伯乐;;数据库中序列模式的增量数据采矿技术[A];数据库研究进展97——第十四届全国数据库学术会议论文集(上)[C];1997年
7 赵桦;曲飞;;序列模式挖掘算法在Web挖掘上的应用[A];全国第十届企业信息化与工业工程学术年会论文集[C];2006年
8 姚伟力;王锡禄;宋俊德;;基于序列模式挖掘的告警相关性分析算法[A];2005年信息与通信领域博士后学术会议论文集[C];2005年
9 丁有伟;胡孔法;陈崚;;一种RFID位置序列挖掘方法[A];2008年全国开放式分布与并行计算机学术会议论文集(上册)[C];2008年
10 樊世燕;彭玉清;贾莲;;关于广播收听调查领域中数据处理问题的研究[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
中国重要报纸全文数据库 前10条
1 蔡建生;跨国公司为什么会“出事”?[N];中国经营报;2004年
2 邬建荣;上海双菱“智能”集中客户数据[N];计算机世界;2004年
3 张立明;数据挖掘之道[N];网络世界;2003年
4 ;智能决策为企业导航[N];计算机世界;2001年
5 本报记者 姚琳;科学与追求相伴[N];广西日报;2011年
6 本报记者 蒋建科;破解天书惠人间[N];人民日报;2002年
7 本报特约撰稿人 陈丹;“哈勃”为观察宇宙打开一扇新窗口[N];大众科技报;2002年
8 许铁男;要拿金钱“赌”明天[N];医药经济报;2001年
9 何冰 辛专 ;湖南平江仍有私塾[N];北京日报;2003年
10 EVOLVE;生物信息学和化学信息学双剑合壁造新药[N];中国高新技术产业导报;2002年
中国博士学位论文全文数据库 前10条
1 汤春蕾;交易序列数据挖掘研究[D];复旦大学;2011年
2 佘春东;数据挖掘算法分析及其并行模式研究[D];电子科技大学;2004年
3 徐敏;基于数据挖掘的Web信息检索研究[D];南京航空航天大学;2006年
4 荆涛;面向领域网页的语义标注若干问题研究[D];吉林大学;2011年
5 佟强;科学数据网格中数据挖掘技术研究[D];中国科学院研究生院(计算技术研究所);2006年
6 孙冬璞;时空数据库多类型最近邻查询的研究[D];哈尔滨理工大学;2010年
7 贾哲;分布式环境中信息挖掘与隐私保护相关技术研究[D];北京邮电大学;2012年
8 李艳红;路网中移动对象最近邻及反向最近邻查询处理研究[D];华中科技大学;2011年
9 郑家顺;转录因子结合位点和组合调控模式的研究[D];清华大学;2005年
10 张榛楠;面向电子商务的Web使用挖掘关键技术研究[D];中国矿业大学(北京);2009年
中国硕士学位论文全文数据库 前10条
1 苗东菁;不确定序列模式发现与查询算法的研究[D];哈尔滨工业大学;2011年
2 孟霞;泛在网络中情景感知业务的实现及用户移动序列模式研究[D];北京邮电大学;2010年
3 李明月;基于约束的闭序列模式挖掘算法的研究[D];燕山大学;2012年
4 伯明超;基于序列模式的Web挖掘的研究[D];长春理工大学;2012年
5 王伟娜;基于投影位置的序列模式挖掘算法研究与应用[D];广西大学;2012年
6 杨天霞;基于序列模式的序列聚类挖掘算法研究[D];西北师范大学;2010年
7 公伟;序列模式挖掘算法及其在云取证中的应用研究[D];山东师范大学;2012年
8 王晓雪;基于Web日志的序列模式挖掘算法的研究[D];东北师范大学;2010年
9 丁哲;迭代闭序列模式挖掘算法及其在软件可信性分析中的应用研究[D];兰州大学;2012年
10 王鹏;基于位置的社会网络关系判别模型研究[D];北京交通大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026