概率区间下基于可能世界的空间co-location模式挖掘研究
【摘要】:随着数据采集技术的发展,数据采集系统积累了大量的空间数据,越来越多的学者开始关注空间数据挖掘。空间co-location模式挖掘是空间数据挖掘的一个重要分支,它用于发现空间特征之间的关联关系。在许多现实的应用中,收集到的数据往往是不确定的,通常情况下数据的不确定性会采用概率来描述,并且用一个精确的实数来表达。然而,在一些实际应用当中有时很难得到一个精确的概率值,或者根本得不到精确值,只能得到概率的一个近似估计。由于不精确概率在实际当中经常存在,所以,当用概率来描述数据的不确定性时,概率的不精确性是有必要考虑的。本文针对概率的不精确性,考虑当采用概率区间来描述空间实例的存在不确定时如何挖掘空间co-location模式。
首先,介绍了不确定数据的含义和不精确概率的概念。
其次,介绍了空间co-location模式挖掘的基本概念,并介绍了两个重要的挖掘算法。
第三,对于空间实例的存在不确定,介绍了可能世界模型、模式的频繁概率以及概率频繁co-locarion模式的概念。
第四,针对采用概率区间来描述实例的存在不确定的情况,把可能世界模型扩展到概率区间下。对于得到的所有可能世界的概率区间集,证明了它是合理的、可行的,并在此基础上通过转化的方式将可能世界的概率区间转化为点概率。以点概率为测度定义了模式的频繁点概率,提出了概率区间下挖掘概率频繁co-location模式的算法。针对算法的指数级时间复杂度讨论了优化策略,并提出了有效的改进算法。
第五,通过对模拟数据和实际数据的大量实验说明了概率区间下挖掘概率频繁模式的算法的有效性以及实用价值。
最后,对本文的主要内容进行了总结与展望。
|
|
|
|
1 |
梁伟;张慧颖;;电子商务推荐系统中推荐模型的研究[J];计算机工程与应用;2006年36期 |
2 |
贾丙静;陈兴梅;赵生艳;贺文娟;;基于远程教育网的Web日志挖掘研究[J];农业网络信息;2011年04期 |
3 |
端义锋,胡谷雨,丁力;序列模式挖掘在网络告警分析中的应用[J];北京邮电大学学报;2004年S2期 |
4 |
赵文文;吴坚;陈波;;数据挖掘中的频繁模式发现[J];萍乡高等专科学校学报;2005年04期 |
5 |
谢晶;;基于关联规则发现的Web访问模式挖掘[J];天津科技;2009年04期 |
6 |
原娇杰;赵杰文;;基于Web的数据挖掘[J];软件导刊;2006年19期 |
7 |
吴修琴;;基于Web使用挖掘的个性化服务推荐[J];河北科技图苑;2007年03期 |
8 |
郭顺;姜青山;王备战;史亮;;一种新的蛋白质序列模式挖掘算法[J];计算机工程;2009年08期 |
9 |
王宇新;田佳;郭禾;吴树朋;杨元生;;应用模糊方法的设计模式挖掘策略研究[J];计算机工程与应用;2010年02期 |
10 |
何兵,陶宏才,强晓焕;WEB使用记录挖掘研究[J];广西师范学院学报(自然科学版);2003年04期 |
11 |
罗程;钟诚;李智;;网络入侵检测系统中无导师学习分析器的设计[J];计算机工程与科学;2006年07期 |
12 |
胡燕;韩瑞雪;;基于Top-K项频繁模式挖掘的研究及实现[J];计算机与数字工程;2009年04期 |
13 |
申展,江宝林,唐磊,胡运发;基于互关联后继树的频繁模式挖掘研究[J];计算机工程;2004年21期 |
14 |
张海清;刘胤田;;最大亚频繁模式挖掘算法研究[J];计算机工程;2011年14期 |
15 |
汪卫,周皓峰,袁晴晴,楼宇波,施伯乐;基于图论的频繁模式挖掘[J];计算机研究与发展;2005年02期 |
16 |
颜镝,宋苏;状态演化模式挖掘在交通流预测中的应用[J];计算机应用;2005年03期 |
17 |
王卉,李庆华,马传香,李肯立;频繁模式挖掘中的剪枝策略[J];计算机工程与科学;2003年04期 |
18 |
姜传菊;试论Web中的数据挖掘[J];现代图书情报技术;2003年S1期 |
19 |
庞韶宁,李介谷,杨杰;模式挖掘中的知识条纹表示过程研究[J];自动化学报;2001年01期 |
20 |
吴共庆,陈恩红,王舒,王煦法;基于最右扩展枚举的半结构化数据最大模式挖掘方法研究[J];小型微型计算机系统;2004年09期 |
|