数据流中频繁项集挖掘算法及其应用研究
【摘要】:
数据流研究是目前一个新兴的热门领域,国内外学者提出了各种数据流处理的技术、算法和具体应用。和传统静态数据库中的数据不同的是,数据流是连续的、无限的、高速的、数据分布随着时间而改变的数据序列。数据流频繁项集挖掘是数据流挖掘领域的基本问题之一,已经引起国内外研究者的广泛关注,提出了许多有效的数据流频繁项集挖掘算法。
针对数据流的特点,论文对数据流处理模型和数据流挖掘中的关键问题做了介绍,对当前的一些数据流频繁项集挖掘算法进行了分析,比较和总结。
本文在此基础上,提出了一种实时的挖掘数据流近似频繁项的算法(NEC算法)和基于滑动窗口的数据流频繁项集挖掘算法(SWFPT-Miner算法)。NEC算法在允许的偏差范围内,能有效地挖掘数据流中的所有频繁项。在有限的存储空间和及时处理数据流的前提下,降低了数据项的最坏处理时间,满足在线实时分析处理要求,提高了输出结果的精确率。理论分析和实验验证了这种方法的有效性。SWFPT-Miner算法采用分段的思想,逐段挖掘频繁项集,通过挖掘局部频繁项集,可以有效地挖掘所有的频繁项集。通过滑动窗口技术,可以快速获取最近一个时期内的频繁项集。分析和实验表明算法有较好的性能。
最后,在研究数据流频繁项挖掘的基础上,实现了一个基于数据流挖掘的网站排名应用系统。
|
|
|
|
1 |
刘学军;徐宏炳;董逸生;钱江波;王永利;;基于滑动窗口的数据流闭合频繁模式的挖掘[J];计算机研究与发展;2006年10期 |
2 |
张健沛;杨悦;刘卓;;一种新的关联规则增量式挖掘算法[J];计算机工程;2006年23期 |
3 |
程转流;胡为成;;数据流频繁模式挖掘技术研究[J];铜陵学院学报;2007年05期 |
4 |
陆楠;李晓林;;基于动态窗口的数据流频繁闭合模式挖掘算法[J];信息与电脑(理论版);2009年10期 |
5 |
朱小栋;黄志球;沈国华;袁敏;;一种基于变尺度滑动窗口的数据流频繁集挖掘算法[J];控制与决策;2009年06期 |
6 |
宁慧;于翔;吴培莲;吴悦;;一种新的入侵检测方法[J];哈尔滨工业大学学报;2008年12期 |
7 |
胡为成;王本年;程转流;;基于DSCFCI_tree的带项目约束的数据流频繁闭合模式挖掘算法[J];中国科学技术大学学报;2009年11期 |
8 |
徐前方;肖波;郭军;;一种基于相关度统计的告警关联规则挖掘算法[J];北京邮电大学学报;2007年01期 |
9 |
王新,王湄生;关联规则挖掘中的关联推理[J];云南民族学院学报(自然科学版);2001年03期 |
10 |
施润身,赵青;改进的关联规则采掘算法及其实现[J];同济大学学报(自然科学版);2002年02期 |
11 |
丁振国,陈静;基于关联规则的个性化推荐系统[J];计算机集成制造系统-CIMS;2003年10期 |
12 |
汪洪涛,刘文才;数据挖掘技术关联规划算法在营销策略中的应用[J];工业控制计算机;2003年09期 |
13 |
田生伟,禹龙;关联规则挖掘在成绩录入、校对系统中的应用[J];微机发展;2003年08期 |
14 |
朱红蕾,李明;维护关联规则的算法研究[J];兰州理工大学学报;2004年05期 |
15 |
朱玉全,宋余庆,陈耿;关联规则挖掘中增量式更新算法的研究[J];计算机工程与应用;2005年15期 |
16 |
雷红艳,邹汉斌;无最小支持度的关联规则挖掘方法[J];湖南文理学院学报(自然科学版);2005年02期 |
17 |
郑玮;;基于Web日志挖掘的关联规则算法研究[J];软件导刊;2008年10期 |
18 |
程继华,施鹏飞;概念指导的关联规则的挖掘[J];计算机研究与发展;1999年09期 |
19 |
倪志伟,蔡庆生;用神经网络来进行数据库中的知识发现(英文)[J];安徽大学学报(自然科学版);2000年03期 |
20 |
王新,李作成;不可约关联规则及其应用[J];计算机应用;2001年07期 |
|