收藏本站
《东华大学》 2013年
收藏 | 手机打开
二维码
手机客户端打开本文

基于泛化树的k-匿名数据集的挖掘算法研究

刘艺龙  
【摘要】:目前,很多机构都以k-匿名的形式来发布数据。k-匿名隐私保护模型也越来越多的应用于各个领域。k-匿名数据是一种特殊的不确定性数据,它的元组泛化成每个可能性世界实例的概率是相等的,并且有k条元组的准标识符都是相同的,外界攻击者很难通过外表的连接来对数据进行攻击,所以k-匿名隐私保护模型能很好的保护用户的隐私。但是也由于它的特殊性,这种数据的可用性也就大大降低了,即使使用了最优化的k-匿名算法,也不可能产生令人满意的完全精确的数据,因此,不仅要在k-匿名算法上来做文章,更亟需找出一种可以对这类数据进行数据挖掘的方法来提高k-匿名数据的可用性。 数据的世系描述了数据的产生及变化的过程,它应用于数据挖掘、数据核查、数据恢复和引用等很多领域。k-匿名数据是由确定值根据相应的泛化树派生出来的,因此,k-匿名数据的世系包含泛化树及派生规则,它描述了静态数据源(即原始表)通过泛化树进行演化,最终得到k-匿名表的过程。通过对k-匿名数据生成过程的分析,每一个k-匿名表都是原始数据表通过特定的泛化树泛化而来的,提出了泛化树的形式化定义,并在这个基础上,从一个数据接收者角度对泛化树做出了分析,提出了泛化树的构造算法,使接收者能够更方便有效的对数据进行挖掘分析工作。 关联规则挖掘算法是数据挖掘中一个基础的、重要的方法,它的目的是在大量数据中发现项集之间的有趣的联系。现在很多研究学者对不确定性数据的关联规则挖掘算法都已经有了一定的研究成果,产生了不少优秀的算法,但是,这些算法往往都是在元组还原成可能世界实例的概率不等的基础上提出的,并不适用于k-匿名这种特殊的不确定性数据,为了解决这个问题,把k-匿名数据的世系应用到挖掘中去,提出了针对k-匿名数据的挖掘算法——基于泛化树的关联规则挖掘算法。它包括了k-项集的期望支持度算法和置信度算法,前者用于找到频繁项集,后者用于产生强关联规则。 该算法与传统的确定或不确定数据的关联规则挖掘算法相比,对于处理k-匿名数据,在时间复杂度上有了极大的改善,提高了挖掘效率。实验结果表明,文中提出的算法是一种有效的处理k-匿名数据集的方法。
【学位授予单位】:东华大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:TP311.13

手机知网App
【相似文献】
中国期刊全文数据库 前10条
1 寇晨艳;郭红;;基因表达数据的频繁模式挖掘算法[J];福州大学学报(自然科学版);2009年02期
2 刘芝怡;;一种新的关联规则挖掘算法[J];电脑知识与技术;2008年18期
3 张磊;夏士雄;周勇;牛强;;具有语义最小支持度的关联规则挖掘方法[J];微电子学与计算机;2008年09期
4 陈子阳,郭景峰;多层次关联规则的快速挖掘算法[J];燕山大学学报;2003年04期
5 陶利民;黄林鹏;;Cherry:一种无须子集检查的闭合频繁集挖掘算法[J];软件学报;2008年02期
6 何中胜,刘宗田;一种无候选集产生的并行关联规则挖掘算法[J];计算机工程与应用;2004年24期
7 朱嘉贤;一个基于散列技术的关联规则挖掘算法[J];肇庆学院学报;2004年05期
8 张海英,浦磊,潘永湘;一种自适应快速关联规则挖掘算法[J];西安理工大学学报;2004年04期
9 程继华,施鹏飞;概念指导的关联规则的挖掘[J];计算机研究与发展;1999年09期
10 成平广;;一种改进的关联规则挖掘算法在自选餐厅的应用研究[J];商场现代化;2008年35期
中国重要会议论文全文数据库 前10条
1 丁艳辉;王洪国;高明;谷建军;;一种基于矩阵的高效关联规则挖掘算法[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
2 沈向余;李伟华;;几种关联规则挖掘算法的分析[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
3 王宁;董淳;胡运发;陶晓鹏;;面向集合的关联规则挖掘算法[A];第十五届全国数据库学术会议论文集[C];1998年
4 韩涛;张春海;;关系数据库中关联规则的高效挖掘算法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
5 张磊;夏士雄;周勇;牛强;;具有语义最小支持度的关联规则挖掘方法[A];2008年全国开放式分布与并行计算机学术会议论文集(上册)[C];2008年
6 柴明亮;李宁宁;宋苏;;平均阈值关联规则挖掘算法[A];2005年中国智能自动化会议论文集[C];2005年
7 周焕银;张永;;关联规则候选项频度规律研究[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
8 方艳;别荣芳;;关联规则的有趣性研究[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
9 李庆忠;张世栋;董国庆;;在数据多维体中进行关联规则的挖掘[A];第十六届全国数据库学术会议论文集[C];1999年
10 潘海为;李建中;张炜;;挖掘脑部医学图像中的关联规则[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
中国重要报纸全文数据库 前10条
1 严宁;挖掘数据寻保险商机[N];网络世界;2007年
2 李国辉 张军 汤义;挖掘技术直面多媒体[N];计算机世界;2002年
3 王培森;从Web挖到竞争情报[N];中国计算机报;2003年
4 南京市地方税务局信息管理处、计算机中心 明靖 朱岚;数据挖潜让业务说话[N];中国计算机报;2006年
5 本报记者 袁跃;点击七彩人生[N];财会信报;2005年
6 王玮 蔡莲红;数据挖掘走入语音处理[N];计算机世界;2001年
7 贵州省移动通信公司 苏思妮;让信息去主动寻找用户[N];通信产业报;2004年
8 中国人民大学数据仓库与商务智能工程研究中心 $$  中国人民大学数据与知识工程研究所王珊、谢佳明、陈红、刘中蔚、邵琦洪、张宁;创建数据仓库:要面向三条路线[N];中国计算机报;2002年
9 主持人 李禾;数据挖掘技术如何驱动经济车轮[N];科技日报;2007年
10 ;选择SIM的十大理由[N];中国计算机报;2008年
中国博士学位论文全文数据库 前10条
1 肖波;可信关联规则挖掘算法研究[D];北京邮电大学;2009年
2 牛成林;增量数据挖掘及其在电站运行优化中的理论研究及应用[D];华北电力大学(北京);2010年
3 王越;分布式关联规则挖掘的方法研究[D];重庆大学;2003年
4 叶小飞;基于自发呈报系统与循证医学的药品不良反应信号挖掘[D];第二军医大学;2011年
5 Vital Delmas MABONZO;大型数据库有效挖掘关联规则新方法研究[D];大连海事大学;2012年
6 伊卫国;基于关联规则与决策树的预测方法研究及其应用[D];大连海事大学;2012年
7 赵春;基于数据挖掘技术的财务风险分析与预警研究[D];北京化工大学;2012年
8 蔡瑞初;基因表达数据挖掘若干关键技术研究[D];华南理工大学;2010年
9 李强;数据挖掘中关联分析算法研究[D];哈尔滨工程大学;2010年
10 温磊;基于有向项集图的关联规则挖掘算法研究与应用[D];天津大学;2004年
中国硕士学位论文全文数据库 前10条
1 路燕;基于时空调节及基于三次遍历的快速关联规则挖掘算法的研究[D];燕山大学;2000年
2 王玉荣;关联规则挖掘算法在大数据集上的应用研究[D];江南大学;2011年
3 曲建华;关联规则挖掘算法研究[D];青岛大学;2003年
4 朱涛;基于FP-growth关联规则挖掘算法的研究与应用[D];南昌大学;2010年
5 朱四红;基于HFUFP-tree的增量挖掘算法研究[D];安徽大学;2010年
6 侯新丽;面向高校招生的录取数据分析系统研究[D];中北大学;2010年
7 刘玉锋;数据挖掘中关联规则算法的研究与应用[D];长春理工大学;2010年
8 赵春胜;基于关联规则的数据挖掘方法在电厂脱硫监测中的应用研究[D];内蒙古大学;2011年
9 王双明;基于XML及关联规则的个性化推荐技术研究[D];重庆大学;2010年
10 王永利;关联规则挖掘算法及其在Web挖掘上应用的研究[D];哈尔滨工程大学;2003年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026