收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于聚类的匿名化隐私保护技术研究

王平水  
【摘要】:随着数据库技术与互联网的飞速发展,越来越多的数据被人们收集、发布和使用,这些数据中可能包含了个体的隐私信息,因此,如何在数据的发布和使用中保护个体隐私成为学术界和工业界研究的热点问题。 匿名化是解决数据发布中隐私泄露问题的主要技术之一,其基本思想是通过对准标识符属性执行泛化/隐匿操作发布精度较低但语义一致的数据,以实现隐私保护。 自从Sweeney等提出k-匿名模型以来,由于匿名化技术能够简单有效地对发布的数据实现隐私保护,近年来得到研究者的广泛关注。由于最优数据匿名化问题是NP难问题,围绕如何提高发布数据的隐私保护程度、降低匿名化隐私保护的信息损失,已有多种启发式的k-匿名方法被提了出来。然而,这些数据匿名化方法主要是对准标识符执行泛化/隐匿操作,并未对敏感属性做任何约束,容易受到同质性攻击和背景知识攻击。为此,Machanavajjhala等在k-匿名的基础上,提出了l-多样性匿名模型,考虑了等价类中敏感属性值的多样性问题,要求同一个等价类中至少有l个“表现较好”的敏感属性值,进一步提高了匿名数据的隐私保护程度。 研究表明:目前多数匿名化方法是基于泛化/隐匿技术的,由于其严重依赖于预先定义的泛化层或属性域上的序关系,使得匿名结果产生很高的信息损失,从而降低了发布数据的可用性;而且,现有匿名化技术重在对隐私信息的保护,却忽视了匿名数据的实际效用,导致匿名数据的可用性不高。本文的研究内容是设计基于聚类的匿名化隐私保护算法,主要涉及到匿名数据的隐私性、信息损失和可用性等方面的研究。希望在保护个体隐私的同时,最大限度地减少信息损失,提高匿名数据的实际效用,达到个体隐私保护与数据效用之间的合理平衡。本文的主要研究工作和创新点如下: (1)针对现有k-匿名算法对离群点敏感、信息损失较高等问题,提出了一种基于聚类的k-匿名改进算法。理论分析及实验结果表明,该算法通过“一次”聚类过程产生等价类,能够有效解决离群点敏感的问题,减少k-匿名数据的信息损失,提高发布数据的质量。 (2)针对泛化/隐匿技术对l-多样性匿名数据质量的影响,提出了一种基于聚类的l-多样性匿名算法,该算法可减少信息损失,但存在偏斜性攻击问题,为此,又提出一种改进的基于敏感值约束的l-多样性匿名算法。理论分析及实验结果表明,改进后的算法不仅提高了敏感数据的隐私保护程度,而且能够有效减少l-多样性匿名数据的信息损失,提高发布数据的质量。 (3)针对动态更新数据集匿名数据发布时存在的推理攻击问题,提出一种基于增量聚类的l-多样性匿名算法。理论分析及实验结果表明,该算法通过保持等价类签名不变以实现“完全”动态更新数据集的安全数据发布,具有较高的执行效率。 (4)针对发布的匿名数据实际效用低下问题,通过构建准标识符属性对敏感属性的效用影响矩阵,提出了一种面向数据分类应用的l-多样性匿名算法。理论分析及实验结果表明,该算法在保护个体隐私的同时,能够较好地满足数据分类的应用需求。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 葛伟平;汪卫;周皓峰;施伯乐;;基于隐私保护的分类挖掘[J];计算机研究与发展;2006年01期
2 闻丹岩;夏国平;;电子商务中的不可否认和隐私保护协议[J];北京工业大学学报;2007年06期
3 沈中林;崔建国;;隐私保护下关联规则挖掘方法[J];中国民航大学学报;2007年S1期
4 魏琼;卢炎生;;位置隐私保护技术研究进展[J];计算机科学;2008年09期
5 刘恒;王铁军;周明天;佘堃;;普适环境中基于角色的隐私保护系统设计[J];微电子学与计算机;2010年12期
6 许大宏;;基于隐私保护关联规则的改进算法[J];福建电脑;2010年12期
7 王平水;王建东;;匿名化隐私保护技术研究综述[J];小型微型计算机系统;2011年02期
8 王艳;;数据隐私保护技术综述[J];知识经济;2011年14期
9 宋金玲;刘国华;黄立明;李玉香;贺礼智;王丹丽;;k-匿名隐私保护模型中k值的优化选择算法[J];小型微型计算机系统;2011年10期
10 霍峥;孟小峰;;轨迹隐私保护技术研究[J];计算机学报;2011年10期
11 王平水;马钦娟;;隐私保护k-匿名算法研究[J];计算机工程与应用;2011年28期
12 张蕊;瞿彬彬;张吉昕;;社会网络数据的三级隐私保护发布算法研究[J];计算机科学;2012年04期
13 姜文广;孙宇清;;面向第三方服务平台的隐私保护[J];兰州大学学报(自然科学版);2012年04期
14 马进;金茂菁;杨永丽;张健;;基于序列模式挖掘的隐私保护多步攻击关联算法[J];清华大学学报(自然科学版);2012年10期
15 李晓会;何泾沙;张婷;;云计算中基于信任和信号理论的隐私保护方法[J];华中科技大学学报(自然科学版);2012年S1期
16 刘杰;徐一凤;张健沛;杨静;;面向隐私保护聚类的平面反射数据扰动方法[J];计算机工程与应用;2013年06期
17 闵二龙;陈震;陈睿;许宏峰;;内容中心网络的隐私问题研究[J];信息网络安全;2013年02期
18 李欲晓;;云计算大数据时代个人隐私保护刻不容缓[J];理论导报;2013年07期
19 冯钢;王芳;;美国消费者隐私保护政策[J];网络安全技术与应用;2013年06期
20 毛岱波;李琦;杨芫;;以信息为中心网络的隐私保护研究[J];网络新媒体技术;2013年04期
中国重要会议论文全文数据库 前10条
1 郑思琳;陈红;叶运莉;;实习护士病人隐私保护意识和行为调查分析[A];中华护理学会第8届全国造口、伤口、失禁护理学术交流会议、全国外科护理学术交流会议、全国神经内、外科护理学术交流会议论文汇编[C];2011年
2 孙通源;;基于局部聚类和杂度增益的数据信息隐私保护方法探讨[A];中国水利学会2013学术年会论文集——S4水利信息化建设与管理[C];2013年
3 张亚维;朱智武;叶晓俊;;数据空间隐私保护平台的设计[A];第二十五届中国数据库学术会议论文集(一)[C];2008年
4 公伟;隗玉凯;王庆升;胡鑫磊;李换双;;美国隐私保护标准及隐私保护控制思路研究[A];2013年度标准化学术研究论文集[C];2013年
5 张鹏;于波;童云海;唐世渭;;基于随机响应的隐私保护关联规则挖掘[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
6 桂琼;程小辉;;一种隐私保护的分布式关联规则挖掘方法[A];2009年全国开放式分布与并行计算机学术会议论文集(下册)[C];2009年
7 俞笛;徐向阳;解庆春;刘寅;;基于保序加密的隐私保护挖掘算法[A];第八届全国信息隐藏与多媒体安全学术大会湖南省计算机学会第十一届学术年会论文集[C];2009年
8 李贝贝;乐嘉锦;;分布式环境下的隐私保护关联规则挖掘[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
9 徐振龙;郭崇慧;;隐私保护数据挖掘研究的简要综述[A];第七届(2012)中国管理学年会商务智能分会场论文集(选编)[C];2012年
10 潘晓;郝兴;孟小峰;;基于位置服务中的连续查询隐私保护研究[A];第26届中国数据库学术会议论文集(A辑)[C];2009年
中国博士学位论文全文数据库 前10条
1 张坤;面向多租户应用的云数据隐私保护机制研究[D];山东大学;2012年
2 任毅;可信数据库中的隐私保护技术研究[D];武汉大学;2011年
3 杨涛;基于代理签名的车辆自组网的隐私保护研究[D];北京大学;2013年
4 谈嵘;位置隐私保护及其在基于位置的社交网络服务中的应用研究[D];华东师范大学;2013年
5 孙一品;车载自组网隐私保护关键技术研究[D];国防科学技术大学;2010年
6 张浩;基于位置服务的信息隐私保护技术研究[D];中国科学技术大学;2014年
7 侯士江;基于空间k-匿名的位置隐私保护技术研究[D];燕山大学;2014年
8 何贤芒;隐私保护中k-匿名算法和匿名技术研究[D];复旦大学;2011年
9 宋金玲;K-匿名隐私保护模型中与匿名数据相关的关键问题研究[D];燕山大学;2012年
10 刘华玲;基于完备空间数据扰动的隐私保护理论方法研究及应用[D];东华大学;2013年
中国硕士学位论文全文数据库 前10条
1 孔庆江;社交网络中个人信息与人际关系的隐私保护研究[D];浙江工业大学;2011年
2 姜文广;面向第三方平台的个性化隐私保护研究[D];山东大学;2013年
3 杨典辉;基于启发式分析的大规模社会网络隐私保护[D];电子科技大学;2013年
4 于金英;基于动态数据发布的隐私保护研究[D];北京工业大学;2013年
5 刘小猛;含多敏感属性数据重发布的隐私保护技术研究[D];西安电子科技大学;2013年
6 杨光;隐私保护数据查询系统的研究与实现[D];北京交通大学;2008年
7 王璞;面向实时数据流的匿名化隐私保护发布技术研究[D];苏州大学;2011年
8 何康;基于物联网的个性化k-匿名位置隐私保护技术的研究和实现[D];南京邮电大学;2012年
9 张强;面向隐私保护的医疗信息系统设计与实现[D];北京交通大学;2012年
10 肖燕芳;基于匿名区域变换的位置隐私保护模型与算法研究[D];华南理工大学;2012年
中国重要报纸全文数据库 前10条
1 王尔山;跟隐私说再见[N];21世纪经济报道;2008年
2 记者 武晓黎;360安全浏览器推“隐私浏览”模式[N];中国消费者报;2008年
3 早报记者 是冬冬;“美国隐私保护法律已过时”[N];东方早报;2012年
4 张晓明;隐私的两难[N];电脑报;2013年
5 本报实习生 张月朦 本报记者 董晨;大数据时代,谁来保护我们的隐私[N];新华日报;2013年
6 本报记者 邹大斌;隐私保护,老问题再添新忧[N];计算机世界;2013年
7 本报记者 赵越;苹果再陷“定位门”风波 隐私保护成厂商绕不过的坎[N];通信信息报;2014年
8 记者 马意翀 陆立军;大数据时代还有隐私吗[N];新华每日电讯;2014年
9 广西大学法学院院长、教授 张军;隐私中的道德与道德的隐私[N];北京日报;2009年
10 本报记者 王彦彬;互联网创新不忘隐私保护[N];通信产业报;2012年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978