收藏本站
《浙江师范大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

数据发布中隐私保护的匿名模型及算法研究

于娟  
【摘要】: 目前在数据库领域存在着大量的与个体相关的数据,如:人口统计数据、客户购物数据、患者医疗数据等,称之为微数据。这些数据对于趋势分析、市场预测等具有重要的价值。然而,由于这些数据中含有个体的隐私信息,它们的发布和共享会对个体的隐私构成威胁。因此,数据发布中隐私保护问题的研究具有重要的意义。 在数据发布的隐私保护研究中,匿名化方法以其安全、有效成为目前该领域的研究热点。匿名化方法的思想是通过对原始数据进行某种变换,使攻击者无法唯一的推导出敏感信息所属的具体个体,从而实现个体隐私的保护。本文从匿名化模型及算法两个方面,对数据发布中的隐私保护问题进行了研究,主要工作有: (1)提出一个实现k-匿名模型的TopDown-KACA算法。KACA是目前信息损失较小的k-匿名化算法之一,它产生的匿名数据质量高,但效率低,不适合处理大的数据集。Top-down是一个高效的匿名化算法,但产生的信息损失大。本文结合Top-down算法和KACA算法,提出一个高效且信息损失少的TopDown-KACA算法。实验结果表明:所提出的算法可以达到与KACA算法近似的信息损失,与Top-down算法近似的效率,能更高效、更好的实现k-匿名模型。 (2)提出一个实现敏感值个性化隐私保护的匿名模型。现有的匿名模型如:k-匿名模型、l-多样性模型等都是针对整个数据表设置一个全局的匿名化约束,而没有考虑隐私保护的个性化需求。当数据中各个敏感属性值的分布不均匀时,这些模型就不能很好地实现隐私保护。为此,本文提出完全(α,k)-匿名模型,通过为每个敏感值设置不同的频率约束,来实现对敏感值的个性化隐私保护;并基于加权层次距离,提出(α,k)-聚类算法。实验结果表明:完全(α,k)-匿名模型能够有效的实现敏感值的个性化隐私保护。 (3)提出一个面向数值型敏感属性的分级多样性模型。现有的l-多样性模型主要适用于分类型敏感属性的数据,而不适用于数值型敏感属性的数据。为此,本文提出面向数值型敏感属性的分级多样性模型。该模型首先将数值型敏感属性域分级,再基于分级信息实现数值型敏感属性的多样性。本文还设计了实现分级多样性模型的l-Incognito算法。从匿名表的多样度的角度对分级多样性和未分级的多样性进行了比较,实验结果表明:前者产生的匿名数据具有更高的多样度,因而前者具有更强的抵制同质性攻击和背景知识攻击的能力。
【学位授予单位】:浙江师范大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TP309.2

手机知网App
【引证文献】
中国硕士学位论文全文数据库 前3条
1 强小强;基于约束的社会网络随机化方法[D];浙江师范大学;2012年
2 李静;面向含敏感关系社会网络的匿名模型及算法研究[D];浙江师范大学;2012年
3 韩海伟;一种增强型t-Closeness隐私保护方法[D];哈尔滨工程大学;2012年
【参考文献】
中国期刊全文数据库 前6条
1 韩建民;岑婷婷;虞慧群;;数据表k-匿名化的微聚集算法研究[J];电子学报;2008年10期
2 杨晓春;王雅哲;王斌;于戈;;数据发布中面向多敏感属性的隐私保护方法[J];计算机学报;2008年04期
3 Grigorios Loukides;;An Efficient Clustering Algorithm for k-Anonymisation[J];Journal of Computer Science & Technology;2008年02期
4 郭宇红;童云海;唐世渭;杨冬青;;数据库中的知识隐藏[J];软件学报;2007年11期
5 艾春荣;冯帅章;吴玉玲;;微观统计数据的公布及相应的保密方法[J];统计研究;2007年06期
6 燕彩蓉;朱明;史有群;;基于隐私保护的序列模式挖掘[J];小型微型计算机系统;2008年07期
【共引文献】
中国期刊全文数据库 前10条
1 李太勇;唐常杰;吴江;周敏;;基于两次聚类的k-匿名隐私保护[J];吉林大学学报(信息科学版);2009年02期
2 兰丽辉;孙英慧;鞠时光;;社会网络发布中敏感边的隐私保护[J];吉林大学学报(信息科学版);2011年04期
3 刘腾腾;倪巍伟;崇志宏;张勇;;多维数值敏感属性隐私保护数据发布方法[J];东南大学学报(自然科学版);2010年04期
4 韩建民;岑婷婷;虞慧群;;数据表k-匿名化的微聚集算法研究[J];电子学报;2008年10期
5 李光;王亚东;苏小红;;隐私保持的决策树分类挖掘[J];电子学报;2010年01期
6 韩建民;于娟;虞慧群;贾泂;;面向敏感值的个性化隐私保护[J];电子学报;2010年07期
7 杨高明;杨静;张健沛;;聚类的(α,k)-匿名数据发布[J];电子学报;2011年08期
8 李光;王亚东;;一种改进的基于奇异值分解的隐私保持分类挖掘方法[J];电子学报;2012年04期
9 滕金芳;钟诚;;基于匿名方法的数据发布隐私泄露控制技术研究进展[J];广西科学院学报;2009年04期
10 刘洁;;基于茫然第三方的比较相同集合的计算实现[J];信息安全与技术;2012年11期
中国重要会议论文全文数据库 前4条
1 韩建民;岑婷婷;于娟;;实现敏感属性l-多样性的l-MDAV算法[A];第二十七届中国控制会议论文集[C];2008年
2 滕金芳;钟诚;;基于匿名方法的数据发布隐私泄露控制技术进展分析[A];广西计算机学会2009年年会论文集[C];2009年
3 阎玮;柏文阳;张剡;;基于FP-Tree重构事务数据集的关联规则隐藏[A];第二十五届中国数据库学术会议论文集(一)[C];2008年
4 于娟;韩建民;郭腾芳;夏赞珠;;基于聚类的高效k-匿名化算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
中国博士学位论文全文数据库 前10条
1 祁云嵩;微阵列数据分析中的基因选择及样本分类方法研究[D];南京理工大学;2011年
2 王建国;审查回归(Censored Regression)模型的参数、半参数和非参数估计及一致性模型设定检验[D];中国社会科学院研究生院;2011年
3 李光;分类挖掘中的隐私保护问题研究[D];哈尔滨工业大学;2011年
4 骆永成;数字图书馆敏感数据匿名发布若干关键技术研究[D];东华大学;2011年
5 沙朝锋;基于信息论的数据挖掘算法[D];复旦大学;2008年
6 杨维嘉;在数据挖掘中保护隐私信息的研究[D];上海交通大学;2008年
7 张坤;面向多租户应用的云数据隐私保护机制研究[D];山东大学;2012年
8 杨高明;基于聚类的隐私保护数据发布关键技术研究[D];哈尔滨工程大学;2012年
9 任国珍;支持多租户数据隐私保护的数据加密机制研究[D];山东大学;2012年
10 吴宏伟;社会网络数据发布中的隐私匿名技术研究[D];哈尔滨工程大学;2013年
中国硕士学位论文全文数据库 前10条
1 魏晓晖;敏感规则隐藏算法的研究[D];哈尔滨工程大学;2010年
2 张志祥;基于匿名模型的数据发布隐私保护技术研究[D];江苏大学;2010年
3 刘永红;个性化k-匿名模型研究[D];河北工程大学;2011年
4 韩俊瑞;隐私保护的分布式聚类算法研究[D];河北工程大学;2011年
5 肖云;基于Web日志挖掘的聚类算法研究[D];安徽大学;2011年
6 黄灿;数据发布中隐私保护关键技术的研究[D];南京航空航天大学;2010年
7 张立丰;基于动态数据集面向多敏感属性的隐私保护技术研究[D];内蒙古科技大学;2011年
8 李立;面向相关多敏感属性的隐私保护方法[D];河北大学;2011年
9 夏赞珠;微数据发布中的隐私保护匿名化算法研究[D];浙江师范大学;2011年
10 满娜;一种基于K-匿名的隐私保护算法[D];哈尔滨工程大学;2011年
【同被引文献】
中国期刊全文数据库 前10条
1 兰丽辉;孙英慧;鞠时光;;社会网络发布中敏感边的隐私保护[J];吉林大学学报(信息科学版);2011年04期
2 韩建民;岑婷婷;虞慧群;;数据表k-匿名化的微聚集算法研究[J];电子学报;2008年10期
3 王娜;李霞;;基于监督信息特性的主动半监督谱聚类算法[J];电子学报;2010年01期
4 杨高明;杨静;张健沛;;聚类的(α,k)-匿名数据发布[J];电子学报;2011年08期
5 阮晓钢;王金莲;;基于肿瘤基因表达谱的基因功能模块识别[J];北京工业大学学报;2007年04期
6 田铮;李小斌;句彦伟;;谱聚类的扰动分析[J];中国科学(E辑:信息科学);2007年04期
7 韩建民;于娟;虞慧群;贾泂;;面向数值型敏感属性的分级l-多样性模型[J];计算机研究与发展;2011年01期
8 蔡晓妍;戴冠中;杨黎斌;;谱聚类算法综述[J];计算机科学;2008年07期
9 熊中敏;黄冬梅;;可多边并行移出的社团发现方法[J];计算机工程;2009年12期
10 强小强;何小卫;韩建民;李静;;基于谱约束的随机化社会网络多点扰动方法[J];计算机工程;2011年09期
中国博士学位论文全文数据库 前1条
1 沙朝锋;基于信息论的数据挖掘算法[D];复旦大学;2008年
中国硕士学位论文全文数据库 前3条
1 李祖德;基于K匿名数据集的隐私推理攻击检测和防范研究[D];清华大学;2006年
2 卢建刚;保护隐私的数据发布算法研究[D];重庆大学;2009年
3 刘坚;K-匿名隐私保护问题的研究[D];东华大学;2010年
【二级参考文献】
中国期刊全文数据库 前8条
1 李洁,高新波,焦李成;一种基于CSA的混和属性特征大数据集聚类算法[J];电子学报;2004年03期
2 李洁;高新波;焦李成;;基于特征加权的模糊聚类新算法[J];电子学报;2006年01期
3 葛伟平;汪卫;周皓峰;施伯乐;;基于隐私保护的分类挖掘[J];计算机研究与发展;2006年01期
4 宋世杰;胡华平;周嘉伟;金士尧;;一种基于大项集重用的序列模式挖掘算法[J];计算机研究与发展;2006年01期
5 张伟,陈芸,邹汉斌,周霆;基于倒排文件的布尔规则隐藏算法[J];计算机工程;2005年14期
6 彭京;唐常杰;程温泉;石葆梅;乔少杰;;一种基于层次距离计算的聚类算法[J];计算机学报;2007年05期
7 杨晓春;刘向宇;王斌;于戈;;支持多约束的K-匿名化方法[J];软件学报;2006年05期
8 张鹏;童云海;唐世渭;杨冬青;马秀莉;;一种有效的隐私保护关联规则挖掘方法[J];软件学报;2006年08期
【相似文献】
中国期刊全文数据库 前10条
1 陈晓华;;电子商务消费者隐私问题研究[J];洛阳工业高等专科学校学报;2006年04期
2 陈一梅;;数字化参考咨询的隐私保护研究[J];农业图书情报学刊;2008年01期
3 刘智涛;霍成义;;电子商务中的隐私保护技术研究[J];现代计算机(专业版);2008年10期
4 龙琦;;基于k-匿名的隐私保护[J];科协论坛(下半月);2010年03期
5 毕菊;王莉;;基于快速隐私保护关联规则的挖掘算法[J];辽宁科技大学学报;2010年05期
6 李超良;;物联网隐私保护机制简介[J];福建电脑;2011年04期
7 杨珺;王映龙;;集中式环境下面向隐私保护的数据挖掘技术的方法研究[J];科技信息;2011年08期
8 张珺铭;;基于安全双方计算的密钥改进方案[J];凯里学院学报;2011年03期
9 ;用KV2004隐私保护功能对付网银大盗[J];电脑迷;2004年07期
10 戢渼钧;;关于个性化信息服务的隐私保护[J];图书情报工作;2006年02期
中国重要会议论文全文数据库 前10条
1 张亚维;朱智武;叶晓俊;;数据空间隐私保护平台的设计[A];第二十五届中国数据库学术会议论文集(一)[C];2008年
2 陆闻天;陶先平;吕建;;普适计算环境中隐私保护的研究与进展[A];第二届和谐人机环境联合学术会议(HHME2006)——第2届中国普适计算学术会议(PCC'06)论文集[C];2006年
3 高建智;肖晓玲;;性病门诊患者隐私保护需求调查分析与对策[A];中华护理学会2009全国护理管理学术交流暨专题讲座会议;中华护理学会2009全国护理新理论、新方法、新技术研讨会论文汇编[C];2009年
4 栾卫华;;妇产科患者隐私保护的调查分析体会[A];河南省妇产科护理风险管理研讨班暨学术会议论文集[C];2008年
5 潘晓;郝兴;孟小峰;;基于位置服务中的连续查询隐私保护研究[A];第26届中国数据库学术会议论文集(A辑)[C];2009年
6 余永红;;集成访问控制和隐私保护机制的安全数据库研究[A];第二十五届中国数据库学术会议论文集(一)[C];2008年
7 陆川;姚剑波;文光俊;;无线传感器网络中的数据融合隐私分级保护[A];全国第19届计算机技术与应用(CACIS)学术会议论文集(下册)[C];2008年
8 刘敏;杨薇;;妇产科门诊与住院病人隐私保护需求特点的比较分析[A];中华护理学会全国妇产科新技术、新理论进展研讨会论文汇编[C];2009年
9 黄毅;潘晓;孟小峰;;OrientPrivacy:移动环境下的隐私保护服务器[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
10 汪涛;杨义先;;RFID的认证与隐私保护[A];2006通信理论与技术新进展——第十一届全国青年通信学术会议论文集[C];2006年
中国重要报纸全文数据库 前10条
1 刘国航;打记者难解“隐私”之困[N];法制日报;2010年
2 马婧婧;谁动了我的“隐私”?[N];人民日报海外版;2011年
3 马云飞;P3P:能否撑起隐私保护的天空?[N];中国计算机报;2000年
4 吴平;反乙肝歧视别忘隐私保护[N];中国医药报;2011年
5 黄永维;隐私保护在美国[N];人民法院报;2003年
6 岳成;“黑名单”公布制度与隐私保护[N];国际商报;2001年
7 黄碧梅;我们的隐私,怎么成了别人的金矿[N];人民日报;2010年
8 记者 何宗渝 马姝瑞 付航;网络“隐私门”发酵,谁来保护网民隐私?[N];新华每日电讯;2010年
9 本报记者 吕勇;360密盘让隐私保护更给力[N];中国消费者报;2010年
10 赵正华 冯永强;“八达通”事件凸显港隐私保护亟待更严立法[N];法制日报;2010年
中国博士学位论文全文数据库 前10条
1 张坤;面向多租户应用的云数据隐私保护机制研究[D];山东大学;2012年
2 刘华玲;基于完备空间数据扰动的隐私保护理论方法研究及应用[D];东华大学;2013年
3 任毅;可信数据库中的隐私保护技术研究[D];武汉大学;2011年
4 谈嵘;位置隐私保护及其在基于位置的社交网络服务中的应用研究[D];华东师范大学;2013年
5 张浩;基于位置服务的信息隐私保护技术研究[D];中国科学技术大学;2014年
6 李光;分类挖掘中的隐私保护问题研究[D];哈尔滨工业大学;2011年
7 孙一品;车载自组网隐私保护关键技术研究[D];国防科学技术大学;2010年
8 李杨;差分隐私保护数据聚合优化方法及其在数据可视化中的应用[D];广东工业大学;2013年
9 杨涛;基于代理签名的车辆自组网的隐私保护研究[D];北京大学;2013年
10 马运全;个人金融信息管理:隐私保护与金融交易的权衡[D];山东大学;2014年
中国硕士学位论文全文数据库 前10条
1 孙喜策;商用驱动的无线传感器网络分布式隐私保护技术研究[D];浙江大学;2010年
2 林吓洪;社区化网络中的隐私保护[D];上海交通大学;2010年
3 何青松;基于隐私保护的分布式聚类算法的研究[D];复旦大学;2010年
4 沈旭昌;隐私保护的分布式数据挖掘系统[D];浙江工业大学;2004年
5 毛云青;高效的集值属性数据隐私保护发布技术研究[D];浙江大学;2011年
6 吴修强;WMN安全与隐私保护机制研究[D];西安电子科技大学;2010年
7 王春光;我国网络隐私权民事保护制度研究[D];吉林大学;2005年
8 冷家昭;基于隐私保护的关联规则挖掘研究[D];南京信息工程大学;2011年
9 牛德姣;基于视频的目标跟踪及隐私保护技术的研究与实现[D];江苏大学;2003年
10 王彩梅;位置服务中用户轨迹隐私度量的研究[D];华中师范大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026