收藏本站
《广东工业大学》 2013年
收藏 | 手机打开
二维码
手机客户端打开本文

差分隐私保护数据聚合优化方法及其在数据可视化中的应用

李杨  
【摘要】:在医疗、金融、户籍管理等涉及国计民生的国家基础信息网络和重要信息系统中,存在着大量的隐私数据,其中,许多包含敏感信息的数据都是大样本数据,数据可视化技术可以辅助用户快速准确地发掘其中隐含的信息,如何对包含敏感信息的大样本数据进行可视化是本文的主要研宄内容。 本文研宄2006年由Dwork等人首次提出的差分隐私保护方法,差分隐私保护方法首次定义了一个严格的攻击模型,通过添加噪声使数据失真,从而达到隐私保护的目的。差分隐私保护方法具有两大优点:①隐私披露风险与攻击者所具有的背景知识无关。②隐私保护所添加的噪声量不随数据集的增大而增加。由于差分隐私保护仅通过添加与数据集大小无关的少量噪声,就能达到高级别的隐私保护,极大的保证了数据可视化的可用性,因而非常适合于解决大样本数据的安全可视化问题。 数据可视化通过数据聚合来减少可视化中的图像叠加,提高大样本数据可视化质量,差分隐私保护数据聚合的难点在于①数据聚合中的聚簇数量往往很大,噪音的添加使得聚合的成功率极低。②迭代次数的不确定性导致隐私预算消耗过快,一旦隐私预算耗尽,则难以实现有效的隐私保护。本文在上述背景下提出,研宄“差分隐私保护下的数据聚合及其在数据可视化中的应用”,包括以下四个内容: 1.研宄获取差分隐私保护的理论和方法,分析了交互式与非交互式框架下的差分隐私保护机制,列举了几种攻击模型下,差分隐私保护方法与A:-匿名和[diversity相比所具备的优势。差分隐私保护方法隐私预算的消耗速度与敏感度有着密切的关系,本文对几种特定情况下敏感度的界进行了分析。 2.在对大样本数据进行可视化时,通常先对数据进行聚合处理,以减少可视化中的图像交叠、重合的现象,从而提高大样本数据的可视化图像质量。聚类是数据聚合的基本手段,本文研宄差分隐私保护下的聚类算法,针对差分隐私yt-means聚类可用性差的问题,在满足~差分隐私保护的基础上,通过改进初始中心点的选择,提出了一个IDPhmeans聚类方法,与现有的隐私保护yt-means聚类方法相比,IDPA-means聚类方法在同样的隐私保护级别下,提高了聚类可用性。为了更具客观性,我们引入了隐私保护聚类的同类算法与IDP yt-means聚类方法进行了比较,通过仿真实验可得出结论,IDP yt-means的聚类质量在各项指标上的表现更具优势,尤其在大样本数据集上的优势会更加明显。 3.聚合与聚类算法的不同之处在于聚合算法需要支持数量更大的聚簇。很多聚类算法在聚簇数目较大的情况下,往往会出现聚类可用性低,迭代次数大,兑法效率低等问题。本文提出了一种均分/t-means++数据聚合算法,以数据可视化为口的对算法进行了改进,使算法支持高效地聚合为更多的簇。聚合得到的数据既较好地保持了原数据空间的大部分特性,又显著提高了可视化后的图像质量。仿真实验证明,在不同的DAL下,无论是图像质量还是质量评价指标HDM,NNM上,算法都表现出了较好的效果。 4.差分隐私保护下的数据聚合方法是本文的主要研究内容之一,本文提出了一种差分隐私DPEfmeans数据聚合算法,在保护隐私数据的同时,解决了大样木数据可视化中数据重叠严重,图像质量低的问题,聚合后的数据较好的保持了原数据柒的分布、关联、聚柒等特性。^IDPlmeans算法相比,在同等隐私保护级别c-差分隐私保护下,DPElmeans提高了所能支持的最大DAL,即成功聚为更多的簇。聚合后的点在原数据集上的分布史加均匀,农征数据聚合质量的相关指标值有所提A',算法运行时间比传统A-means聚合减少了-半以上。
【学位授予单位】:广东工业大学
【学位级别】:博士
【学位授予年份】:2013
【分类号】:TP309

手机知网App
【参考文献】
中国期刊全文数据库 前3条
1 崇志宏;倪巍伟;刘腾腾;张勇;;一种面向聚类的隐私保护数据发布方法[J];计算机研究与发展;2010年12期
2 孙扬;封孝生;唐九阳;肖卫东;;多维可视化技术综述[J];计算机科学;2008年11期
3 周水庚;李丰;陶宇飞;肖小奎;;面向数据库应用的隐私保护研究综述[J];计算机学报;2009年05期
【共引文献】
中国期刊全文数据库 前10条
1 朱继锋;戴林;杜顶;李鹏辉;段晶晶;;支持密文索引的数据库透明加密方法[J];信息安全与技术;2011年09期
2 唐曦;黄燕;邱菲菲;黄余明;;互联网地图搜索引擎视觉质量的模糊评价与可视化分析[J];测绘科学;2011年03期
3 齐晓飞;王光霞;崔秀飞;李志远;;DEM误差可视化方法分析与研究[J];测绘科学;2011年03期
4 魏小琴;祝元仲;;高重复率数据信息可视化研究[J];中国传媒科技;2012年06期
5 徐永红;高直;金海龙;刘文远;;平行坐标原理与研究现状综述[J];燕山大学学报;2008年05期
6 李素;李文正;周建军;庄大方;;遥感影像混合像元分解中的端元选择方法综述[J];地理与地理信息科学;2007年05期
7 刘腾腾;倪巍伟;崇志宏;张勇;;多维数值敏感属性隐私保护数据发布方法[J];东南大学学报(自然科学版);2010年04期
8 李建忠;崔静;刘彦兵;刘向冲;杨文广;申维;;基于几何坐标法的多维数据可视化技术在地质数据处理中的应用[J];地学前缘;2012年04期
9 朱友文;黄刘生;李栋;杨威;;保护私有信息的文本信息隐藏检测算法[J];电子与信息学报;2011年02期
10 李文;叶少珍;;多维数据可视化技术及分类器的研究进展[J];福建电脑;2010年05期
中国重要会议论文全文数据库 前2条
1 徐永红;洪文学;陈娜;李昕;刘文远;关新平;张涛;;平行分类器:基于平行坐标和多元数据分析的可视化分类器[A];中国生物医学工程进展——2007中国生物医学工程联合学术年会论文集(上册)[C];2007年
2 朱青;赵桐;王珊;;面向查询服务的数据隐私保护算法[A];NDBC2010第27届中国数据库学术会议论文集A辑一[C];2010年
中国博士学位论文全文数据库 前10条
1 何贤芒;隐私保护中k-匿名算法和匿名技术研究[D];复旦大学;2011年
2 孙扬;多变元网络数据可视化方法研究[D];国防科学技术大学;2010年
3 任毅;可信数据库中的隐私保护技术研究[D];武汉大学;2011年
4 张战成;基于统计学习的协作分类与隐私保护方法及应用研究[D];江南大学;2011年
5 骆永成;数字图书馆敏感数据匿名发布若干关键技术研究[D];东华大学;2011年
6 芮小平;空间信息可视化关键技术研究——以2.5维、三维、多维可视化为例[D];中国科学院研究生院(遥感应用研究所);2004年
7 任永功;面向聚类的数据可视化方法及相关技术研究[D];东北大学;2006年
8 李锋;面向数据挖掘的隐私保护方法研究[D];上海交通大学;2008年
9 胡俊;数据挖掘可视化模型及其应用研究[D];北京交通大学;2009年
10 徐永红;基于多元数据子空间坐标图表示的可视化模式识别[D];燕山大学;2010年
中国硕士学位论文全文数据库 前10条
1 王勇;一种面向隐私保护的分布式数据流挖掘算法[D];哈尔滨工程大学;2010年
2 许焕霞;基于随机正交变换的隐私保护关联规则挖掘算法[D];辽宁工程技术大学;2009年
3 韩璐;针对推荐系统中信息共享需求下隐私保护机制的研究与实现[D];华东师范大学;2011年
4 邵慧;保护隐私的分类挖掘技术研究[D];河北工程大学;2010年
5 张志祥;基于匿名模型的数据发布隐私保护技术研究[D];江苏大学;2010年
6 蒲涛;网络拓扑可视化技术的研究[D];西安电子科技大学;2010年
7 曾晶;Radviz可视化技术度量模型的研究[D];北京交通大学;2011年
8 刘永红;个性化k-匿名模型研究[D];河北工程大学;2011年
9 申静;隐私保护的关联规则挖掘在商务智能中的应用研究[D];河北工程大学;2011年
10 韩俊瑞;隐私保护的分布式聚类算法研究[D];河北工程大学;2011年
【二级参考文献】
中国期刊全文数据库 前10条
1 罗永龙 ,黄刘生 ,荆巍巍 ,姚亦飞 ,陈国良;一个保护私有信息的布尔关联规则挖掘算法[J];电子学报;2005年05期
2 葛伟平;汪卫;周皓峰;施伯乐;;基于隐私保护的分类挖掘[J];计算机研究与发展;2006年01期
3 邵超;黄厚宽;;一种新的基于SOM的数据可视化算法[J];计算机研究与发展;2006年03期
4 羌卫中;邹德清;金海;;网格环境中证书和策略的隐私保护机制研究[J];计算机研究与发展;2007年01期
5 倪巍伟;徐立臻;崇志宏;吴英杰;刘腾腾;孙志挥;;基于邻域属性熵的隐私保护数据干扰方法[J];计算机研究与发展;2009年03期
6 汪加才;张金城;江效尧;;一种有效的可视化孤立点发现与预测新途径[J];计算机科学;2007年06期
7 宋枫溪,高秀梅,刘树海,杨静宇;统计模式识别中的维数削减与低损降维[J];计算机学报;2005年11期
8 张锋;常会友;;基于分布式数据的隐私保持协同过滤推荐研究[J];计算机学报;2006年08期
9 周水庚;李丰;陶宇飞;肖小奎;;面向数据库应用的隐私保护研究综述[J];计算机学报;2009年05期
10 张鹏;童云海;唐世渭;杨冬青;马秀莉;;一种有效的隐私保护关联规则挖掘方法[J];软件学报;2006年08期
【相似文献】
中国期刊全文数据库 前10条
1 陈一梅;;数字化参考咨询的隐私保护研究[J];农业图书情报学刊;2008年01期
2 刘智涛;霍成义;;电子商务中的隐私保护技术研究[J];现代计算机(专业版);2008年10期
3 龙琦;;基于k-匿名的隐私保护[J];科协论坛(下半月);2010年03期
4 毕菊;王莉;;基于快速隐私保护关联规则的挖掘算法[J];辽宁科技大学学报;2010年05期
5 李超良;;物联网隐私保护机制简介[J];福建电脑;2011年04期
6 杨珺;王映龙;;集中式环境下面向隐私保护的数据挖掘技术的方法研究[J];科技信息;2011年08期
7 张珺铭;;基于安全双方计算的密钥改进方案[J];凯里学院学报;2011年03期
8 ;用KV2004隐私保护功能对付网银大盗[J];电脑迷;2004年07期
9 戢渼钧;;关于个性化信息服务的隐私保护[J];图书情报工作;2006年02期
10 钱敏;;数据挖掘中孤立点挖掘算法研究[J];福建电脑;2007年09期
中国重要会议论文全文数据库 前10条
1 张亚维;朱智武;叶晓俊;;数据空间隐私保护平台的设计[A];第二十五届中国数据库学术会议论文集(一)[C];2008年
2 陆闻天;陶先平;吕建;;普适计算环境中隐私保护的研究与进展[A];第二届和谐人机环境联合学术会议(HHME2006)——第2届中国普适计算学术会议(PCC'06)论文集[C];2006年
3 高建智;肖晓玲;;性病门诊患者隐私保护需求调查分析与对策[A];中华护理学会2009全国护理管理学术交流暨专题讲座会议;中华护理学会2009全国护理新理论、新方法、新技术研讨会论文汇编[C];2009年
4 栾卫华;;妇产科患者隐私保护的调查分析体会[A];河南省妇产科护理风险管理研讨班暨学术会议论文集[C];2008年
5 潘晓;郝兴;孟小峰;;基于位置服务中的连续查询隐私保护研究[A];第26届中国数据库学术会议论文集(A辑)[C];2009年
6 余永红;;集成访问控制和隐私保护机制的安全数据库研究[A];第二十五届中国数据库学术会议论文集(一)[C];2008年
7 陆川;姚剑波;文光俊;;无线传感器网络中的数据融合隐私分级保护[A];全国第19届计算机技术与应用(CACIS)学术会议论文集(下册)[C];2008年
8 刘敏;杨薇;;妇产科门诊与住院病人隐私保护需求特点的比较分析[A];中华护理学会全国妇产科新技术、新理论进展研讨会论文汇编[C];2009年
9 黄毅;潘晓;孟小峰;;OrientPrivacy:移动环境下的隐私保护服务器[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
10 汪涛;杨义先;;RFID的认证与隐私保护[A];2006通信理论与技术新进展——第十一届全国青年通信学术会议论文集[C];2006年
中国重要报纸全文数据库 前10条
1 刘国航;打记者难解“隐私”之困[N];法制日报;2010年
2 马婧婧;谁动了我的“隐私”?[N];人民日报海外版;2011年
3 马云飞;P3P:能否撑起隐私保护的天空?[N];中国计算机报;2000年
4 吴平;反乙肝歧视别忘隐私保护[N];中国医药报;2011年
5 黄永维;隐私保护在美国[N];人民法院报;2003年
6 岳成;“黑名单”公布制度与隐私保护[N];国际商报;2001年
7 黄碧梅;我们的隐私,怎么成了别人的金矿[N];人民日报;2010年
8 记者 何宗渝 马姝瑞 付航;网络“隐私门”发酵,谁来保护网民隐私?[N];新华每日电讯;2010年
9 本报记者 吕勇;360密盘让隐私保护更给力[N];中国消费者报;2010年
10 赵正华 冯永强;“八达通”事件凸显港隐私保护亟待更严立法[N];法制日报;2010年
中国博士学位论文全文数据库 前10条
1 张坤;面向多租户应用的云数据隐私保护机制研究[D];山东大学;2012年
2 刘华玲;基于完备空间数据扰动的隐私保护理论方法研究及应用[D];东华大学;2013年
3 任毅;可信数据库中的隐私保护技术研究[D];武汉大学;2011年
4 谈嵘;位置隐私保护及其在基于位置的社交网络服务中的应用研究[D];华东师范大学;2013年
5 李光;分类挖掘中的隐私保护问题研究[D];哈尔滨工业大学;2011年
6 孙一品;车载自组网隐私保护关键技术研究[D];国防科学技术大学;2010年
7 李杨;差分隐私保护数据聚合优化方法及其在数据可视化中的应用[D];广东工业大学;2013年
8 杨涛;基于代理签名的车辆自组网的隐私保护研究[D];北京大学;2013年
9 宋金玲;K-匿名隐私保护模型中与匿名数据相关的关键问题研究[D];燕山大学;2012年
10 刘恒;普适计算环境下基于位置服务的隐私保护若干技术研究[D];电子科技大学;2010年
中国硕士学位论文全文数据库 前10条
1 孙喜策;商用驱动的无线传感器网络分布式隐私保护技术研究[D];浙江大学;2010年
2 林吓洪;社区化网络中的隐私保护[D];上海交通大学;2010年
3 何青松;基于隐私保护的分布式聚类算法的研究[D];复旦大学;2010年
4 沈旭昌;隐私保护的分布式数据挖掘系统[D];浙江工业大学;2004年
5 毛云青;高效的集值属性数据隐私保护发布技术研究[D];浙江大学;2011年
6 吴修强;WMN安全与隐私保护机制研究[D];西安电子科技大学;2010年
7 王春光;我国网络隐私权民事保护制度研究[D];吉林大学;2005年
8 冷家昭;基于隐私保护的关联规则挖掘研究[D];南京信息工程大学;2011年
9 牛德姣;基于视频的目标跟踪及隐私保护技术的研究与实现[D];江苏大学;2003年
10 王彩梅;位置服务中用户轨迹隐私度量的研究[D];华中师范大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026