收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于聚类的差分隐私保护的研究

王玲丽  
【摘要】:在大数据时代,各种类型数据的收集、存储、分析和发布变得简单便利,信息的传播速度也呈现出一种速度快、形态多、范围广的特性,大数据动和促进社会进步、经济增长的重要力量。然而,隐私信息一旦落入到非法入侵者手中,就可能会导致企业、政府和国家不可估量的损失。因此,在对数据进行发布、分析、挖掘的时候,需对数据进行隐私处理。差分隐私模型作为一种隐私保护的方法,其定义了一种非常严格的以最大背景知识作为它的攻击模型,在强大的背景知识和数学理论的支持下,通过向原始数据集内加入适量噪音参数ε从而进行数据保护。通过分析隐私保护数据挖掘技术(PPDM)——差分隐私保护下的传统K-means聚类算法可知,在聚类过程中隐私泄露的关键点在于无法正确的选择适合的聚类中心点进行隐私保护,由于数据集进行聚类划分时对选择聚簇点的要求不高,只通过聚类中心点的随机位置对数据进行保护,虽然这种传统的保护技术对数据安全性而言有一定的保护,但是,其聚类过程中初始点和中心点的选择具有一定的随意性和局限性,不仅降低了聚类的精确度和可用性,同时也使差分隐私模型的加噪结果失真。本文研究的主要内容是基于差分隐私保护下的聚类算法的改进,研究目的是在满足差分隐私保护的前提下,实现聚类算法的高可用性与高精确性。本文针对以上问题开展以下研究工作:(1)从K-means算法的聚类效果和初始中心选择角度,给出一种基于K-modes的K均值聚类改进算法,针对传统K-means算法中的不足,在初始点的选取上利用K模式算法中众数的思想,将每个点中属性值与簇中心属性值进行做差比较,得到当前属性值相差最多的数据作为初始点。除初始点外的其他数据点通过K-means算法距离公式欧式距离找到当前点到原簇中心点的最短距离,重新得到划分簇群。由于在初始点和聚类距离方面进行了算法改进,该算法提高了聚类算法的的聚类精度和效果。(2)针对于传统差分隐私K-means算法的不足与缺陷,本文设想给出一种基于K模型的K均值聚类算法差分隐私保护模型。传统的差分隐私K-means算法在数据集各中心点内加噪,可能会造成在迭代过程中其中心点偏差值会随着迭代次数的增加导致偏差越来越大,从而会导致聚类准确性无法达到更高的层次。因此考虑在添加Laplace噪声方式上进行改进,通过数据样本距中心点的距离情况,获得数据样本中敏感属性的具体位置来改变加入噪音的顺序。(3)通过三组对比实验,从以下三个评价标准进行评价:聚类效果、F-measure以及加聚类收敛速度情况进行对比分析,仿真实验表明在聚类效果、聚类精度和时间复杂度方面相较于前人提出的相关方法有明显的优势。图[12]表[7]参[52]


知网文化
【相似文献】
中国期刊全文数据库 前15条
1 吴沈括;黄伟庆;;美国《儿童在线隐私保护法》的适用与商业合规[J];中国信息安全;2019年10期
2 王无恙;;大数据时代之下的个人隐私保护[J];数字通信世界;2019年11期
3 钟其炎;;我国个人电子健康档案隐私保护现状调查与分析——基于普通公众的视角[J];档案学研究;2019年06期
4 李晖;;隐私计算—面向隐私保护的新型计算[J];信息通信技术;2018年06期
5 徐博宇;徐黎飞;;大数据的安全与隐私保护研究[J];河南科技;2018年35期
6 李怡霖;闫峥;谢皓萌;;车载自组织网络的隐私保护综述[J];信息网络安全;2019年04期
7 田世英;袁紫晋;;大数据背景下图书馆读者隐私保护探讨研究[J];中国科技产业;2019年04期
8 郭向凝;张洪江;;医疗大数据的隐私伦理问题研究[J];锦州医科大学学报(社会科学版);2019年03期
9 陈晨;郑永爱;;高校大数据应用中的安全及隐私保护研究[J];网络安全技术与应用;2019年09期
10 许忠良;;浅谈青海省大数据的安全与隐私保护[J];通讯世界;2017年24期
11 王智慧;周旭晨;朱云;;数据自治开放模式下的隐私保护[J];大数据;2018年02期
12 袁安翠;;大数据行业发展现状及个人隐私保护对策研究[J];计算机产品与流通;2018年08期
13 孟大程;罗恩韬;王国军;;移动医疗中基于机会计算的安全和隐私保护模型[J];小型微型计算机系统;2016年12期
14 张雪召;;大数据信息通信技术对个人隐私保护的影响分析[J];通讯世界;2017年07期
15 吴雪敏;;中日图书馆读者自我隐私保护意识比较研究[J];河北科技图苑;2017年04期
中国重要会议论文全文数据库 前10条
1 王涛;叶晓俊;;一种执行隐私保护机制的扩展RBAC模型[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
2 郑思琳;陈红;叶运莉;;实习护士病人隐私保护意识和行为调查分析[A];中华护理学会第8届全国造口、伤口、失禁护理学术交流会议、全国外科护理学术交流会议、全国神经内、外科护理学术交流会议论文汇编[C];2011年
3 胡健飞;吴雷;孟鲁洋;;隐私保护缺失引发的抑制读者现象——实证与对策[A];中国图书馆学会年会论文集(2017年卷)[C];2018年
4 石晓敏;;隐私保护在换药室护理工作中的问题和对策[A];山东省医学伦理学学会第九届学术年会暨第四届理事会第二次会议论文集[C];2015年
5 张海川;赵泽茂;;基于不可信近邻的位置隐私保护方法[A];浙江省电子学会2014学术年会论文集[C];2014年
6 潘晓;郝兴;孟小峰;;基于位置服务中的连续查询隐私保护研究[A];第26届中国数据库学术会议论文集(A辑)[C];2009年
7 黄尤江;贺莲;苏焕群;郑丽荣;;医学大数据之平衡发展与隐私保护[A];中华医学会第二十一次全国医学信息学术会议论文汇编[C];2015年
8 刘师敏;曹三省;杨领军;;互联网隐私保护概观:以“阅后即焚”为案例[A];第24届中国数字广播电视与网络发展年会暨第15届全国互联网与音视频广播发展研讨会论文集[C];2016年
9 毛典辉;蔡强;李海生;曹健;;一种自适应情景的位置隐私保护方法[A];2013年中国智能自动化学术会议论文集(第五分册)[C];2013年
10 孙通源;;基于局部聚类和杂度增益的数据信息隐私保护方法探讨[A];中国水利学会2013学术年会论文集——S4水利信息化建设与管理[C];2013年
中国博士学位论文全文数据库 前10条
1 周倩;传感网中基于上下文的位置隐私保护关键技术研究[D];南京航空航天大学;2018年
2 李冬梅;若干外包云计算中隐私保护的研究[D];上海交通大学;2018年
3 钱萍;物联网同态隐私保护关键技术研究[D];南京邮电大学;2017年
4 朱轶;内容中心网络缓存策略及缓存安全技术研究[D];南京邮电大学;2016年
5 李晔;具有隐私保护的外包数据分类方法研究[D];哈尔滨工业大学;2018年
6 周志刚;云环境下数据隐私保护与安全搜索技术研究[D];哈尔滨工业大学;2018年
7 李腾;智能通信设备的隐私保护和异常检测方法[D];西安电子科技大学;2018年
8 张磊;基于用户协作的位置隐私保护研究[D];哈尔滨工程大学;2018年
9 万盛;位置服务的隐私保护关键技术研究[D];西安电子科技大学;2018年
10 马鑫迪;移动感知推荐系统中隐私保护研究[D];西安电子科技大学;2018年
中国硕士学位论文全文数据库 前10条
1 詹佳程;WSN源节点位置隐私保护关键技术研究[D];杭州电子科技大学;2019年
2 王玲丽;基于聚类的差分隐私保护的研究[D];安徽理工大学;2019年
3 朱海明;局部差分隐私约束的扰动数据发布[D];安徽理工大学;2019年
4 董银霜;基于贝叶斯网络的差分隐私保护数据发布[D];安徽理工大学;2019年
5 陈家明;基于位置服务隐私保护研究[D];安徽理工大学;2019年
6 王恺;智能电网中奖励需求响应下需求侧隐私保护方法的研究[D];华北电力大学;2019年
7 赵芸;基于隐私保护的数据建模与算法研究[D];江南大学;2019年
8 孙丝雨;面向车辆群体感知场景的隐私保护技术研究[D];电子科技大学;2019年
9 王艳平;基于Shuffle和OT的医疗数据隐私保护协议研究[D];桂林电子科技大学;2019年
10 张晓玮;无线传感网中数据聚合的隐私保护研究[D];曲阜师范大学;2019年
中国重要报纸全文数据库 前10条
1 吕小羽;隐私保护意识仍需加强[N];中国科学报;2017年
2 本报记者 欧阳剑环;肖钢:多举措加强数据隐私保护[N];中国证券报;2019年
3 何勇;官方隐私保护意识不能落伍[N];湖北日报;2019年
4 何勇;增强隐私保护意识需跟上时代步伐[N];珠海特区报;2019年
5 牛瑾;技术进步与隐私保护不必“二选一”[N];经济日报;2019年
6 本社记者 王涵;呼吁加强个人信息隐私保护政策[N];民主与法制时报;2018年
7 记者 汪建君;“隐私计算”:助推“小数据”时代走向“大数据”时代[N];国际金融报;2019年
8 本社记者 周頔;专家学者共话隐私保护与数据治理[N];民主与法制时报;2019年
9 本报记者 万静;隐私保护需政府企业社会三方共治[N];法制日报;2019年
10 方兴东 浙江传媒学院互联网与社会研究院院长;像爱护眼睛一样重视隐私保护[N];环球时报;2018年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978