抵制子序列攻击的高维轨迹隐私保护方法研究
随着移动定位技术、位置感知设备的发展和普及,人们越来越依赖于移动设备获取服务,服务提供商、研究机构甚至个人都掌握了越来越多的轨迹数据。轨迹数据中蕴含了丰富的时空信息,发布轨迹数据及对其进行信息挖掘是很多位置应用开发和更新的基础。然而,轨迹数据中通常包含大量的用户敏感信息,若直接发布会带来一系列隐私安全问题。将发布的轨迹信息进行匿名处理,保护用户隐私的同时最大程度地保证数据可用性已经成为国内外学者研究的热点问题。本文围绕高维轨迹发布中存在的隐私泄露问题,针对攻击者在具有部分背景知识的条件下利用轨迹序列及其与敏感属性组合窃取用户隐私信息的情况,提出隐私保护方案。论文主要工作如下:1.针对当前高维轨迹隐私保护算法使用单一的轨迹隐私保护技术造成的匿名位置难以准确度量,从而造成数据损失率高、隐私保护程度差的问题,提出一种基于单点收益的轨迹隐私保护方法。该方法首先找出存在隐私泄露风险的轨迹集合,然后以单点收益衡量抑制法和假轨迹法分别带来的隐私效益,找到最合适的匿名位置(或者序列),最后采用单点收益较大的匿名方法对该位置(或者序列)进行匿名,直到满足在用户隐私容忍度要求下,轨迹数据集中不存在可能泄露隐私的轨迹。最后,通过仿真实验将该算法与其他算法进行对比分析,证明了所提方法的有效性。2.针对高维轨迹隐私保护中,由于轨迹间的距离难以度量,利用传统聚类算法对高维轨迹进行聚类时出现难以收敛的情况,提出一种面向高维轨迹敏感属性泛化的轨迹聚类算法,该算法首先利用公共子序列对轨迹间相似度进行计算,然后建立耦合度邻接表并得到每条轨迹的密集度,最后选择密集度最高的轨迹作为初始聚类中心轨迹,以此摆脱传统轨迹聚类在选择中心轨迹时的随机性。3.针对多攻击者之间进行数据交换,使得他们掌握的含有敏感信息轨迹背景知识变多的情况,提出一种基于敏感属性泛化的个性化轨迹隐私保护方法。该方法首先利用聚类算法挖掘出频繁模式,在频繁模式组中对轨迹携带的敏感属性进行个性化泛化,然后基于公共子序列对轨迹序列进行干扰,以此抵御攻击者发动的攻击。仿真实验结果表明,该方法保护了轨迹信息隐私,可有效解决攻击者联合攻击情况下轨迹数据发布中存在的隐私泄露问题。
- 作者:
- 林文诗
- 学位授予单位:
- 安徽师范大学
- 授予学位:
- 硕士
- 学位年度:
- 2020年
- 导师姓名:
- 陈传明
- 中图分类号:
- TP309
- 关键词:
- 轨迹隐私保护;子序列攻击;轨迹发布;轨迹抑制;假轨迹
-