首页> 中国专利> 一种维持统计特征不变的跨路网位置匿名方法

一种维持统计特征不变的跨路网位置匿名方法

摘要

本发明公开一种维持统计特征不变的跨路网位置匿名方法,首先根据目标区内的道路分布情况,提取路网进行划分得到路网区域;然后根据实际需要的保护范围和路网区域质心位置,构造满足保护要求的位置匿名候选集合;最后根据待保护路网区域与候选集合中路网区域之间的位置点数量差、质心点距离等参数的大小确定位置匿名的路网区域,通过位置交换的方式进行跨路网的位置匿名。本发明利用路网划分路网区域,在不同路网区域之间进行位置匿名,可以避免攻击者利用位置与属地关系的背景知识获取用户隐私;本发明通过位置交换的方式进行位置匿名,能够维持整体数据的统计特征不发生变化,不影响隐私保护后数据的可用性。

著录项

  • 公开/公告号CN107682817A

    专利类型发明专利

  • 公开/公告日2018-02-09

    原文格式PDF

  • 申请/专利权人 西安交通大学;

    申请/专利号CN201710797476.6

  • 申请日2017-09-06

  • 分类号H04W4/021(20180101);H04W4/02(20180101);H04W12/02(20090101);

  • 代理机构61200 西安通大专利代理有限责任公司;

  • 代理人田洲

  • 地址 710049 陕西省西安市碑林区咸宁西路28号

  • 入库时间 2023-06-19 04:34:27

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-03-17

    授权

    授权

  • 2018-03-09

    实质审查的生效 IPC(主分类):H04W4/021 申请日:20170906

    实质审查的生效

  • 2018-02-09

    公开

    公开

说明书

技术领域

本发明涉及信息安全领域,特别涉及一种空间位置大数据的隐私保护方法。

背景技术

随着GPS和基站定位等技术的发展,移动运营商可以获取大量移动用户的空间位置信息,这些位置信息通过分析和挖掘可以为政府、企业和个人提供决策服务。但是,用户在获取这些服务的过程中,也面临个人敏感信息泄露的风险。因此,如何在保护用户隐私的同时又能为用户提供高质量的数据分析与决策服务,是空间数据服务过程中必须解决的重要科学问题。

国内外学者在位置隐私保护方面已进行了许多有益的研究,包括:Meyerowitz等人提出了一个能够确保位置数据在线匿名的CacheCloak系统;Zhang等人把位置区域栅格化成敏感和非敏感区域,当移动对象进入敏感区域时,将抑制或推迟发布其位置更新;黄毅等人通过用户之间协作形成匿名组,匿名组内的用户用该组的密度中心代替真实位置来实现k-匿名的效果;Shin等人基于多边形和聚类的时空混合隐私保护机制,实现对用户位置的泛化,通过概率k匿名来评估用户的位置匿名水平。但是,现有位置隐私保护方法不能较好的满足空间数据服务的需求,尤其针对空间位置大数据,需要提出新的方法来提高隐私保护的抗攻击能力和隐私保护后数据的可用性。

发明内容

本发明的目的在于提供一种维持统计特征不变的跨路网位置匿名方法,以解决上述技术问题。本发明,首先根据目标区内的道路分布情况,提取路网进行划分得到路网区域;然后根据实际需要的保护范围和路网区域质心位置,构造满足保护要求的位置匿名候选集合;最后根据待保护路网区域与候选集合中路网区域之间的位置点数量差、质心点距离等参数的大小确定位置匿名的路网区域,通过位置交换的方式进行跨路网的位置匿名。

为了实现上述目的,本发明采用如下技术方案:

一种维持统计特征不变的跨路网位置匿名方法,包括以下步骤:

A.提取路网对目标区进行划分形成路网区域:根据目标区域内的道路分布情况,提取路网实现对目标区域的划分,并获取路网区域包含的位置点数量、路网区域质心位置特征;

B.构造满足保护要求的位置匿名候选集合:根据实际需要的保护区范围和路网区域质心位置,将满足条件的路网区域组成待保护路网区域的候选集合,并计算待保护路网区域与候选集合中路网区域之间未匿名的位置点数量差、质心点距离参数;

C.维持统计特征不变的跨路网位置匿名:根据位置点数量差、质心点距离的大小,在候选集合中确定位置匿名的路网区域,通过位置交换的方式对待保护路网区域中的位置点进行跨路网的匿名。

进一步的,步骤A具体包括以下步骤:

设目标区G左下角和右上角的坐标分别为(XMIN,YMIN)、(XMAX,YMAX),以此范围在开放API上面截取目标区地图图片,通过颜色空间变换、腐蚀、膨胀、边界提取、包含关系判断操作,得到划分后的路网区域R1、R2、…、Ri、…、RM

设路网区域Ri包含的Ni个位置点分别为通过下式计算得到路网区域Ri的质心(Xi,Yi):

其中,i=1,2,……,M。

进一步的,步骤A具体包括以下步骤:

设目标区G左下角和右上角的坐标分别为(XMIN,YMIN)、(XMAX,YMAX),以此范围在开放API上面截取目标区地图图片,将其转换到HSV颜色空间;设表示道路的线条颜色值为Color,Color颜色范围的上界为Colormax={Hmax,Smax,Vmax},下界为Colormin={Hmin,Smin,Vmin};设像素点pixel的HSV颜色值为Colorpixel={h,s,v},如果Colormin≤Colorpixel≤Colormax则colorpixel=0,否则colorpixel=1;由所有像素点的colorpixel得到二值图像Figures

扫描二值图像Figures的每一个像素pixel,用3×3的结构元素与其覆盖的二值图像Figures中的部分做“与”运算,如果运算结果为则结果图像的该像素为1,否则为0,重复两次上述操作;扫描二值图像Figures的每一个像素pixel,用3×3的结构元素与其覆盖的二值图像Figures中的做“与”运算,如果运算结果为则结果图像的该像素为0,否则为1;经过两次腐蚀操作和一次膨胀操作后的结果图像为路网图FigureR

对路网图像FigureR执行边界提取操作后得到划分后的路网区域R1、R2、…、Ri、…、RM,用点集(xi1,yi1),(xi2,yi2),(xi3,yi3),……(xie,yie)表示路网区域Ri的边界;对于任一位置点(x,y),分别计算它与(xi1,yi1),(xi2,yi2),(xi3,yi3),……(xie,yie)之间的空间距离,并求出其中最小的空间距离dmin,若dmin=0则点(x,y)属于路网区域Ri;若dmin≠0,则以(x,y)为圆心、dmin为半径做圆Circle,分别计算(x,y)与(xi1,yi1),(xi2,yi2),(xi3,yi3),……(xie,yie)构成的直线与圆Circle的e个交点,设为o1、o2、o3……、oe,通过矢量计算公式ojoj+1=oj+1-oj(j=1,2,……e)得到矢量和若矢量和为0,则点(x,y)属于路网区域Ri

设路网区域Ri包含的Ni个位置点分别为通过下式计算得到路网区域Ri的质心(Xi,Yi):

其中,i=1,2,……,M。

进一步的,步骤B具体包括以下步骤:

设实际需要的保护区边长为d,对于待保护的路网区域Ri,如果路网区域Rp,p≠i的质心(Xp,Yp)满足条件则将Rp加入Ri的候选交换集合S(Ri),即:

设待保护路网区域Ri与候选集合中某一路网区域Rp中未匿名的位置点数分别为ni、np,Ri与Rp之间未匿名的位置点数量差为Δn(Ri,Rp),质心点之间的距离为D(Ri,Rp),则有:

Δn(Ri,Rp)=|ni-np|(3)

进一步的,步骤C具体包括以下步骤:

比较所有的Δn(Ri,Rp)将未匿名位置点数量差最小的路网区域记为Rq,若未匿名位置点数量差最小的路网区域不唯一,则分别计算它们质心点与Ri质心点之间的距离,选择距离值最小的路网区域记为Rq

若ni≤nq,则从Rq中随机选出ni个点和Ri中所有的ni个点进行位置互换,且使nq=Δn(Ri,Rp);若ni>nq,则将Rq中所有点和Ri中随机选出的ni个随机点进行位置互换,且使ni=Δn(Ri,Rp)。

进一步的,重复步骤B和步骤C直至目标区中的所有路网区域处理完毕。

相对于现有技术,本发明具有以下有益效果:

本发明利用路网划分路网区域,在不同路网区域之间进行位置匿名,可以避免攻击者利用位置与属地关系的背景知识获取用户隐私;本发明通过位置交换的方式进行位置匿名,能够维持整体数据的统计特征不发生变化,不影响隐私保护后数据的可用性。

具体实施方式

下面对本发明的实施过程做进一步详细说明。

本发明一种维持统计特征不变的跨路网位置匿名方法,包括以下步骤:

步骤A.提取路网对目标区进行划分形成路网区域:根据目标区域内的道路分布情况,提取路网实现对目标区域的划分,并获取路网区域包含的位置点数量、路网区域质心位置特征。

设目标区域左下角和右上角的经纬度分别为(XMIN,YMIN)、(XMAX,YMAX),根据实际应用需求(例如:比例尺为1:1000),以此范围在开放API上面截取目标区域地图图片,并将其转换到HSV颜色空间。设表示道路的线条颜色值为Color,Color颜色范围的上界为Colormax={Hmax,Smax,Vmax},下界为Colormin={Hmin,Smin,Vmin};设像素点pixel的HSV颜色值为Colorpixel={h,s,v},如果Colormin≤Colorpixel≤Colormax则colorpixel=0,否则colorpixel=1;由所有像素点的colorpixel得到二值图像Figures

扫描二值图像Figures的每一个像素pixel,用3×3的结构元素与其覆盖的二值图像Figures中的部分做“与”运算,如果运算结果为则结果图像的该像素为1,否则为0,重复两次上述操作。扫描二值图像Figures的每一个像素pixel,用3×3的结构元素与其覆盖的二值图像Figures中的做“与”运算,如果运算结果为则结果图像的该像素为0,否则为1。经过两次腐蚀操作和一次膨胀操作后的结果图像即为路网图FigureR

对路网图像FigureR执行边界提取操作后得到划分后的路网区域R1、R2、…、Ri、…、RM,用点集(xi1,yi1),(xi2,yi2),(xi3,yi3),……(xie,yie)表示路网区域Ri的边界。对于任一位置点(x,y),分别计算它与(xi1,yi1),(xi2,yi2),(xi3,yi3),……(xie,yie)之间的空间距离,并求出其中最小的空间距离dmin,若dmin=0则点(x,y)属于路网区域Ri;若dmin≠0,则以(x,y)为圆心、dmin为半径做圆Circle,分别计算(x,y)与(xi1,yi1),(xi2,yi2),(xi3,yi3),……(xie,yie)构成的直线与圆Circle的e个交点,设为o1、o2、o3……、oe,通过矢量计算公式ojoj+1=oj+1-oj(j=1,2,……e)得到矢量和若矢量和为0,则点(x,y)属于路网区域Ri

设路网区域Ri(i=1,2,……,M)包含的Ni个位置点分别为通过下式计算得到路网区域Ri的质心(Xi,Yi):

步骤B.构造满足保护要求的位置匿名候选集合:根据实际需要的保护区范围和路网区域质心位置,将满足条件的路网区域组成待保护路网区域的候选集合,并计算待保护路网区域与候选集合中路网区域之间未匿名的位置点数量差、质心点距离参数。

对于待保护的路网区域Ri,设其对应的保护范围是以为顶点组成的矩形区域,其中d为根据实际需要设定的保护区边长。如果路网区域Rp(p≠i)的质心(Xp,Yp)处在路网区域Ri对应的保护范围内,即(Xp,Yp)同时满足则将路网区域Rp作为Ri的一个候选交换对象,并将所有满足条件的候选交换对象组成一个待保护路网区域Ri的候选交换集合S(Ri),即:

设待保护路网区域Ri中未匿名的位置点数为ni,候选交换集合中某一路网区域Rp中未匿名的位置点数为np,则ni的初始值为Ni,np的初始值为Np;设待保护路网区域Ri中未匿名的位置点数量与候选交换集合中某一路网区域Rp中未匿名的位置点数量差为Δn(Ri,Rp),则有:

Δn(Ri,Rp)=|ni-np|(3)

待保护路网区域Ri的质心点与候选交换集合中某一路网区域Rp的质心点之间的距离设为D(Ri,Rp),则有:

步骤C.维持统计特征不变的跨路网位置匿名:根据位置点数量差、质心点距离的大小,在候选集合中确定位置匿名的路网区域,通过位置交换的方式对待保护路网区域中的位置进行跨路网的匿名。

对于候选交换集合S(Ri)中所有的Rp,分别计算它们与待保护路网区域Ri之间的Δn(Ri,Rp),并将未匿名位置点数量差Δn(Ri,Rp)值最小的路网区域记为Rq;若未匿名位置点数量差最小的路网区域不唯一,则分别计算这些路网区域它们的质心点与Ri的质心点之间的距离D(Ri,Rp),并将距离D(Ri,Rp)值最小的路网区域记为Rq;路网区域Rq将与待保护路网区域Ri进行位置交换完成匿名。

对于待保护路网区域Ri和路网区域Rq,若ni≤nq,则说明待保护路网区域Ri中的所有位置点都能够进行匿名,即从Rq中随机选出ni个点和Ri中所有的ni个点进行位置互换,互换后Ri的未匿名位置点数量ni=0,而路网区域Rq中未匿名位置点数量nq=Δn(Ri,Rq);若ni>nq,则说明待保护路网区域Ri中的位置点不能全部都进行匿名,则从路网区域Ri中随机选出ni个位置点和路网区域Rq中所有点进行位置互换,互换后路网区域Ri中未匿名位置点数量ni=Δn(Ri,Rp)。

重复步骤B和步骤C直至目标区中的所有路网区域处理完毕。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号