首页> 中文会议>第二十二届中国数据库学术会议 >一种基于特征类的高精度隐私保护数据发布方法

一种基于特征类的高精度隐私保护数据发布方法

摘要

在当今科技和信息紧密联系的时代,各研究机构需要彼此共享信息,以促进研究成果的推广,例如医疗机构可以发布医疗记录,用于流行病发展趋势方面的研究等.但是发布数据时会涉及个人隐私,为了保护隐私信息,目前通常做法是发布数据时将姓名,身份证号等敏感信息删除,防止隐私泄露.但是这种方法不能完全保护隐私,例如一种获得隐私信息的途径是将发布数据和外部其他数据源获得的数据进行链接处理,获得可以推演敏感信息的渠道,从而造成隐私泄露.图1给出此类隐私泄露的实例.表T1记录某州某年的医疗记录,需要将这些信息发布给用户(例如病理学家)使用,同时必须包含患者的隐私信息,即为保护隐私将患者的姓名、身份证号等标识符信息删除.本文提出特征类的概念,然后引入一种基于特征类的高效的K-匿名化方法Classfly算法,通过采用在概括过程中处理量小于K的特征类的方法来达到提高数据精度和减少执行时间的目的.大量实验结果显示,Classfly在提高K-匿名化系统的精度和效率方面有着良好表现.目前,Classfly方法还比较简单,能够满足较小的数据库集,当数据量很大时,需要进一步完善Classfly算法,优化其处理数据和概括数据方面的工作,使其达到K-匿名的同时,具有更高的效率.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号