首页> 中文学位 >数据发布中多敏感属性数据隐私保护算法
【6h】

数据发布中多敏感属性数据隐私保护算法

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第一章 绪论

1.1 研究背景

1.2 数据发布中隐私保护技术研究现状

1.3 论文的研究内容和组织结构

第二章 基于变长聚类的多敏感属性概率k-匿名算法

2.1 问题的提出

2.2 概率k-匿名算法的分析和改进

2.3 基于变长聚类的多敏感属性概率k-匿名算法设计与分析

2.4基于变长聚类的多敏感属性概率k-匿名算法的实验

2.5 本章小结

第三章 改进的m-不变性动态数据集隐私保护算法

3.1 问题的提出

3.2 m-不变性动态数据集隐私保护算法的分析和改进

3.3 改进的m-不变性动态数据集隐私保护算法

3.4 改进的m-不变性动态数据集隐私保护算法的实验

3.5 本章小结

第四章 总结与展望

4.1 本文研究工作成果

4.2 未来的研究方向

参考文献

致谢

攻读硕士学位期间参加的科研项目

攻读硕士学位期间发表的学术论文

展开▼

摘要

随着信息技术的快速发展,如何在保证隐私数据安全的同时提高计算机信息系统发布数据的可用性,已成为当前计算机系统安全领域面临的挑战问题之一。本文针对静态、动态环境下数据发布中敏感信息泄露的问题进行研究,主要研究针对多敏感属性数据集的基于k-匿名模型的概率k-匿名改进算法和基于m-不变性匿名模型的改进算法的设计与实现。
  基于k-匿名模型的要求,研究提出适用于静态多敏感属性数据集的基于变长聚类的概率k-匿名算法,该算法在原始概率k-匿名算法基础上,综合考虑距离和权重值对聚类种子选取以及聚类结果的影响,建立一个新的聚类种子选取模型,以获得更好的聚类结果,提高匿名数据集的数据质量;提出融合k-means与变长聚类算法的概率k-匿名并行算法,采用多线程并行技术,在不降低匿名质量的前提下,大大提升算法处理大数据集的效率。实验结果表明,所提出的算法效率高、生成的匿名数据集具有较高的数据可用性。
  针对动态数据集环境下隐私泄露的问题,对经典算法m-invariant算法进行分析研究并提出改进算法,改进的算法通过增加一个伪记录表,将新添加的记录先与伪记录进行匹配,创造删除伪记录的机会,以减少整个匿名数据集中伪记录的总数目,达到提高数据可用性的目的;针对算法处理多敏感属性数据较耗时的问题,采用多线程并行技术,将算法的桶分割并行处理,在不降低数据质量的前提下,提高算法的效率。实验表明,提出的改进算法高效、生成的匿名数据集具有较高的数据可用性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号