您现在的位置: 首页> 研究主题> 数据可用性

数据可用性

数据可用性的相关文献在1999年到2022年内共计145篇,主要集中在自动化技术、计算机技术、信息与知识传播、工业经济 等领域,其中期刊论文111篇、会议论文4篇、专利文献987191篇;相关期刊71种,包括现代医院、计算机工程、计算机工程与设计等; 相关会议4种,包括全国抗恶劣环境计算机第二十六届学术年会 、2011华南医院信息网络大会、第二十四届中国数据库学术会议等;数据可用性的相关文献由327位作者贡献,包括刘向宇、夏秀峰、宗传玉等。

数据可用性—发文量

期刊论文>

论文:111 占比:0.01%

会议论文>

论文:4 占比:0.00%

专利文献>

论文:987191 占比:99.99%

总计:987306篇

数据可用性—发文趋势图

数据可用性

-研究学者

  • 刘向宇
  • 夏秀峰
  • 宗传玉
  • 李建中
  • 马丽明
  • 华中生
  • 朱睿
  • 王意洁
  • 阮彤
  • 黄国兴
  • 期刊论文
  • 会议论文
  • 专利文献

搜索

排序:

年份

    • 王美珊; 姚兰; 高福祥; 徐军灿
    • 摘要: 信息技术和医疗健康信息化的不断发展使医疗数据大规模涌现,为数据分析、数据挖掘、智能诊断等更深层次的应用提供了条件。医疗数据集庞大且涉及大量病人隐私,如何在使用医疗数据的同时保护病人隐私极具挑战性。目前应用于医疗领域的隐私保护技术主要以匿名化技术为主,但当攻击者具有强大的背景知识时,此类方法无法兼顾数据集的隐私性和可用性。因此提出了一种优化分类树算法,并改进了Diffpart分区算法,以数据间关联性为前提,挑选出医疗集值数据集中的适当数据,利用差分隐私保护技术进行加噪处理,满足差分隐私干扰并支持统计查询。最后在24万余条真实医疗数据集上进行测试。实验结果表明,所提算法满足差分隐私分布,并且相比Diffpart算法具备更高的隐私性和效用。
    • 徐捷; 杨庚; 白云璐
    • 摘要: 频繁子图挖掘是频繁模式挖掘的一种具体形式,广泛应用于社会网络分析、生物技术、推荐系统等领域。然而,图数据集中可能包含一些敏感的信息,在挖掘过程中或发布频繁子图信息时都可能造成隐私的泄露。对此,提出一种面向差分隐私保护的top-k子图挖掘算法——DP-TGM(Differential Private Top-k subGraph Mining)。算法首先依据挖掘出的频繁点和边对数据集剪枝,然后将频繁的边依次进行扩展挖掘,得到最终的top-k频繁子图。该算法使用一个优先权队列存储临时挖掘到的前k个最频繁的子图,在扩展挖掘的过程中不断更新队列里的元素,并将阈值始终更新为队列里的最小噪音支持度,减少图的扩展次数。算法使用拉普拉斯机制在三个不同的阶段对子图的真实支持度添加噪音,并且采用均分法和特殊级数法对隐私预算进行合理的分配以提高数据可用性。文章用理论证明算法满足ε-差分隐私保护,且在不同规模的数据集上验证了算法的可用性。
    • 谷青竹; 董红斌
    • 摘要: 隐私保护数据挖掘(PPDM)利用匿名化等方法使数据所有者在不泄露隐私信息的前提下,安全发布在数据挖掘中有效可用的数据集。k-匿名算法作为PPDM研究使用最广泛的算法之一,具有计算开销低、数据形变小、能抵御链接攻击等优点,但是在一些k-匿名算法研究中使用的数据可用性评估模型的权重设置不合理,导致算法选择的最优匿名数据集在后续的分类问题中分类准确率较低。提出一种使用互信息计算权重的互信息损失(MI Loss)评估模型。互信息反映变量间的关联关系,MI Loss评估模型根据准标识符和标签之间的互信息计算权重,并通过Loss公式得到各个准标识符的信息损失,将加权后的准标识符信息损失的和作为数据集的信息损失,以弥补评估模型的缺陷。实验结果证明,运用MI Loss评估模型指导k-匿名算法能够明显降低匿名数据集在后续分类中的可用性丢失,相较于Loss模型和Entropy Loss模型,该模型分类准确率提升了0.73%~3.00%。
    • 黄景; 柳毅
    • 摘要: 针对稀疏环境下的移动对象轨迹数据经匿名处理后可用性低的问题,提出一种稀疏环境下基于假轨迹的轨迹隐私保护算法。在本文算法中,考虑了移动对象所处的地理环境,将轨迹的整体方向和轨迹间距作为选择假轨迹的重要依据。此外,还提出了使用访问概率的概念来平衡匿名和数据可用性,从而实现轨迹数据匿名。基于移动对象的轨迹数据集进行实验与分析,实验结果表明,本文算法在满足轨迹数据匿名需求的情况下有更高的数据可用性
    • 曹亚菲
    • 摘要: 多年来,为了应对对象存储的发展趋势,满足用户的全方位需求,戴尔拥抱新技术、新挑战,不断推出具有灵活性的硬件和软件方案。随着数字技术的不断发展,互联网应用规模快速扩张,社会经济各领域不断推进数字化建设,数据成为影响企业业务成功的核心要素。数据的爆炸式增长,对存储系统的存储容量、数据可用性等方面提出了更高的要求。
    • 张兴兰; 杨文金
    • 摘要: 针对传统的基于欧几里得距离函数计算轨迹相似性过程,要求轨迹等长且时间点对应,没有考虑轨迹的形状,一定程度影响了轨迹隐私保护的效果和数据的利用率问题,提出了一种基于Fréchet距离函数的轨迹隐私保护方法.该方法将轨迹运动方向相近且平均速度相近的轨迹匿名在一起,利用Fréchet距离方法计算轨迹间的距离,最后利用轨迹图之间的权值实现轨迹匿名集合.与其他隐私保护算法比较,在隐私保护和信息损失率上都有一定的改进,表明该方法在处理隐私保护数据方面是有效的.
    • 刘向宇; 夏国平; 夏秀峰; 宗传玉; 朱睿; 李佳佳
    • 摘要: 智能移动终端的普及导致收集的时空数据中个人位置隐私、签到数据隐私、轨迹隐私等敏感信息容易泄露,且当前研究分别针对上述隐私泄露单独提出保护技术,而没有面向用户给出防止上述隐私泄露的个性化时空数据隐私保护方法.针对这个问题,提出一种面向时空数据的个性化隐私保护模型(p,q,ε)-匿名和基于该模型的个性化时空数据隐私保护(PPPST)算法,从而对用户个性化设置的隐私数据(位置隐私、签到数据隐私和轨迹隐私)加以保护.设计了启发式规则对时空数据进行泛化处理,保证了发布数据的可用性并实现了时空数据的高可用性.对比实验中PPPST算法的数据可用率比个性化信息数据K-匿名(IDU-K)和个性化Clique Cloak(PCC)算法分别平均高约4.66%和15.45%.同时,设计了泛化位置搜索技术来提高算法的执行效率.基于真实时空数据进行实验测试和分析,实验结果表明PPPST算法能有效地保护个性化时空数据隐私.
    • 罗丽
    • 摘要: 针对目前混合型大数据匿名安全方法的用户查询相似度偏低,导致匿名数据可用性不理想的问题,提出基于私有云的混合型大数据匿名化加密方法.设计混合型大数据平台架构,将物理服务器和私有云主机的大数据平台相混合,以提高其可扩展性能.利用信息损失指标对混合数据实现泛化处理.构建用户查询项模型,通过散度进行查询项的相似度运算,相似程度越高匿名数据可用性越高.聚类用户查询项模型,发布匿名化数据,保证私有云混合数据的安全.实验结果表明,所提方法能够提高混合数据的实用性,降低了密文的大小,节省大数据存储空间,且方法运行耗时更短.
    • 吕旭东; 田琪; 蔡海领; 李梦阳; 陈雅妮; 段会龙
    • 摘要: 虽然医疗信息化发展提供了丰富的临床诊疗数据资源,但目前临床科研仍然经常遇到数据可及性和可用性低的问题,建立临床科研数据库平台是解决该问题的有效途径.在分析问题的基础上,提出了临床科研数据库平台的系统架构,并结合实践对提高数据可及性和可用性的关键技术及其实现方案进行了介绍.
    • 陈康; 武永卫; 郑纬民
    • 摘要: 对于存储系统来说,信息资源的爆炸性增长在I/O支持应用的性能以及数据可用性等方面提出了越来越高的要求。可以预见,人工智能、大数据和图计算等新型计算模式对存储系统的I/O性能更是提出了极致要求。从技术发展趋势上来看,新型的网络传输硬件及使用模式、新型存储硬件都提供了极高的访问带宽和极低的访问时延,这一发展趋势导致现有的存储软件成为性能瓶颈。特别是在提供低时延访问上,存储软件的结构需要进行革新。
  • 查看更多

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号