首页> 中国专利> 一种在大数据背景下的个人信息保护方法

一种在大数据背景下的个人信息保护方法

摘要

一种在大数据背景下的个人信息保护方法和系统,该方法包括步骤:S1:接收并验证待上载的数据;S2:进行数据类型的预处理;S3:判断个人信息数据的长度,并基于单位长度将其划分成个人信息数据片段;S4:对个人信息数据片段加密和上载;S5:检验M个新的个人信息数据Hi;以及S6:对经以上处理的个人信息数据进行安全性分析。该系统包括执行该方法步骤的装置。通过以上过程,本发明的在大数据背景下的个人信息保护方法及系统能够对上载到大数据网络的信息进行完整、有效的保护,同时对上载方数据复原要求也适当降低。

著录项

  • 公开/公告号CN105208036A

    专利类型发明专利

  • 公开/公告日2015-12-30

    原文格式PDF

  • 申请/专利权人 成都携恩科技有限公司;

    申请/专利号CN201510650763.5

  • 申请日2015-10-10

  • 分类号H04L29/06(20060101);

  • 代理机构11340 北京天奇智新知识产权代理有限公司;

  • 代理人郭霞

  • 地址 610041 四川省成都市高新区天府大道北段1480号高新孵化园6号楼119室

  • 入库时间 2023-12-18 13:23:49

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-05-18

    授权

    授权

  • 2016-01-27

    实质审查的生效 IPC(主分类):H04L29/06 申请日:20151010

    实质审查的生效

  • 2015-12-30

    公开

    公开

说明书

技术领域

本发明涉及电数据信息处理领域,更具体而言,涉及一种在大数据背景下的个人信息保护方法和系统。

背景技术

随着社会工业化、信息化水平的不断提高,如今数据已取代计算成为信息计算的中心,云计算、大数据正在成为一种趋势和潮流。包括存储容量、可用性、I/O性能、数据安全性、可扩展性等诸多方面。大数据是规模非常巨大和复杂的数据集。大数据有4V:Volume(大量),数据量持续快速增加;Velocity(高速),数据I/O速度更快;Variety(多样),数据类型和来源多样化;Value(价值),其存在各方面的可用价值。

如今,用户习惯于通过网络在电脑或移动终端开展社交或交易、娱乐等活动,例如用户可通过微博、微信、QQ空间、贴吧、各个网站的个人空间来上载或者发布信息,这些信息既包括私有个人信息数据,这类信息希望被尽可能少的人获知,例如而不限于在12306网站或其他机票网站购买火车、飞机、长途车票时或者在海淘婴幼儿用品、食品和化妆品时或者在网站注册时所上载的个人身份证号、身份证扫描件、银行卡(包括借记卡、信用卡等)号和密码;也包括公开个人信息,这类信息可能希望被尽可能多的人或有权限的人获知,例如在微信上晒大头照、海外旅游照片、个人购买的奢侈品的照片、自己当前所处的位置、拍摄的结婚证图片等等。然而,数据的上载者面临着严重的安全与个人信息保护问题。因为人们在网络上留下了许多数据的信息具有累积性和关联性,将多处数据聚集在一起,就可以发现个人的私有信息,如果不注意保护,犯罪分子就可利用这些信息进行恶意行为,例如现实生活中司空见惯的“人肉搜索”、欺诈、诽谤、新闻八卦等行为,给上载方带来巨大的生理和心理负担以及经济损失。固然执法方面需要对此类行为进行重罚,但上载方以及接收上载方信息的第三方也有必要对此作出响应,在大数据背景下探索更安全有效的个人信息保护方法。

针对大数据时代出现的这些问题,现有个人信息保护主要采用扰码、加密管理、数字签名、限制访问控制等技术来保护。然而,传统方法还不能对上载到大数据网络的信息进行完整、有效的保护,也对上载方数据复原要求高,所以本领域中迫切需要一种能够有效解决上述技术问题的个人信息保护方法。

发明内容

本发明的目的之一是提供一种在大数据背景下的个人信息保护方法及系统,通过该方法和执行该方法的系统的装置,能够对上载到大数据网络的信息进行完整、有效的保护,同时对上载方数据复原要求也适当降低。

本发明为解决上述技术问题而采取的技术方案为:一种在大数据背景下的个人信息保护方法和系统,该方法包括步骤:接收并验证待上载的数据;进行数据类型的预处理;判断个人信息数据的长度,并基于单位长度将其划分成个人信息数据片段;对个人信息数据片段加密和上载;检验M个新的个人信息数据Hi;并对经以上处理的个人信息数据进行安全性分析。

根据本发明的另一个方面,其中区分数据类型是单纯的数字、字母、文字字符、标点符号还是其他符号或组合。

根据本发明的另一个方面,其中将长度为正整数L的个人信息数据划分为M个正整数片段Pi。

根据本发明的另一个方面,其中对个人信息数据片段加密和上载步骤包括:获得个人信息数据片段Pi,采用随机参数产生装置来生成与个人信息数据片段Pi对应的标记。对个人信息数据片段Pi进行加密,生成密钥和第一特征值;采用第一特征值和第一加密参数加密后得到第二特征值,采用密钥和个人信息数据片段Pi生成第二加密参数。对于个人信息数据片段Pi中数据长度不满足单位长度的个人信息数据片段,使用约定含义的位补足;并对单一类型的数据增强加密的复杂度。将第二加密参数和随机参数产生装置提供的随机参数进行哈希运算,得到新的个人信息数据Hi。执行以上步骤,直到全部完成M个个人信息数据片段Pi,生成M个新的个人信息数据Hi。将M个新的个人信息数据Hi上载存储到多个远端服务器或者一个或多个远端服务器中的多个位置中。

根据本发明的另一个方面,其中检验M个新的个人信息数据的步骤包括将生成的与个人信息数据片段Pi对应的标记发送请求给远端服务器;远端服务器根据请求发送响应的数据;加密方自行人工地或者根据其他计算机可执行的手段对数据进行匹配,检验数据的正确性。

根据本发明的再一个方面,提供了一种执行上述方法中步骤的系统的装置。

附图说明

在附图中通过实例的方式而不是通过限制的方式来示出本发明的实施例,其中:

根据本发明的示例性实施例,图1例示了在大数据背景下的个人信息保护方法的架构图。

根据本发明的示例性实施例,图2例示了一种在大数据背景下的个人信息保护方法的流程图。

根据本发明的示例性实施例,图3例示了在大数据背景下的个人信息保护的系统。

具体实施方式

在下面的描述中,参考附图并以例示的方式示出几个具体的实施例。将理解的是:可设想并且可做出其他实施例而不脱离本公开的范围或精神。因此,以下详细描述不应被认为具有限制意义。

根据本发明的示例性实施例,图1例示了在大数据背景下的个人信息保护方法的架构图。其中加密方100通过媒介与大数据网络连接;试图解密方300通过媒介与大数据网络连接。优选地,大数据网络的具体物理实体包括而不限于远端服务器200;更优选地,远端服务器200的具体物理实体包括而不限于云服务器。所述媒介可以是有线通信方式或者无线通信方式,其中的无线通信方式可以采用本领域已知的任何方式,包括而不限于蓝牙、红外、WiFi、Zigbee等等。本文所述的加密方,是指将个人信息上载到大数据网络的一方,可以是数据的所有者,其自己主动通过自己电脑或终端上的特定方式或者借助于网络信息接收方的其他部件来对数据进行加密,进而上载。本文所述的加密也分等级和层次,下文中会进一步详述。而试图解密方,是指第三方试图通过各种手段获取加密方个人信息的一方,既可以是与加密方有关联的人(例如其亲友、恋人、朋友的朋友),也可以是与其无关联的人(例如黑客、犯罪分子);而获取加密方个人信息的该手段既可以是合法的(例如为了国家和地区的安全而进行的合理合法侦查),也可以是非法的(例如窃取其金融账号密码等信息以实施盗刷)。

根据本发明的示例性实施例,图2例示了一种在大数据背景下的个人信息保护方法的流程图。

在本文中,个人信息是根据秘密等级来划分的。秘密等级至少可包括高级、中级、低级;其中中级可根据需要而被划分为更多子级,如加密度较高的子级、加密度一般的子级、加密度不太高的子级等,此处的划分以及子级数量仅仅是示例,并不对其划分进行任何限定。所述的高级是指获知用户上载的个人信息的人(或者一方)数量极少,例如而不限于零个或一个,例如只有上载方(即加密方)本人知道,或者只有上载方(即加密方)本人和网络信息接收方(此处的一方是泛指,可以是该方所拥有的一台或多台机器,也可以是该方的一个或多个物理实体的管理员(即管理人员),也可以是二者的集合或者其他情况)知道;可替代地,或者是只有上载方(即加密方)本人和法律赋予可合法访问个人信息的一方(例如公检法机关)知道。所述的低级是指获知用户上载的个人信息的人(或者一方)数量极多,例如不限制访问,即任何人都可以访问获取其个人信息,例如适当限制的访问,诸如只有其粉丝、收听用户才可以访问。所述的中级及其可能被具体划分的子级是介于高级和低级之间的等级。

在大数据背景下的个人信息保护方法包括以下步骤:

首先,在步骤S1中,接收并验证待上载的数据。该步骤的实施是为了保证数据上载以及后续处理的完整性和正确性,并避免将个人信息数据上载而导致无法撤回的情况发生。因为在现实中,有的网络信息接收方只接收上载方的信息上载,而不接受上载后的信息修改或删除,哪怕是上载方本人提出请求以及其具有合理的理由。

其次,在步骤S2中,进行数据类型的预处理。该步骤的实施是为了区分数据类型,例如单纯的数字、字母(包括各种语言的字母,诸如英语、德语、法语、西班牙语等)、文字字符(例如中文、日文等)、标点符号等等,或者是其任意组合。因为单一的数据类型便于被解密,所以需要增强其加密的复杂度。

其次,在步骤S3中,判断个人信息数据的长度,并基于单位长度进行划分。为了数据处理速度的提高,可根据片段来进行划分。单位长度的数据可根据需要来划分,例如N位为一个单位长度,N为正整数;优选地,其为2的偶次幂。一般地,个人信息数据长度为L,根据数学上的进一法而将其划分为M个正整数片段Pi,i大于等于1但小于等于M,只有完全具备其中的W个片段时才能复原数据,其中W小于等于M;优选地,W比M小1。

再次,在步骤S4中,对数据片段加密和上载。具体而言,步骤S4包括以下步骤:S41,获得个人信息数据片段Pi,采用随机参数产生装置来生成与个人信息数据片段Pi对应的标记。步骤S4还包括步骤S42:对个人信息数据片段Pi进行加密,生成密钥和第一特征值;采用第一特征值和第一加密参数加密后得到第二特征值,采用密钥和个人信息数据片段Pi生成第二加密参数。步骤S4还包括步骤S43:对于个人信息数据片段Pi中数据长度不满足单位长度的个人信息数据片段,使用约定含义的位补足;并对单一类型的数据增强加密的复杂度。步骤S4还包括步骤S44:将第二加密参数和随机参数产生装置提供的随机参数进行哈希运算,得到新的个人信息数据Hi。步骤S4还包括步骤S45:执行以上步骤,直到全部完成M个个人信息数据片段Pi,生成M个新的个人信息数据Hi。步骤S4还包括步骤S46:将M个新的个人信息数据Hi上载存储到多个远端服务器或者一个或多个远端服务器中的多个位置中。

再次,在步骤S5中,检验M个新的个人信息数据Hi。步骤S5包括步骤S51:将生成的与个人信息数据片段Pi对应的标记发送请求给远端服务器。步骤S5包括步骤S52:远端服务器根据请求发送响应的数据。步骤S5包括步骤S53:加密方自行人工地或者根据其他计算机可执行的手段对数据进行匹配,检验数据的正确性。

再次,在步骤S6中,对经以上处理的个人信息数据进行安全性分析。该步骤主要包括数据访问权的分析。

根据本发明的示例性实施例,图3例示了在大数据背景下的个人信息保护的系统。其中系统400包括存储器500和处理装置600。其中存储器中存储有一条或多条数据或指令;而处理装置用于执行以上所述的方法中的步骤。

通过以上过程,本发明的在大数据背景下的个人信息保护方法及系统能够对上载到大数据网络的信息进行完整、有效的保护,同时对上载方数据复原要求也适当降低。

将理解的是:可以硬件、软件或硬件和软件的组合的形式实现本发明的示例和实施例。如上所述,可存储任何执行这种方法的主体,以易失性或非易失性存储的形式,例如存储设备,像ROM,无论可擦除或可重写与否,或者以存储器的形式,诸如例如RAM、存储器芯片、设备或集成电路或在光或磁可读的介质上,诸如例如CD、DVD、磁盘或磁带。将理解的是:存储设备和存储介质是适合于存储一个或多个程序的机器可读存储的示例,当被执行时,所述一个或多个程序实现本发明的示例。经由任何介质,诸如通过有线或无线连接载有的通信信号,可以电子地传递本发明的示例,并且示例适当地包含相同内容。

应当注意的是:因为本发明解决了以上所述的技术问题,采用了计算机和通信领域中技术人员在阅读本说明书之后可根据其教导所能理解的技术手段,并获得了所述的技术效果,所以在所附权利要求中所请求保护的方案属于专利法意义上的技术方案。另外,因为所附权利要求要求保护的技术方案可以在工业中制造或使用,因此该技术方案具备实用性。

以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应包涵在本发明的保护范围之内。除非以其他方式明确陈述,否则公开的每个特征仅是一般系列的等效或类似特征的一个示例。因此,本发明的保护范围应该以权利要求书的保护范围为准。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号