首页> 中国专利> 基于分形多级蜂窝网格的大数据组织与管理方法及系统

基于分形多级蜂窝网格的大数据组织与管理方法及系统

摘要

本发明公开了基于分形多级蜂窝网格的大数据组织与管理方法,该方法的步骤包括确定系统信息点的颗粒大小和信息颗粒之间最小距离;根据上述颗粒大小及最小距离生成蜂窝结构并对每一个信息点进行全覆盖;对蜂窝结构中的每一个单元格进行编码;根据该编码特征计算与其他信息点的距离、隶属关系和定位信息,并储存;根据多级分形的特征,对信息点进行分级管理。本发明所述技术方案基于分形多级蜂窝网格进行大数据信息的组织和管理,结构简洁清晰,适用于任意复杂大系统或者是大数据可以进行清楚的划分和分级;本发明所述技术方案可以广泛适用管理众多而复杂的信息,作为新型的存储以及搜索手段,以达到快速获取所需信息的目的。

著录项

  • 公开/公告号CN105159903A

    专利类型发明专利

  • 公开/公告日2015-12-16

    原文格式PDF

  • 申请/专利权人 北京交通大学;

    申请/专利号CN201510209807.0

  • 发明设计人 乐逸祥;张彤;

    申请日2015-04-29

  • 分类号G06F17/30;

  • 代理机构北京正理专利代理有限公司;

  • 代理人张文祎

  • 地址 100044 北京市海淀区上园村3号北京交通大学交通运输学院

  • 入库时间 2023-12-18 12:59:36

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-09-28

    授权

    授权

  • 2016-01-13

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20150429

    实质审查的生效

  • 2015-12-16

    公开

    公开

说明书

技术领域

本发明涉及大数据存储、编码和检索处理,特别是涉及一种基于分形多级蜂窝网格的大数据组织与管理方法及系统。

背景技术

随着信息技术的发展应用,在信息交互及管理过程中大数据的处理及管理直接影响到系统对数据的检索和管理速度。

传统的存储解决方案面对海量的数据及其各种不同的需求已出现越来越多的问题,比如数据量的指数级增长对不断扩容的存储空间提出要求,实时分析海量数据对存储计算能力提出要求。本方法就利用蜂窝结构的稳定性和多级自相似分形结构的特点,设计了一套针对复杂局系统的大数据组织和管理的方法,来适应大数据存储和管理的要求,以此来有效满足大数据的发展需求。

该方法可以对社会组织、地理信息、交通大数据、像数据等进行管理。

发明内容

本发明要解决的技术问题是提供一种基于分形多级蜂窝网格的大数据组织与管理方法及系统,以解决现有技术中海量信息点的存储、编码、检索和展示问题。

为解决上述技术问题,本发明采用下述技术方案:

基于分形多级蜂窝网格的大数据组织与管理方法,该方法的步骤包括

S1、确定系统信息点的颗粒大小和信息颗粒之间最小距离;

S2、根据上述颗粒大小及最小距离生成蜂窝结构对每一个信息点进行全覆盖;

S3、对蜂窝结构中的每一个单元格进行编码;

S4、根据该编码特征计算与其他信息点的距离、隶属关系和定位信息,并储存;

S5、根据多级分形的特征,对信息点进行分级管理。

优选的,所述步骤S2中对每个信息点进行全覆盖的步骤包括

S21、在垂直多级网格中,第0级,显示整体信息的根节点,该节点可以是一个单元格,也可以是该信息组织的对象;

S22、在垂直多级网络中,第1级,只显示垂直多级信息的第一次主要分类情况,该信息被分为7大区域,即中央区和围绕的其的六个边区;

S23、在垂直多级网络中,第2级,上述7大区域中每个区域进一步被分级,每个区域同样被分成7个区域;

S24、按照上述分级方式进行第n级的分级,直至形成对所有信息点的全覆盖。

优选的,所述步骤3中单元格的编码采用自相似分形的方式进行编码,其具体编码的步骤包括

S31、将中央区域的编码以0开头,围绕其的6个区域分别以1至6作为编码的开头;

S32、根据数据量或层级数量,按照上述方式进行编码,直至完成所有信息点的编码。

优选的,所述步骤S5中对任意信息点管理的步骤包括

S51、无论信息点的数量有多少,每一级的信息点有且仅有7个控制点;

S52、对于任意一个单元格或信息点与中央信息点的距离和方位通过单元格的边长和编码进行快速计算和判断;

S53、若已知任意两点之间的最小距离,则通过递归的方式实现所有信息点的全覆盖,其中每个信息点即为一个单元格;

S54、利用上述多级分形结构和递归方式,对所有信息点进行编码;

S55、基于蜂窝结构对所有信息点完成全覆盖和编码,实现对所有信息点的管理、检索与展示。

基于分形多级蜂窝网格的大数据组织与管理系统,该系统包括

基本数据设定模块,用于用户对系统信息点的颗粒大小和信息颗粒之间最小距离进行初步设定;

蜂窝结构构建单元,基于所述颗粒大小及最小距离构建能够覆盖所有信息点的蜂窝结构;

编码模块,用于对所述蜂窝结构中每一个单元格进行编码;

管理单元,根据上述分级分形的特征对信息点进行管理。

优选的,所述蜂窝结构构建单元执行以下步骤

在垂直多级网格中,第0级,显示整体信息的根节点,该节点可以是一个单元格,也可以是该信息组织的对象;

在垂直多级网络中,第1级,只显示垂直多级信息的第一次主要分类情况,该信息被分为7大区域,即中央区和围绕的其的六个边区;

在垂直多级网络中,第2级,上述7大区域中每个区域进一步被分级,每个区域同样被分成7个区域;

按照上述分级方式进行第n级的分级,直至形成对所有信息点的全覆盖。

优选的,所述管理单元执行以下步骤

无论信息点的数量有多少,每一级的信息点有且仅有7个控制点;

对于任意一个单元格或信息点与中央信息点的距离和方位通过单元格的边长和编码进行快速计算和判断;

若已知任意两点之间的最小距离,则通过递归的方式实现所有信息点的全覆盖,其中每个信息点即为一个单元格;

利用上述多级分形结构和递归方式,对所有信息点进行编码;

基于蜂窝结构对所有信息点完成全覆盖和编码,实现对所有信息点的管理、检索与展示。

优选的,该系统进一步包括储存模块,用于保存信息点基本数据、信息点编码和多级蜂窝结构,并根据用户需要调用上述数据。

优选的,该系统进一步包括检索和显示模块,用于根据用户需要对蜂窝结构中各单元进行跟踪定位、放大显示和全显示操作。

优选的,该系统进一步包括单元格信息修改模块,用于根据用户需求更改单元格中的信息内容。

本发明的有益效果如下:

本发明所述技术方案基于分形多级蜂窝网格进行大数据信息的组织和管理,结构简洁清晰,适用于任意复杂大系统或者是大数据,可以进行清楚的划分和分级;本发明所述技术方案可以广泛适用于管理众多而复杂的信息,作为新型的存储以及搜索手段,以达到快速获取所需信息的目的。

附图说明

下面结合附图对本发明的具体实施方式作进一步详细的说明;

图1示出本发明所述的大数据组织与管理方法的示意

图2示出本发明所述蜂窝结构和单元格编码的示意

图3示出本发明所述蜂窝管理和检索的示意

图4示出本发明所述的大数据组织与管理系统的示意

图5示出本发明所述系统的操作界面的示意

图6示出本发明技术方案中多级分形蜂窝结构第0级编码的示意

图7示出本发明技术方案中多级分形蜂窝结构第1级编码的示意

图8示出本发明技术方案中多级分形蜂窝结构第2级编码的示意

图9示出本发明技术方案中多级分形蜂窝结构第3级编码的示意

图10示出本发明技术方案中多级分形蜂窝结构第4级编码的示意

图11示出本发明技术方案中多级分形蜂窝结构信息检索的示意

图12示出本发明实施例中多级分形蜂窝结构第0级编码的示意

图13示出本发明实施例中多级分形蜂窝结构第1级编码的示意

图14示出本发明实施例中多级分形蜂窝结构第2级编码的示意

具体实施方式

为了更清楚地说明本发明,下面结合优选实施例和附图对本发明做进一步的说明。附图中相似的部件以相同的附图标记进行表示。本领域技术人员应当理解,下面所具体描述的内容是说明性的而非限制性的,不应以此限制本发明的保护范围。

本发明的主要思路是基于垂直的分形多级蜂窝网格,垂直分形多级结构是由多个层次的节点构成。信息点的收集是一种特殊的信息树分级,每个节点确定只有一个根节点,6个叶节点。每个级别的节点与邻近层级的节点按照某种关系与一个或多个节点相连。在最高级别下一个层次的每个节点,是在这个层次以上的一个或者更多的父节点的子节点。在同一级别的节点是兄弟节点。每个子节点只有一个父节点,每个父节点可能有多个子节点。通过这种结构,可以快速生成覆盖大规模信息节点的信息树。由于该信息树具有多级自相似分形结构的特点,通过编码即可以实现更快、更便捷的信息检索和定位,可以延伸到复杂巨系统的管理模式和管理方法上。

如图1所示,本发明公开了一种基于分形多级蜂窝网格的大数据组织与管理方法,该方法的步骤包括

第一步:确定系统信息点的颗粒大小。

首先确定该系统信息单元的大小,例如以社会组织为背景,我们可以以某一个自然人为信息单元,那么每一个个人就是蜂窝中的每一个单元格(Cell),也可以看作是细胞,那么全球所有的人的信息点所需的蜂窝结构为11级(大于138亿个信息点)。如果以家庭为信息单元,那么每一个单元格为一个家庭的信息,如果以社区为信息单元,那么每一个单元格为一个社区的信息。

第二步:确定信息颗粒之间最小距离。

这一步骤的最小距离是指广义的距离,即信息点之间的分界规则,例如以人为信息点,那么每个人的区分是以国家、民族、生日、血型、所在地、父母或者DNA,确定最小距离之后才能够生成蜂窝结构对每一个信息点进行全覆盖。

第三步:生成蜂窝结构对每一个信息点进行全覆盖。

确定了最小距离以后,可以使用计算机递归程序生成一个刚好能够覆盖所有信息点的蜂窝结构,使每一个单元格(Cell)里面最多有一个信息点。

第四步:对每一个单元格进行自动编码。

根据生成的蜂窝结构,计算机采用递归程序对每一个单元格进行自动编码,使得每一个信息点都有一个唯一的ID,也会出现某些单元格(Cell)没有信息点的情况。

第五步:对每一个信息点的相关参数进行自动完善。

根据单元格(Cell)内信息点的编码、特征,自动计算与其他信息点的距离、隶属关系、定位等一系列用得到的信息,并将其存储。

第六步:进行信息的检索和展示。

根据多级分形的特征,对信息点进行分级管理和展示。对于检索到的信息进行放大和具体展示,而其他信息点则可以隐藏,可以快速定位、检索、展示。

如图2所示,本发明所述分形多级蜂窝网格指的是垂直多级网格,用于复杂的大系统中,进行组织的管理。在垂直多级网格中,第0级,显示的是整体信息的根节点,实际上可以看成是一个单元格,也就是该信息组织的对象,第1级,只显示垂直多级信息的第一次分类,即主要分类情况,此时可以看到该信息分类被分为7大区域,中央区和围绕的六大边区。在第2级,7大区域进一步被分级,每一个区域同样被分成7个子区域,以此方式划分下去,形成对所有信息点的全覆盖。其中,对于每个单元格的编码采用自相似分形思想,中央区域为0,周围环绕的区域依次为1至6。该结构的形和单元格编码如图1所示。

基于该形结构以及分类方法,对于任意的信息点,可以采用7进制(7-Block)管理。例如:如图3所示,中央区域为该管理体系的核心,编码为0开头,中央区域可以为核心功能区,例如信息检索里的目录区域,或者区域行政管理的首都。其它环绕的6个区域分别以1、2、3、4、5、6这六个数字开头,10表示1号区域的中心,11表示1号区域的1号单元格,如此类推对所有单元格进行编码。例如给定任意单元格的编码,例如114,第一步可以快速判断是一个三级蜂窝结构,一共有73个信息点,第二步,可以迅速判断该单元格位于第一个子域的第一个子子域的第四个环绕单元格。如果给定每一个子域的物理意义,可以马上判断该单元格的含义。

如图3所示,对于大规模的信息点,可以按照多级分形结构进行管理和检索。

因此,对于任意信息点的管理,可以进行分级管理,即使是大数据的管理和检索也可以高效实现。

(1)第一级的信息点只包含7个控制点,即使10级超过2.8亿个信息点,也只需要管理7个控制点,如果需要进一步拓展和定位,可以针对某一个子域进行快速检索和放大,依然是7个控制点;

(2)任意一个单元格(信息点)与中央信息点的距离、方位可以通过单元格的边长和编码,以一定的规则迅速计算和判断,例如单元格114和中央信息点的距离不是通过欧氏空间的直线距离114→000计算,而是通过计算(114→110)+(110→100)+(100→000)这样来计算和确定,而任意级数的中心和子中心之间的距离有确定的快速计算公式;

(3)已知任意两点之间的最小距离的条件下,可以通过递归程序,实现所有信息点的全覆盖,每一个信息点就是一个单元格;

(4)通过多级分形结构和递归程序,可以对所有信息点自动进行编码;

(5)信息点一旦完成全覆盖和编码工作,即实现了基于蜂窝结构的管理和检索。如果再对某一个编码数字赋予现实世界的物理含义,可以快速根据编码确定信息点的位置、角度、距离以及与其他各单元格之间的关系等,实现信息的检索、展示。

基于上述方法以信息搜索为例,对于中国地信息,第一层次可以显示行政区域划分,以北京为首都作为中央编码,可以点北京;第二层次如果需要检索北京市的详细信息,可以将北京市这个行政区域扩展成7个区块,继续分级下去,直到找到北京交通大学,同时北京交通大学被单独扩展成诸多信息查询群,如可以点师资,能查到某个教授的介绍等详细信息。通过本发明所设计的多级分形蜂窝结构,可以根据两个信息点的最短距离,实现所有信息点的全覆盖,同时实现所有信息点的自动编码。而且由于单元格的数量是随着级数的增加呈指数增长,在10级的时候已经实现了多于2.8亿个信息点的编码和管理,对于一般复杂系统足够了。

对所有信息点完成全覆盖和编码,就可以很快的搜寻到自己所需要的信息群、信息点。同样,将本发明所述方法应用于人类社会组织管理当中去,可以高效快速的将任务分配下去,或者出现意外状况,可以快速找到当事人。

如图4所示,本发明进一步公开了一种基于分形多级蜂窝网格的大数据组织与管理系统,该系统包括基本数据设定模块,用于用户对系统信息点的颗粒大小和信息颗粒之间最小距离进行初步设定;蜂窝结构构建单元,基于所述颗粒大小及最小距离构建能够覆盖所有信息点的蜂窝结构;编码模块,用于对所述蜂窝结构中每一个单元格进行编码;管理单元,根据上述分级分形的特征对信息点进行管理。该系统进一步包括储存模块,用于保存信息点基本数据、信息点编码和多级蜂窝结构,并根据用户需要调用上述数据;检索和显示模块,用于根据用户需要对蜂窝结构中各单元进行跟踪定位、放大显示和全显示操作;和单元格信息修改模块,用于根据用户需求更改单元格中的信息内容。

如图5所示为本发明所述系统的操作界面的示意如图6图10示出本发明所述多级分形蜂窝结构的构建和编码过程。

按照包含分形多级蜂窝网格的形式对于信息进行组织和显示。分形多级蜂窝网格的每一级包含一个或者多个单元。对于第0级之后的每一级,由7个相同的覆盖单元构成分形多级结构,这7个单元和先前一级的分形多级结构保持相同,一个级别由其前一个级别有序组成7个细胞结构。这种分形结构在连续的级别中不断重复。在具体的实例中,来自上一级的每个单元依照多级分形结构被分化或者组织。上一级别的单元依照分形多级蜂窝网格分化或者组织。分形指的就是这种多级分形结构。

在蜂窝网格结构中,中央区域指的是位于几何中心单元格,网格中其他的细胞被称为环绕细胞。相应地,编码0是中央区域,1-6是环绕区域。每个环绕区域占据着相对于中心区域外周的一个位置。这些区域可以是一个单元格(Cell),也可以是一个蜂窝的子结构。编码规则如下:

0为中心区域,1-6是环绕区域。每个环绕单元格(Cell)相对于中心单元格(Cell)而言占据一个位置。1在右上,2在左上,3在左边,4在左下,5在右下,6在右边。随着单元格的数量增加,实现了对目标区域的无缝全覆盖。

图6展示了第0级的分形多级蜂窝网格。第0级的分形多级蜂窝网格只有一个被称为根细胞的细胞,它的内容代表着根细胞的内容,也就是该信息总索引。用户可以利用系统中的修改蜂窝单元格内容的功能来指定细胞,用作显示或者输入有关根细胞的现实物理意义。

图7展示了第1级的分形多级蜂窝网格。第1级的分形多级蜂窝网格包括中央控制网格0。也就是第一级根节点的第一层次拓展。在网格控制00中,有6个单元格被检索,分别是:1,2,3,4,5,6。每个单元格的范围由边界划分界限。

图8展示了第2级分形多级蜂窝结构包括网格00。网格00控制6个单元格同时控制了6个子区域,六个单元格分别是:01,02,03,04,05,06;六个子区域分别为:10,20,30,40,50,60;每个子区域分别控制自己管辖范围内的其他网格,如10是1号子区域的中心,它控制着11,12,13,14,15,16这6个单元格,每个单元格都有边界。根据对信息点管理的需求,可以对中央区域的单元格与各子区域的中心点构建一定的逻辑关系和显示意义编码,从而将中央区域的单元格变成检索区。例如将01号单元格(Cell)和10号单元格(Cell)、02号单元格(Cell)和20号单元格(Cell),……建立关系,可以通过中央区的单元格,管理和控制全部区域内每一个单元格(Cell)。

图9展示了第3级分形多级蜂窝结构,同第2级相似的,第3级也是有7个区域,每个区域就是一个2级蜂窝结构。照此类推,依次到6级结构时,已经可以对几十万规模的信息点进行无缝的全覆盖。

基于上述构建方式,构建如图10所示,多级分形蜂窝结构第4级编码。

如图11所示,为本发明所述技术方案中多级分形蜂窝结构信息检索、管理、检索与展示的示意。对于任意规模的信息集合,构建一个中央区,也就是检索区,6个环绕区,也就是信息存储区。有一个唯一的根节点,也就是图11中的1号单元格(Cell),可以称之为根细胞,根细胞管理着7个子区域,中央区域之外还有6个子区域的中心,也就是图11中的2号单元格(Cell),可以称之为干细胞;每个干细胞又管理着6个子子区域的中心,也就是图11中的3号单元格(Cell),可以称之为基细胞;每个基细胞又管理着自身子区域的中心,即图11中所示的围绕在3号单元格周围的灰色细胞,每个灰色细胞又管理着自身周围的细胞,即图11中所示的白色单元格,这种自相似分形蜂窝结构在连续的级别中一直重复。

每一个干细胞所控制的区域也同样是完整的蜂窝结构,在信息管理和检索的时候,对于非活动的信息,可以只保存干细胞的信息,更低一层次的结构完全可以隐藏或处于休眠状态。加快信息点的检索和展示。

按照其他的分形结构的构成方式,其他的多级分形结构也能生成。因此,这种发明不局限于统一尺寸和形状的单元。

下面通过一个实施例对本发明做进一步说明:

本实施例以某一个医院的医生管理为例进行说明,具体表征这种分形多级蜂窝网格结构系统怎么应用于以医生作为信息点进行存储以及查询的过程。

采用分形多级蜂窝网格结构系统应用于医院的医生信息管理,首先假设仅以每一个医生作为信息点,这样就确定了最小信息单元之间的广义距离。如图12所示,根节点为医生。对以医生为根节点的所有医生进行分类、并进一步拓展,图13为下一级的逐层搜索范例,可以帮助患者快速搜索自己需要的医生的相关信息。在图14中,展示了医生2级垂直分形网格,其中中央区为检索区,在现实中也可以作为各中层领导区,每一个中层领导分别包含所隶属的更下一层的医生。将该结构进一步细分下去,到第三级展开的时候,将显示班组信息,到第四级展开的时候,将显示医生个人的信息。因此,该5级蜂窝结构已经具备了近1.7万个信息点的布局,对于一般医院已经足够了,其中根细胞是编码为00000,干细胞为10000(外科)、20000(内科)、30000(儿科)、40000(妇产)、50000(骨科)、60000(中医),基细胞为各科室的班组管理,……最后每一个医生为一个单元格。

因此,从整体上看,整个医院的医生构成一个网格,可以往更高一个层次的信息网格里嵌入,作为更大规模的信息的一个整体。往下,则每一个干细胞(如外科)也可以作为一个相对独立的网格,具有与整个蜂窝结构相似的独立、完整的部分。每个组成部分都是独立的,能够自主决策,同时又能正确描述它们在整个医院中的地位和作用。每个组成部分都有自我优化、自我设计、自我创造和自我组织的自由,可以继续往更下一级细分,但都受到整个网格大环境的制约。

在大型城市规划布局方面,也可以采用这种方式,例如中央城区,周围环绕城区,中央城区具有领导、控制功能(数据目录),周围环绕城区只是位置的不同,仍然以这种模式进行划分和管理,每个城区都有自我优化、自我设计、自我创造和自我组织的能力,诸如城市内部商业网点、学校、医院、邮政、交通设施的合理布局、城市发展战略、城市形态扩散增长的凝聚扩散模型模拟方法等也均可采用该方法。

本发明利用了蜂窝结构在力学上的稳定性、多级分形特点来进行大系统、大数据的组织和管理但具体应用并不仅限于此,不限制节点的内容种类以及其提供的任何种类和形式的信息,对于任何复杂系统和大数据,可以提供分形多级管理结构,便于快速查询、检索以及展示。本发明所述基于蜂窝结构的大系统、大数据的组织和管理方法和系统可扩展至分形多级管理体系,中央区和环绕区的划分、中央区和环绕区的功能界定,根细胞、干细胞、基细胞等思想和方法的利用等。本发明所述技术方案可根据任意两点之间的最小距离,计算出蜂窝结构中单元格(Cell)的边长,采用递归方法生成蜂窝结构,实现对信息点的全覆盖,使每一个单元格里包含最多只有一个信息点,这样保证单元格与信息点的对应关系。本发明所述技术方案根据生成的蜂窝结构,用多级分形的思想快速对每一个单元格(Cell)进行编码,编码规则前文所述,这样每一个信息点均有一个唯一的ID,也是检索号,便于信息的查询和使用。本发明所述技术方案根据信息的特点和单元格的编码,可以快速实现信息的查询和检索,并能快速定位,展示该信息点的详细数据,同时可以计算其他各种相关参数,例如与其他单元格的位置、关系,与各级中心单元格的距离、隶属关系等。

综上所述,本发明所述技术方案基于分形多级蜂窝网格进行大数据信息的组织和管理,结构简洁清晰,适用于任意复杂大系统或者是大数据,均可以进行清楚的划分和分级;本发明所述技术方案可以广泛适用管理众多而复杂的信息,作为新型的存储以及搜索手段,以达到快速获取所需信息的目的;本发明所述技术方案可扩展至人类的社会管理,大型城市规划布局,硬盘数据存储,大型数据库的设计,海量数据分类和检索等领域。

显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定,对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动,这里无法对所有的实施方式予以穷举,凡是属于本发明的技术方案所引伸出的显而易见的变化或变动仍处于本发明的保护范围之列。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号