首页> 中国专利> 一种基于网络特征的专利技术质量分级方法及系统

一种基于网络特征的专利技术质量分级方法及系统

摘要

本发明公开了一种基于网络特征的专利技术质量分级方法,包括:S1:获取专利信息;S2:构建IPC分类号的有向加权网络;S3:计算网络的网络特征指标,衡量IPC分类号的新颖性和典型性;S4计算专利的新颖性和典型性,并以两者为依据将专利分为多类,最后根据被引数信息,为多类专利划分等级;S5:以网络特征指标为自变量,被引数为因变量进行回归分析,确定网络特征指标与被引数之间的关系。本发明还包括一种基于网络特征的专利技术质量分级方法系统,由数据获取与存储模块、网络构建模块、专利分级模块、被引数预测模块、用户界面组成。本发明不仅能对专利进行分级,还能预测新申请专利的未来被引数,可以为申请人有针对性地处理专利未来事项提供参考。

著录项

  • 公开/公告号CN113112379A

    专利类型发明专利

  • 公开/公告日2021-07-13

    原文格式PDF

  • 申请/专利权人 浙江工业大学;

    申请/专利号CN202110292581.0

  • 申请日2021-03-18

  • 分类号G06Q50/18(20120101);G06Q10/06(20120101);G06F16/36(20190101);

  • 代理机构33201 杭州天正专利事务所有限公司;

  • 代理人王兵

  • 地址 310014 浙江省杭州市下城区潮王路18号

  • 入库时间 2023-06-19 11:49:09

说明书

技术领域

本发明涉及网络科学领域领域,尤其涉及一种基于网络特征的专利分级方法及系统。

背景技术

随着科学技术的发展,上至国家,下至企业,都越来越注重对自己的高新技术的保护,其中保护技术的最重要的途径之一就是为技术申请专利。技术是个体发明者单独努力或者集体合作的结果,在专利制度出现之前,技术大多数都是以实物为载体向人们展示特点,专利制度出现后,技术又多了一种向人们展示其特点的载体——专利文件。专利文件能够有效展示发明的技术单元及技术单元间的组合方式、技术效果等有关信息,所以在研究发明技术的典型性以及新颖性时,往往使用具体的专利文件来替代抽象的发明技术。研究者在研究发明技术时,一般着重于发明技术价值的研究,而发明技术价值又与技术的典型性与新颖性紧密相连,两者共同决定了发明技术的最终价值,因此研究者在研究发明技术价值时更倾向于使用专利文件中的各个指标来衡量发明技术价值。

公开号为CN110298545A的一种基于神经网络的专利评价方法、系统和介质专利公开了一种以神经网络和相似性计算和基础的专利技术质量评价方法。该方法首先以论文与专利之间的相似性为基础,同时将该相似性计算结果与论文的引用情况、论文发表时间、论文发表期刊、论文作者等多个因素输入神经网络进行训练,形成论文与评价专利之间的技术质量评价模型。这种方法需要的数据量非常大,同时计算过程十分复杂,计算用到的参数非常多,评估效率十分低下。

公开号为CN109902168A的一种专利评价方法和系统专利公开了一种专利评价方法和系统,通过自然语言处理和复杂网络算法将专利以技术集群方式聚合,赋予专利科学技术属性,并置于全球同行业技术中进行评价。自然语言处理和复杂网络算法需要大量的数据进行训练,为了同全球同行业技术的专利进行比对,更是需要大量的时间来进行,算法效率依然十分低下。

发明内容

本发明要克服现有技术的上述缺点,提供一种基于网络特征的专利技术质量分级方法及系统,能更快地对专利进行分级,并对专利的被引数进行预测。

为实现上述目的,本发明提供了如下方案:

一种基于网络特征的专利技术质量分级方法,包括以下步骤:

S1:从互联网获取专利的各项信息,包括但不限于专利的IPC分类号、被引数等信息,储存在数据库中;

S2:用数据库中的专利信息构建IPC分类号的有向加权网络;

S3:计算S2步骤中构建的有向加权网络的网络特征指标,用网络特征指标来衡量IPC分类号的新颖性和典型性;

S4:通过S3步骤计算出的网络特征指标计算专利的新颖性和典型性,并以两者为依据将数据库中的专利分为多类,最后根据每一类专利的被引数信息,为多类专利划分等级;

S5:以S3步骤中计算出的网络特征指标为自变量,被引数为因变量进行多项式回归分析,确定网络特征指标与被引数之间的关系,用这个关系来预测新申请专利的未来被引数。

进一步地,步骤S2中构建有向加权网络的具体方法如下:网络中的源节点为每项专利中的主分类号,目标节点为每项专利中的除了主分类号以外的分类号,连边方向由源节点指向目标节点,连边权重为连边在有向加权网络中出现的次数。

优选地,步骤S3中所述的网络特征指标包括节点的入度和出度,节点的入度表示IPC分类号的典型性,节点的出度的负数表示IPC分类号的新颖性。

优选地,步骤S4具体包括:

S4.1:专利新颖性和典型性的计算:具体方法如下:(1)对于只有一个分类号的专利,专利的新颖性等于分类号的新颖性,专利的典型性等于分类号的典型性;(2)对于具有两个及以上分类号的专利,专利的新颖性为其余分类号的平均新颖性,专利的典型性为主分类号的典型性;

S4.2:根据计算得出的专利的新颖性和典型性,将专利分为四组,具体方法为:先为新颖性和典型性划定两个分界点,然后按照新颖性和典型性的高低,将专利分为低典型性低新颖性类,低典型性高新颖性类,高典型性低新颖性类,高典型性高新颖性类,然后计算每一类专利的高被引专利占比,其中高被引专利定义为被引数占同年所有专利被引数前5%的专利,根据高被引专利占比的高低,将所述四类专利分为I级—IV级专利。

优选地,步骤S5中的自变量包括节点的入度和出度,多项式回归公式为:

其中,y

一种基于网络特征的专利技术质量分级系统,包括数据获取与存储模块、网络构建模块、专利分级模块、被引数预测模块、用户界面;

所述数据获取与存储模块从互联网获取专利的各项信息,包括但不限于专利的IPC分类号、被引数等信息,储存在数据库中;

所述网络构建模块通过数据库中的专利信息构建IPC分类号的有向加权网络,具体方法如下:网络中的源节点为每项专利中的主分类号,目标节点为每项专利中的除了主分类号以外的分类号,连边方向由源节点指向目标节点,连边权重为连边在有向加权网络中出现的次数;

所述专利分级模块通过计算网络构建模块构建的有向加权网络的各项网络特征指标,衡量IPC分类号的新颖性和典型性,从而计算专利的新颖性和典型性,并以两者为依据将数据库中的专利分为多类,最后根据每一类专利的被引数信息,为多类专利划分等级;

所述被引数预测模块以专利分级模块中计算出的网络特征指标为自变量,被引数为因变量进行多项式回归分析,确定网络特征指标与被引数之间的关系,用这个关系来预测新申请专利的未来被引数,

所述的数据获取与存储模块连接在网络构建模块之前,所述专利分级模块、被引数预测模块并联在网络构建模块之后。

用户交互界面,用户在这个界面将新申请专利的IPC分类号输入,然后经过其他模块的计算,得出专利分级的结果和被引数的预测,用户根据本系统的结果,有针对性地处理这个新申请的专利。

本发明的技术构思:通过将网络科学的知识引入到专利评价领域,将IPC分类号构建成有向加权的IPC分类号网络,由于这个分类号网络在构建的时候使用了专利内的IPC分类号信息,使得这个分类号网络可以反映在某个地区或国家内的技术单元使用情况,包括技术之间的配对或者单独使用。然后用网络特征指标来量化IPC分类号的新颖性与典型性,从而去计算专利技术特征的新颖性与典型性。然后根据专利技术特征的新颖性和典型性进行分组,计算每组的高被引专利占比,从而为几组专利进行分级。同时使用多项式回归分析专利技术特征的新颖性和典型性与被引数之间的关系,从而达到预测新申请的专利在未来受到的被引数的目的。

本发明的有益效果:使用IPC分类号构建网络,基于专利的技术领域角度出发分析专利技术特征的新颖性和典型性,使得计算出来的新颖性和典型性更加贴近专利实际上的新颖性和典型性,同时使用网络的方式计算网络特征指标,计算时间较之机器学习算法大大缩短。同时使用多项式回归分析确定专利技术特征新颖性和典型性与被引数之间存在的关系,从而使得新申请的专利可以使用申请专利时就具有的IPC分类号情况来预测专利未来可能会受到的被引数,从而为申请人对专利后续的处理提供有效的参考。

附图说明

图1为本发明的专利分级方法流程图;

图2为本发明的被引数预测方法流程图;

图3为本发明的系统结构示意图。

具体实施方式

下面结合说明书附图对本发明的具体实施方式作进一步详细描述。

参照图1至图3,本发明公开了一种基于网络特征的专利技术质量分级方法及系统,其中的一种基于网络特征的专利技术质量分级方法包括以下步骤:

S1:从互联网获取专利的各项信息,包括但不限于专利的IPC分类号、被引数等信息,储存在数据库中,在本实施例中,我们的数据库中包含的数据为2001年-2016年中国电通信领域的授权专利;

S2:用数据库中的专利信息构建IPC分类号的有向加权网络;

S3:计算S2步骤中构建的有向加权网络的网络特征指标,用网络特征指标来衡量IPC分类号的新颖性和典型性;

S4:通过S3步骤计算出的网络特征指标计算专利的新颖性和典型性,并以两者为依据将数据库中的专利分为多类,最后根据每一类专利的被引数信息,为多类专利划分等级;

S5:以S3步骤中计算出的网络特征指标为自变量,被引数为因变量进行多项式回归分析,确定网络特征指标与被引数之间的关系,用这个关系来预测新申请专利的未来被引数。

步骤S2中构建有向加权网络的具体方法如下:网络中的源节点为每项专利中的主分类号,目标节点为每项专利中的除了主分类号以外的分类号,连边方向由源节点指向目标节点,连边权重为连边在有向加权网络中出现的次数。

步骤S3中所述的网络特征指标包括节点的入度和出度,节点的入度表示IPC分类号的典型性,节点的出度的负数表示IPC分类号的新颖性。

步骤S4具体包括:

S4.1:专利新颖性和典型性的计算:具体方法如下:(1)对于只有一个分类号的专利,专利的新颖性等于分类号的新颖性,专利的典型性等于分类号的典型性;(2)对于具有两个及以上分类号的专利,专利的新颖性为其余分类号的平均新颖性,专利的典型性为主分类号的典型性;

S4.2:根据计算得出的专利的新颖性和典型性,将专利分为四组,具体方法为:先为新颖性和典型性划定两个分界点,然后按照新颖性和典型性的高低,将专利分为低典型性低新颖性类,低典型性高新颖性类,高典型性低新颖性类,高典型性高新颖性类,然后计算每一类专利的高被引专利占比,其中高被引专利定义为被引数占同年所有专利被引数前5%的专利,根据高被引专利占比的高低,将所述四类专利分为I级—IV级专利。

步骤S5中的自变量包括节点的入度和出度,多项式回归公式为:

其中,y

其中的一种基于网络特征的专利技术质量分级系统,包括数据获取与存储模块、网络构建模块、专利分级模块、被引数预测模块、用户交互界面;

所述数据获取与存储模块从互联网获取专利的各项信息,包括但不限于专利的IPC分类号、被引数等信息,储存在数据库中。

所述网络构建模块通过数据库中的专利信息构建IPC分类号的有向加权网络,具体方法如下:网络中的源节点为每项专利中的主分类号,目标节点为每项专利中的除了主分类号以外的分类号,连边方向由源节点指向目标节点,连边权重为连边在有向加权网络中出现的次数。

所述专利分级模块计算S2步骤中构建的有向加权网络的网络特征指标,用网络特征指标来衡量IPC分类号的新颖性和典型性,所述的网络特征指标包括节点的入度和出度,节点的入度表示IPC分类号的典型性,节点的出度的负数表示IPC分类号的新颖性。再以S3步骤中计算出的网络特征指标为自变量,被引数为因变量进行多项式回归分析,确定网络特征指标与被引数之间的关系,用这个关系来预测新申请专利的未来被引数。具体包括:S4.1:专利技术特征的新颖性和典型性的计算:具体方法如下:(1)对于只有一个分类号的专利,专利技术特征的新颖性等于分类号的新颖性,专利技术特征的典型性等于分类号的典型性;(2)对于具有两个及以上分类号的专利,专利技术特征的新颖性为其余分类号的平均新颖性,专利技术特征的典型性为主分类号的典型性;

S4.2:根据计算得出的专利技术特征的新颖性和典型性,将专利分为四组,具体方法为:先为新颖性和典型性划定两个分界点,然后按照新颖性和典型性的高低,将专利分为低典型性低新颖性类,低典型性高新颖性类,高典型性低新颖性类,高典型性高新颖性类,然后计算每一类专利的高被引专利占比,其中高被引专利定义为被引数占同年所有专利被引数前5%的专利,根据高被引专利占比的高低,将所述四类专利分为I级—IV级专利。

所述被引数预测模块以专利分级模块中计算出的网络特征指标为自变量,被引数为因变量进行多项式回归分析,确定网络特征指标与被引数之间的关系,用这个关系来预测新申请专利的未来被引数,具体包括:所述S5中的自变量包括节点的入度和出度,多项式回归公式为:

其中,y

所述的数据获取与存储模块连接在网络构建模块之前,所述专利分级模块、被引数预测模块并联在网络构建模块之后,用户交互界面连接在专利分级模块和被引数预测模块之后。

本系统还包括有用户交互界面,用户可以在这个界面将新申请专利的IPC分类号输入,然后经过其他模块的计算,得出专利分级的结果和被引数的预测,用户可以根据本系统的结果,有针对性地处理这个新申请的专利。

本说明书实施例所述的内容仅仅是对发明构思的实现形式的列举,本发明的保护范围不应当被视为仅限于实施例所陈述的具体形式,本发明的保护范围也及于本领域技术人员根据本发明构思所能够想到的等同技术手段。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号