首页> 中国专利> 一种基于合同知识库的合同文件审查分析方法

一种基于合同知识库的合同文件审查分析方法

摘要

一种基于合同知识库的合同文件审查分析方法,属于数据处理领域,所述的基于合同知识库的合同文件审查分析方法用以下步骤实现,步骤1.通过人工构建合同知识库及合同范本库;步骤2.对合同知识信息记录及合同范本进行分类标注;步骤3.针对一份新的合同文本,运用词频计算文本相似度的方法与合同范本进行匹配,确定合同文本分类,进而与合同知识库内容进行匹配。本发明对合同文本进行自动审查分析,查找错误条款和遗漏条款,可以协助合同使用和审查者高效快速的完成合同的校对、审批等工作,合同知识库的形式能够让实时维护,不断提升审查分析准确率。

著录项

  • 公开/公告号CN112632958A

    专利类型发明专利

  • 公开/公告日2021-04-09

    原文格式PDF

  • 申请/专利权人 红塔烟草(集团)有限责任公司;

    申请/专利号CN202011430666.2

  • 申请日2020-12-07

  • 分类号G06F40/205(20200101);G06F40/169(20200101);G06F40/151(20200101);G06F40/106(20200101);G06F40/194(20200101);G06F16/35(20190101);G06F16/34(20190101);

  • 代理机构11453 北京名华博信知识产权代理有限公司;

  • 代理人李中强

  • 地址 653100 云南省玉溪市红塔区红塔大道118号

  • 入库时间 2023-06-19 10:32:14

说明书

技术领域

本发明属于数据处理领域,更具体的说涉及一种基于合同知识库的合同文件审查分析方法。

背景技术

随着经济社会的发展,企业中大量的经济活动都需要合同建立关系,明确双方的权利和义务,合同的交易对方既包括个人,也包括企业法人等。每一条合同条款都对未来合同履行有着极为重要的影响和意义,因此企业对合同文件是否合规,是否符合公司管理要求及自身经济利益极为重视。

合同文件的编写对编写人员有较强的法律知识和经验的要求,因此企业往往针对自身业务需求,将主要合同进行分类管理,并按照合同分类制订不同合同范本模板,合同使用人员在合同范本基础上进行修改最终形成对外签订的合同。

企业为增加合同的规范性,防范法律风险,在企业内部往往有财务、审计和法务等人员对合同进行审核的管理流程,面对企业庞大的合同数量,合同审核人员面临着“如何快速准确地识别出合同存在的问题,高质量地评价审核合同文件”的难题。

目前,现有的合同分析方案或文献中,没有有效利用企业内部已有的合同知识和人员经验,大多关注单纯使用机器进行合同分析的方法,机器分析容易产生分析准确率波动较大,对个例和特殊情况的处理能力较弱的缺陷。

发明内容

本发明针对合同人工审核效率低、容易出现遗漏的问题,提供一种基于合同知识库的合同文件审查分析方法及系统。

为了实现上述目的,本发明是采用以下技术方案实现的:所述的基于合同知识库的合同文件审查分析方法用以下步骤实现,步骤1.构建一个合同知识库包括常用条款、必要条款、特殊条款、关键词、常见错误条款和违法违规条款等,将其以文字信息的形式存储到存储介质中,并对知识库中内容进行分类标注;

步骤2.构建一个合同范本库,将常用的合同范本以文字信息的形式存储到存储介质中,并将合同范本进行分类标注;

步骤3.接收终端设备获取的合同审查请求,所述合同审查分析请求包括合同电子文本,接收终端设备将合同电子文本转化为字符串流,对合同文本字符串流进行分词、去停用词及词频统计操作,将合同范本库中的合同范本转化为字符串流并进行分词、去停用词及词频TF统计操作;

步骤4.使用待审查分析合同词组队列和词频,分别与合同范本词组队列和词频进行文本相似度计算,对待审查分析合同与各个合同范本的文本相似度SA按大小进行排序,选取文本相似度SA最大的合同范本,通过合同范本明确待审查分析合同的分类;

步骤5.将待审查分析合同文本根据分类与对应的合同知识库信息进行匹配,对匹配结果进行整理后即为合同文本审查分析结果。

优选的,针对两个合同中每一组相同词组,计算词组相似度S=词频权重D*(词频差异度T)

优选的,逐条检索合同知识库中记录信息,如果合同文本和合同知识库记录分类相符合,则使用合同知识库记录在合同文本字符串流中进行查找、比对及逻辑判断等操作。

优选的,所述的系统包含数据存储模块、数据导入模块、数据分析模块、结果整理模块,所述数据存储模块用于存储、管理合同范本文本、合同知识库及待审查分析的合同文件数据,所述数据导入模块用于将合同范本文本、合同知识库及待审查分析的合同文件数据格式化后导入到数据分析模块,所述数据分析模块用于将所接受到的信息按照上述基于合同知识库的合同审查方法进行处理和运算并输出分析结果,所述结果整理模块用于将分析结果进行整理和格式化,便于输出和可视化。

优选的,所述的系统还包括前端展示模块,所述前端展示模块用于展示合同范本文本、合同知识库及待审查分析的合同文件的存储、导入和分析过程,并在前端模块中进行相关操作,以及以便于阅读的方式展示合同审查分析的最终分析结果。

本发明有益效果:

通过词频统计分析算法将合同文本与合同范本进行匹配,明确合同文本所使用的合同范本,从而自动判定合同的分类属性,提升合同文本分类的判定效率和准确率,同时可以显示出合同编写是否使用正确的合同范本,二、基于合同知识库进行合同文本的匹配审查分析,能够充分利用已有的合同审查素材和经验,避免机器分析容易产生分析准确率波动较大的问题,对个例和特殊情况的处理也有较好的处理能力,在该方法及系统使用过程中,出现新情况和新问题,可以实时对合同知识库进行维护,随着审查人员经验的积累,不断提升系统输出结果的准确性。

附图说明

图1是本发明创建、存储、管理合同知识库和合同范本库的流程示意图;

图2是本发明通过合同词频分析匹配合同分类流程示意图;

图3是待审查分析合同与合同知识库匹配分析的流程示意图;

图4是本发明合同文件审查分析系统的系统框图。

具体实施方式

现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本公开的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、步骤。

实施例一、

如图所示,构建一个合同知识库包括常用条款、必要条款、特殊条款、关键词、常见错误条款和违法违规条款等,将其以文字信息的形式存储到存储介质中;

将合同知识库中的内容进行分类标注;

将常用的合同范本以文体信息的形式存储到存储介质中;

将合同范本进行分类标注;

接收终端设备获取的合同审查请求,所述合同审查分析请求包括合同电子文本;

接收终端设备将合同电子文本转化为字符串流;

对待审查分析的合同文本进行分词处理,得到待审查分析合同文本的分词处理结果;

对待审查分析的合同文本的分词处理结果去除停用词,得到待审查分析合同词组队列;

统计待审查分析合同词组队列中各词组的词频TF;

对所有合同范本的文本进行分词处理,得到合同范本文本分词处理结果;

分别对合同范本文本的分词处理结果去除停用词;得到合同范本词组队列;

分别统计合同范本词组队列中各词组的词频TF;

使用待审查分析合同词组队列和词频,分别与合同范本词组队列和词频进行文本相似度计算,包括以下步骤:

a、将待审查分析合同词组队列中词组与合同范本词组队列中词组进行匹配,查找相同词组

b、针对相同词组,计算词组相似度S=词频权重D*(词频差异度T)

c、词频差异度T值与该词组在两个合同中的词频差值成反比,词频差值越大词频差异度T值越小;

d、词频权重D值与该词组在两个合同中词频之和在两合同总词频数中所占比例成正比,词频占比高词频权重D值越大;

f、调整系数W为常量,根据分析结果的准确率进行调整;

e、将待审查分析合同词组队列与合同范本词组队列中的相匹配的词组相似度进行累加,生成待审查分析合同与合同范本的文本相似度SA;

对待审查分析合同与各个合同范本的文本相似度SA按大小进行排序,选取文本相似度SA最大的合同范本;

文本相似度SA最大的合同范本即为待审查分析合同所使用的合同范本,通过该合同范本的分类标注,确定待审查分析合同的分类;

根据待审查分析合同的分类调取对应的合同知识库信息;

将待审查分析合同文本与对应的合同知识库信息进行匹配,但不限于所提及的信息,包括以下步骤:

a、在审查分析合同文本中检索常用条款,输出待审查分析合同文本使用了哪些常用条款,未使用哪些常用条款的记录;

b、在审查分析合同文本中检索必要条款,输出待审查分析合同文本缺少哪些必要条款的记录;

c、在审查分析合同文本中检索特殊条款,输出待审查分析合同文本缺少哪些特殊条款的记录;

d、在审查分析合同文本中检索关键词,输出待审查分析合同文本缺少哪些特关键词的记录;

e、在审查分析合同文本中检索常见错误条款,输出待审查分析合同文本存在哪些常见错误条款的记录;

f、在审查分析合同文本中检索违法违规条款,输出待审查分析合同文本存在哪些违法违规条款的记录;

整理待审查分析合同文本与对应的合同知识库信息的匹配记录结果,输出待审查分析合同文本的审查分析结果;

另一方面,所提供基于合同知识库的合同审查分析系统,包括:数据存储模块、数据导入模块、数据分析模块、结果整理模块,所述数据存储模块用于存储、管理合同范本文本、合同知识库及待审查分析的合同文件数据,所述数据导入模块用于将合同范本文本、合同知识库及待审查分析的合同文件数据格式化后导入到数据分析模块,所述数据分析模块用于将所接受到的信息按照上述基于合同知识库的合同审查方法进行处理和运算并输出分析结果,所述结果整理模块用于将分析结果进行整理和格式化,便于输出和可视化;

进一步,本系统还包括前端展示模块,所述前端展示模块用于展示合同范本文本、合同知识库及待审查分析的合同文件的存储、导入和分析过程,并在前端模块中进行相关操作,以及以便于阅读的方式展示合同审查分析的最终分析结果。

实施例二、

该方法首先需要构建一个合同知识库,通过法律法规识别、从网路上收集、咨询律师和专家意见、汇总平时积累的合同审查经验等方式,形成合同知识库内容,包括但不限于常用合同条款文本、必要合同条款、关键词及关键要素、常见错误条款、违法违规条款等文本内容,知识库按条记录信息,将记录信息按知识类别进行分类,进一步地,对每一条记录按照所对应的合同类别进行分类标注,例如:数据保密条款必须出现在信息化投资项目合同中,则标记数据保密条款类别为Information invest,质保期要素必须出现在设备采购项目、设备维护项目中,则质保期要素标记为equipment purchase和equipment service,如果适用所有类型合同,则标记all。将所有合同知识信息使用xls、cvs类型文件或者数据库数据的方式存储到服务器或者其他电子设备中;

该方法还需要构建一个合同范本库,通过自行拟定、网络收集或者直接使用国家通用范本构建一个合同范本库,待审查分析的合同使用合同范本库中的范本进行合同编写,将合同范本进行分类标注,例如:合同范本为设备采购项目合同模板则标记为equipment purchase,合同范本为房屋租赁合同模板则标记为Housing rent,将所有合同范本以doc文件类型或者数据库数据的方式存储到服务器或者其他电子设备中;

该系统接收到待审查分析的合同文件后,通过将合同文件与合同范本进行文本相似度计算确定待审查分析的合同文件属于哪一类合同,其步骤如下:

a、将收到待审查分析合同文件转化为字符串流,进行分词处理,进一步去除停用词例如:“的”、“等”或者“!”的标点符号,统计分词结果每一个词组在该合同中出现的频数,将所有分词结果和其统计词频形成元祖队列,例如:[(维修,87)、(标准,61)、(质量、35).....],代表“维修”一词在合同中出现了87次,“标准”一词在合同中出现了61次;

b、将合同范本文件转化为字符串流,进行分词处理,进一步去除停用词例如:“的”、“等”或者“!”的标点符号,统计分词结果每一个词组在该合同中出现的频数,将所有分词结果和其统计词频形成元祖队列,例如:[(维修,62)、(标准,38)、(货物、22).....],代表“维修”一词在合同中出现了62次,“标准”一词在合同中出现了38次;

c、将收到待审查分析合同与合同范本的分词结果和其统计词频形元祖队列进行词频相似度计算S=词频权重D*(词频差异度T)

d、本例中词频差异度T值为两个词组词频小的值除以词频大的值;

e、本例中词频权重D值为两个词组词频值之和除以两个合同所有词组词频值之和;

f、本例中调整系数W为常量,取值为1.05;

g、将待审查分析合同与合同范本词组队列中的相匹配的词组相似度进行累加,生成待审查分析合、同与合同范本的文本相似度SA

对待审查分析合同与各个合同范本的文本相似度SA按大小进行排序,选取文本相似度SA最大的合同范本;

表一合同范本相似度排序表

文本相似度SA最大的合同范本即为待审查分析合同所使用的合同范本,通过该合同范本的分类标注,确定待审查分析合同的分类为equipment service;

根据待审查分析合同的分类equipment service,与合同知识库中标记为equipment service和all的内容进行匹配,包括不限于常用条款、必要条款、特殊条款、关键词、常见错误条款等记录;

整理待审查分析合同文本与对应的合同知识库信息的匹配记录结果,将匹配记录结果信息整理成报告形式,输出待审查分析合同文本的审查分析结果,在系统前端展示模块中进行显示。

以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的仅为本发明的优选例,并不用来限制本发明,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号