首页> 中国专利> 基于神经网络算法的文理分割方法及系统

基于神经网络算法的文理分割方法及系统

摘要

本申请公开了一种基于神经网络算法的文理分割方法及系统,该方法包括:获取目标试卷图像,目标试卷图像为文综试卷或理综试卷的扫描图像;将目标试卷图像输入目标神经网络模型进行识别,得到目标试卷图像中每道试题的识别结果;基于识别结果对每道试题进行分类,得到多个目标试题集;根据试题集与等级性考试科目之间的映射关系,将目标试题集中的试题存储于所述目标试题集对应的目标等级性考试科目的内存块中,使得对传统的文理科试卷进行分割后得到的每道试题可以存储到对应的等级性考试科目的内存块中,从而为自动生成“新高考”模型下的考试试卷提供试题资源。

著录项

  • 公开/公告号CN112560849A

    专利类型发明专利

  • 公开/公告日2021-03-26

    原文格式PDF

  • 申请/专利权人 中天恒星(上海)科技有限公司;

    申请/专利号CN202110092477.7

  • 发明设计人 黄永;

    申请日2021-01-24

  • 分类号G06K9/20(20060101);G06K9/32(20060101);G06K9/34(20060101);G06K9/40(20060101);G06K9/46(20060101);G06K9/62(20060101);G06N3/04(20060101);G06N3/08(20060101);

  • 代理机构44682 深圳知帮办专利代理有限公司;

  • 代理人谭慧

  • 地址 200000 上海市长宁区威宁路470号1179室

  • 入库时间 2023-06-19 10:24:22

说明书

技术领域

本申请涉及计算机技术领域,尤其涉及一种基于神经网络算法的文理分割方法及系统。

背景技术

从2020年起,我国大部分地区都逐渐采用“新高考”的模式,按照新的高考改革方案,不再文理分科,将传统的文科和理科重新进行分割。一些省份采用“3+3”新高考选科模式 ,除了语文、数学、外语外,学生可从思想政治、历史、地理、物理、化学、生物6门等级性考试科目中再任选三门,赋予了学生充分的自由选择权,可以自主决定科目组合。一些省份采用“3+1+2”新高考选科模式,学生必须在物理和历史等级性考试科目中选择一科,再在剩余的4门等级性考试科目中再任选两门。随着考试模式的改变,考试形式、考试题型和考试题量等也都进行了变化。

由于改革方案刚开始执行,现有的试卷都是传统模式下的文科试卷(文综)和理科试卷(理综),“新高考”模型下的考试试卷很少。而“新高考”模型下的一张试卷的生成无法直接采用之前的试卷,只能由命题老师根据当前的考试要求,从复习资料、习题集、历年试卷等资源中寻找相关试题,然后根据个人经验筛选符合考试要求的试题来生成一张试卷,上述方法需要手动选取题目,其需要耗费大量的时间和精力,效率低下。

因此,何如将传统的文理科试卷进行分割来生成“新高考”模型下的考试试卷成为亟待解决的问题。

发明内容

本申请实施例提供一种基于神经网络算法的文理分割方法及系统,可以将传统的文理科试卷进行分割,使得每道试题可以存储到对应的等级性考试科目的内存块中,为自动生成“新高考”模型下的考试试卷提供试题资源。

第一方面,本申请实施例提供一种基于神经网络算法的文理分割方法,所述方法包括:

获取目标试卷图像,所述目标试卷图像为文综试卷或理综试卷的扫描图像;

将所述目标试卷图像输入目标神经网络模型进行识别,得到所述目标试卷图像中每道试题的识别结果;

基于所述识别结果,对所述每道试题进行分类,得到多个目标试题集;

根据试题集与等级性考试科目之间的映射关系,将所述目标试题集中的试题存储于所述目标试题集对应的目标等级性考试科目的内存块中。

第二方面,本申请实施例提供一种基于神经网络算法的文理分割系统,所述系统包括:

获取单元,用于获取目标试卷图像,所述目标试卷图像为文综试卷或理综试卷的扫描图像;

识别单元,用于将所述目标试卷图像输入目标神经网络模型进行识别,得到所述目标试卷图像中每道试题的识别结果;

分类单元,用于基于所述识别结果,对所述每道试题进行分类,得到多个目标试题集;

存储单元,用于根据试题集与等级性考试科目之间的映射关系,将所述目标试题集中的试题存储于所述目标试题集对应的目标等级性考试科目的内存块中。

第三方面,本申请实施例提供了一种计算机可读存储介质,其中,上述计算机可读存储介质存储用于电子数据交换的计算机程序,其中,上述计算机程序使得计算机执行如本申请实施例第一方面任一方法中所描述的部分或全部步骤。

可以看出,本申请提供的技术方案,通过获取目标试卷图像,目标试卷图像为文综试卷或理综试卷的扫描图像;将目标试卷图像输入目标神经网络模型进行识别,得到目标试卷图像中每道试题的识别结果;基于识别结果对每道试题进行分类,得到多个目标试题集;根据试题集与等级性考试科目之间的映射关系,将目标试题集中的试题存储于所述目标试题集对应的目标等级性考试科目的内存块中,使得对传统的文理科试卷进行分割后得到的每道试题可以存储到对应的等级性考试科目的内存块中,从而为自动生成“新高考”模型下的考试试卷提供试题资源。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本申请实施例提供了一种基于神经网络算法的文理分割方法的流程示意图;

图2a是本申请实施例提供的一种目标试卷图像分割的示意图;

图2b是本申请实施例提供的一种目标试卷图像中第一区域的示意图;

图2c是本申请实施例提供的一种图像分割模型结构的示意图;

图3本申请实施例提供了一种基于神经网络算法的文理分割系统的示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是在一个可能的示例中还包括没有列出的步骤或单元,或在一个可能的示例中还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。

在本文中提及“实施例”意味着,结合实施例描述的特定特征、结果或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。

请参阅图1,图1是本申请实施例提供了一种基于神经网络算法的文理分割方法的流程示意图,如图1所示,本基于神经网络算法的文理分割方法包括以下操作。

S110、获取目标试卷图像,所述目标试卷图像为文综试卷或理综试卷的扫描图像。

其中,目标试卷图像可以是通过扫描仪或使用摄像头等电子设备采集的传统高考模型下的历年文综试卷或理综试卷,也可以是存储的历年文综试卷或理综试卷的图片或图片格式的文档,本申请实施例对此不做限定。

S120、将所述目标试卷图像输入目标神经网络模型进行识别,得到所述目标试卷图像中每道试题的识别结果。

在具体实现中,在对目标试卷图像进行识别前,可以先对目标试卷图像进行预处理,以减少目标试卷图像中的无用信息,以便方便后面的处理。对目标试卷图像进行预处理,可以进行二值化、降噪、字符切分、归一化等处理操作,经过二值化后可以将目标试卷图像的灰度图像转换为二值图像,对图像上的像素点的灰度值设置为0或255;降噪可以根据噪声的特征对目标试卷图像执行去噪处理;字符切分则是将目标试卷图像中的文字分割成单个文字进行识别。如果文字行倾斜的话往往还要进行倾斜校正。归一化则是将单个的文字图像规整到同样的尺寸,使得所有的文字图像在同一个规格下应用统一的算法。

可选的,所述将所述目标试卷图像输入目标神经网络模型进行识别,得到所述目标试卷图像中每道试题的识别结果,包括:

将所述目标试卷图像从第一方向进行分割,得到第一中间图像和第二中间图像,所述第一中间图像包括所述目标试卷图像的第一版面信息,所述第二中间图像包括所述目标试卷图像的第二版面信息;对所述第一中间图像和所述第二中间图像的第一区域进行识别,得到所述每道试题的起止位置;根据所述每道试题的起止位置,对所述第一中间图像和所述第二中间图像从第二方向分别进行分割,得到多张目标试题图像;将所述多张目标试题图像输入所述目标神经网络进行文本识别,得到所述目标试卷图像的识别结果。

其中,传统的高考试卷采用的是A3尺寸的纸,且每一面纸包括第一版面信息和第二版面信息,第一版面信息位于纸的左侧,第二版面信息平行位于纸的右侧。如图2a所示,从第一方向对目标试卷图像进行分割,得到包括第一版面信息的第一中间图像和包括第二版面信息的第二中间图像,从而切掉无效的那部分图像,例如空白图像,得到仅含目标文字行的中间图像。

所述第一方向可以是目标试卷图像的纵轴方向,即在目标试卷图像的中间,从纵轴方向对目标试卷图像进行等长分割,得到大小相同的第一中间图像和第二中间图像。

示例性地,也可以根据第一分割线对目标试卷图像进行分割,第一分割线可以为纵轴方向或横轴方向,第一分割线为与文本内容之间的距离大于或等于第一阈值的分割线或与目标试卷图像的边框之间的距离大于或等于第二阈值的分割线。第一阈值和第二阈值可以是预先根据高考试卷格式预先设置的。

进一步地,目标试卷图像中包括多道试题,每道试题根据题号进行排列,通过每道试题的题号可以将目标试卷图像中的试题进行区分。由于试题的题号位于第一中间图像和第二中间图像的第一区域,该第一区域可以是第一中间图像和第二中间图像中最左侧的区域,或者是第一中间图像和第二中间图像中距离左侧边框第一距离的区域,如图2b所示。将所述第一区域的图像进行图像识别,识别出每道试题的题号,并记录每道试题的题号距离第一中间图像或第二中间图像的上边框的位置。根据当前试题题号的位置与下一试题题号的位置,计算出当前试题在目标试卷图像的起止位置,例如第一道试题的题号距离第一中间图像上边框的位置为50mm,第二道试题的题号距离第一中间图像上边框的位置为60mm,则第一道试题的起止位置为(50,60)。按照题号的顺序以及每道试题的起止位置对第一中间图像和第二中间图像进行分割,具体为在每道试题的起止位置+x的位置从横轴方向分割,得到每道试题的目标试题图像,x可以根据高考试卷的行间距设置。

示例性地,若第二中间图像中的第一行的第一个字符为试题的题号,则认为第一中间图像中的试题是完整的;若第二中间图像中的第一行的第一个字符不是试题的题号,则将从第二中间图像分割出的最上方的目标试题图像与第一中间图像分割出最下方的目标试题图像进行上下拼接,得到完整的试题图像。

在一种可能的示例中,所述对所述第一中间图像和所述第二中间图像的第一区域进行识别,得到所述每道试题的起止位置;根据所述每道试题的起止位置,对所述第一中间图像和所述第二中间图像从第二方向分别进行分割,得到多张目标试题图像,包括:

将所述第一中间图像和所述第二中间图像的第一区域进行切行,得到n张行图像,n为正整数;提取所述n张行图像的第一特征向量和第二特征向量,所述第一特性向量为所述第一区域的RGB值组成的三维矩阵,所述第二特性向量为所述第一区域的周长、面积、最长轴组成的三维矩阵;将第一特征向量与第二特征向量进行首尾拼接,得到目标拼接向量,将目标拼接向量输入到图像分割模型的共享子模型,得到每张行图像中的第一后验概率,所述共享子模型包括多个神经网络运算(包括卷积运算、激活运算、乘积运算等),所述第一后验概率为行图像中包括文本内容的概率;将所述行图像的第一后验概率按照n张行图像的切分顺序进行组合得到第一概率向量(维度为1

其中,图像分割模型根据输入的目标拼接特征向量进行逐行解码,该图像分割模型可以为Multi-task的深度学习网络。如图2c所示,图像分割模型包括共享子模型、第一任务层和第二任务层,所述共享子模型可以包括多层的卷积神经网络和循环神经网络,所述第一任务层用于执行文本识别任务,所述第二任务层用于执行试题题号位置确定任务。

具体地,图像分割模型可对每张行图像进行分类,分类的类型包括文本和非文本。将目标拼接特征向量输入到文本识别模型的共享子模型后,所述共享子模型输出每张行图像中的包括文本的后验概率。

进一步地,将每张行图像中的包括文本的后验概率分别作为所述第一任务层的输入。所述第一任务层采用文本识别策略,根据每张行图像中的包括文本的后验概率,计算出第二概率向量,所述第二概率向量为每张行图像中的文本内容为目标数字的后验概率向量,从而根据第二概率向量的值解析出第一中间图像和第二中间图像中每道试题的题号。

然后,将每道试题的题号和第一后验概率作为所述第二任务层的输入。第二任务层根据该每道试题的题号和每张行图像中的包括文本的后验概率,确定每张行图像中的第三概率向量,进而确定每张行图像中试题题号是否在目标试卷图像的预设横坐标位置,得到第一中间图像或第二中间图像的分割线。所述分割线为每道试题题号纵坐标+y的水平线,y可以根据高考试卷的行间距设置。

上述技术方案通过在第一区域中识别分割线来实现对第一中间图像或第二中间图像的图像分割,减少了图像分割的运算量,并且结合两种特征采用Multi-task的深度学习网络来识别试题题号,根据试题题号的坐标进行分割,保证了每道试题的完整性,并提高了图像分割的准确性。

可选的,所述目标神经网络模型包括文本识别模型。

在本申请实施例中,目标神经网络模型可以是用于识别目标试题图像中的文本内容的文本识别模型,该文本识别模型可以是卷积神经网络、循环神经网络等。

所述将所述目标试题图像输入所述目标神经网络进行文本识别,得到所述目标试卷图像的识别结果,包括:

将所述目标试题图像输入所述文本识别模型,得到每道试题的文本识别结果和文本格式;根据所述每道试题的文本格式,将所述每道试题的文本识别结果转换成目标文本;根据所述每道试题的起止位置,组合所述每道试题的目标文本,得到所述目标试卷图像的识别结果。

其中,通过文本识别模型中的特征提取层,例如卷积层,提取目标试题图像的文字特征,该文字特征可以为几何特征,如文字位置、面积、文字线条的端点、折点、交点等。之后根据文字特征生成特征向量,并通过全连接层对中间特征向量进行处理,从而可以获得待识别文字图像中的文字是各个预设文字的概率,并以多维特特征向量的形式进行表达,最后将多维特征向量输入到文字识别模型中的输出层进行转换,从而可以输出对待识别文字图像中的文字进行识别的结果,该识别结果中包括识别出的文本识别结果和文本格式,实现了可以准确的对图像中的文字进行识别,并且通过所述文字识别模型进行文字识别,可以避免形似的文字出现识别不准确的问题,进一步提高了文字识别准确率。

进一步地,文本格式可以包括文本的字体大小、行间距、文字排列方式等。在高考试卷中可能包括图像、表格、公式等非文字字符。通过确认非文字字符的文本格式,可以将文本识别结果转换成与高考试卷格式相同的目标文本。

可选的,所述将从所述目标试题图像中提取的特征向量输入所述文本识别模型,得到每道试题的文本识别结果和文本格式,包括:

按照预设行距,分别对所述目标试题图像从左到右分别进行识别;若第一字符的识别结果为非文本字符,对所述第一字符进行标注,并记录所述第一字符的起止坐标,根据所述起止位置确认所述第一字符的目标行距和目标面积;若所述第一字符的识别出结果为文字符号,根据预设行距和预设字体确认所述第一字符的目标行距和目标面积。

其中,高考试卷一般采用固定的格式,如中文部分一般选用宋体,若题目中如果有材料分析题,材料部分用楷体,英文、数字部分选用Times New Roman;正文均用宋体五号,试卷里有运用到表格的,那表格内的文字需要设置为居中,字号使用宋体五号字等。因此,在本申请实施例中,可以根据识别预设行距内的文本内容,该预设行距大于或等于所述试卷的行间距。具体地,按照预设行距从上到下、从左到右依次对目标试题图像进行识别,若识别出第一字符的识别结果为非文字字符,如表格、图、公式等,对该第一字符进行标注,并记录该第一字符的起止坐标,根据该第一字符的起止位置计算出第一字符所占的目标面积以及目标行距。若识别出第一字符的识别结果为文本内容,则可以根据预设的格式直接设置该第一字符的格式。预设的格式可以包括预设行距和预设字体,该预设行距和预设大小可以是根据高考试卷的格式设置的。

需要说明的是,所述起止坐标包括所述第一字符的左上角的坐标和右下角的坐标,或者第一字符的左下角的坐标和右上角的坐标,本申请实施例对此不做限定。

S130、基于所述识别结果,对所述每道试题进行分类,得到多个目标试题集。

其中,在高考考试试卷中,同一题型的等级性考试科目的试题是连续的,并每道试题是该等级性考试科目的考试大纲命题的,其题干中会包括代表该等级性考试科目的关键字。

可选的,所述基于所述识别结果,对所述每道试题进行分类,得到多个目标试题集,包括:

从所述每道试题的文本内容中获取所述每道试题的题干信息和多个关键字;根据所述多个关键字确定所述每道试题的目标等级性考试科目;对所述题干信息和所述关键字,确定所述每道试题的目标知识点;将所述每道试题的目标知识点与所述目标等级性考试科目的考试大纲进行比较,当所述目标知识点位于所述目标等级性考试科目的考试大纲范围时,将所述目标知识点对应的试题分类到所述目标等级性考试科目对应的目标试题集中,否则删除所述目标知识点对应的试题。

具体地,从每道试题的文本内容中获取题干信息,然后从题干信息中确定每道试题的多个关键字,将该多个关键字分别与预先存储的各个等级性考试科目关键字列表中的关键字进行匹配,根据匹配上的关键字,确定该试题对应的目标等级性考试科目。进一步地,根据该多个关键字确定所述试题的出题范围,对题干信息进行分析,进一步缩小该试题的出题范围,确定所述目标知识点,例如,对于理综试题“1、关于DNA和RNA的叙述,正确的是:A.DNA有氢键,RAN没有氢键 B.一种病毒同时含有DNA和RNA C.原核细胞中既有DNA,也有RNA D.叶绿体、线粒体和核糖体都含有DNA”,根据关键字“DAN”和“RAN”可以确定该试题的出题范围是生物中的DAN和RAN之间的知识点,但是DAN和RAN的知识点的范围也很大,通过分析题干信息,其中“正确的是”可以知道该试题考察的是DAN和RAN之间的差别,再对分析选项中的信息进行分析,通过分析“氢键”“细胞”“叶绿体”“病毒”等词可确定该试题的目标知识点为DNA和RNA在细胞中的区别的知识点。

其中,新高考模型下知识大纲也做了调整,因此得到目标知识点后,可将目标知识点与目标等级性考试科目的知识大纲进行比较,若该目标知识点已被调整后的知识大纲删除,则将目标知识点对应的试题删除,从而可以增加试题资源的丰富度。每个等级性考试科目对应一个试题集。当目标知识点在知识大纲内时,将目标知识点的试题分类到所述目标等级性考试科目对应的目标试题集中,以将历年高考试题根据等级性考试科目进行划分存储,为自动生成“新高考”模型下的考试试卷提供试题资源。

S140、根据试题集与等级性考试科目之间的映射关系,将所述目标试题集中的试题存储于所述目标试题集对应的目标等级性考试科目的内存块中。

具体实现中,可以将内存划分为多个内存块,并建立内存块与等级性考试科目之间的映射关系。当分类得到各个等级性考试科目的目标试题集后,根据试题集与等级性考试科目之间的映射关系,将目标试题集中的试题存储到目标等级性考试科目的内存块,从而使得生成“新高考”模型下的等级性考试科目的考试试卷时,可直接从该内存块中查找满足组卷需求的试题,可以加快试卷的生成。

可以看出,本申请实施例提供的基于神经网络算法的文理分割方法,获取目标试卷图像,目标试卷图像为文综试卷或理综试卷的扫描图像;将目标试卷图像输入目标神经网络模型进行识别,得到目标试卷图像中每道试题的识别结果;基于识别结果对每道试题进行分类,得到多个目标试题集;根据试题集与等级性考试科目之间的映射关系,将目标试题集中的试题存储于所述目标试题集对应的目标等级性考试科目的内存块中,使得对传统的文理科试卷进行分割后得到的每道试题可以存储到对应的等级性考试科目的内存块中,从而为自动生成“新高考”模型下的考试试卷提供试题资源。

请参阅图3,图3为本申请实施例提供了一种基于神经网络算法的文理分割系统的示意图,如图3所示,该系统300可以包括:获取单元310、识别单元320、分类单元330和存储单元340,其中,

所述获取单元310,用于获取目标试卷图像,所述目标试卷图像为文综试卷或理综试卷的扫描图像;

所述识别单元320,用于将所述目标试卷图像输入目标神经网络模型进行识别,得到所述目标试卷图像中每道试题的识别结果;

所述分类单元330,用于基于所述识别结果,对所述每道试题进行分类,得到多个目标试题集;

所述存储单元340,用于根据试题集与等级性考试科目之间的映射关系,将所述目标试题集中的试题存储于所述目标试题集对应的目标等级性考试科目的内存块中。

本申请的提供的基于神经网络算法的文理分割系统可以用于实现如图1所示的实施例的细化方案。

本实施例还提供一种计算机存储介质,该计算机存储介质中存储有计算机指令,当该计算机指令在电子设备上运行时,使得电子设备执行上述相关方法步骤实现上述实施例中的基于神经网络算法的文理分割方法。

在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个装置,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是一个物理单元或多个物理单元,即可以位于一个地方,或者也可以分布到多个不同地方。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上内容,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号