首页> 中国专利> 一种可设置打分等级的英语作文打分方法及系统

一种可设置打分等级的英语作文打分方法及系统

摘要

本发明涉及一种可设置打分等级的英语作文打分方法及系统,其方法包括:S1:设置英语等级的各个等级中的单词、语法、主题度和流畅度等级的分值范围;用户输入起始等级,根据该起始等级得到对应的单词、语法、主题度和流畅度的等级,并输入至少一篇待打分英文作文;S2:对待打分英文作文进行预处理,获取其中的句子、单词和实体;S3:基于单词、句子、待打分英文作文和实体分别计算待打分英文作文对应的单词、语法、主题度以及流畅度的等级;S4:基于起始等级和待打分英文作文的单词、语法、主题度以及流畅度等级进行加权计算,得到最终的作文分数。本发明提供的方法根据不同水平的英语学习者采用了不同的标准来进行打分,该打分方法更灵活,更具实用性。

著录项

  • 公开/公告号CN114841149A

    专利类型发明专利

  • 公开/公告日2022-08-02

    原文格式PDF

  • 申请/专利权人 珠海翼字科技有限公司;

    申请/专利号CN202210426140.X

  • 申请日2022-04-22

  • 分类号G06F40/284(2020.01);G06F40/253(2020.01);G06F40/216(2020.01);G06F40/211(2020.01);G06F40/30(2020.01);G06Q10/06(2012.01);G06Q50/20(2012.01);

  • 代理机构北京科迪生专利代理有限责任公司 11251;

  • 代理人金怡

  • 地址 519085 广东省珠海市高新区唐家湾镇香山路88号二栋15层1504室

  • 入库时间 2023-06-19 16:14:25

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-08-19

    实质审查的生效 IPC(主分类):G06F40/284 专利申请号:202210426140X 申请日:20220422

    实质审查的生效

说明书

技术领域

本发明涉及英文信息处理领域,具体涉及一种可设置打分等级的英语作文打分方法及系统。

背景技术

听说读写是英语能力的四个重要方面。相对而言,英语写作难以以客观题目的方式展现,如何实现英语作文自动评估和打分一直是英语教育、信息技术所关注的重要问题。传统的英语作文打分,主要依赖评阅人个人的经验人工完成。当评阅任务繁重时,这会消大量的人力;另外评阅人认知和评阅标准的差异也会导致评分标准的客观性受到影响。随着信息技术的飞速发展,计算机技术与教育的结合势在必行,英语在线教学、答卷评分已在教育和信息技术领域得到充分发展和广泛应用,英语作文自动打分技术也随之出现。

目前,自动作文评分系统对英语写作反馈的研究已经取得了一定的成果。现有的具有影响力的打分系统有:Project Essay Grade(PEG)与E-rater。

PEG依靠对作文的浅层语言学特征的分析对作文进行评分,没有涉及作文内容。它采取了间接测量写作构念分项指标的方法,如:作文长度代表了写作的流畅性;介词、关系代词等表明了句子结构的复杂度;词长的变化表明了作文措辞的情况。这些间接度标准由计算机从人工评分的训练作文集统计得出,与训练集中作文的人工评分一起用于标准多元回归的计算,从而得出各项代理量度标准的回归系数。得出的回归系数代表了人对作文评分的最佳模拟。这些系数与代理量度标准一起用于待评阅作文的自动评分。PEG打分系统的缺点有:忽略语义,只注重表面结构,无法分析作文的主题关联性。

E-rater是现用于托福考试作文打分的打分系统。它采用基于微软自然语言处理的工具包来分析作文,包括词性标注器为文本中每一个单词赋予词性;句法分析器分析文本中的句法结构;篇章分析器分析文本的篇章结构。采用词相似性度量器,以统计技术中的简单关键词分析法分析文本中的词使用。另外,采用了基于语料库的方法建模。使用统计与自然语言处理技术来提取待评分作文的语言学特征,然后对照人工评分的标准作文集进行评分。评分过程主要由5个独立模块来进行。3个用来识别作为评分标准的特征,包括:句法模块、篇章模块和主题分析模块。这3个模块分别用来提取作文的句法多样性、思想的组织和词的使用方面的67个文本特征的特征值。第4个模块,即模型构建模块,用来选择和加权对作文评分具有预测力的特征。即把前3个模块提取的数据作为自变量,人工评分的分数作为因变量进行逐步线性回归,在67个变量中进行筛选,建立回归方程。第5个模块用来计算待评分作文的最后得分,即提取作文显著特征的特征值,代入回归方程计算得分。然而该打分系统只能用于大学及以上水平的作文评分,对将英语视为第二语言的英语学习者特别是初学者而言实用性不高。

发明内容

为了解决上述技术问题,本发明提供一种可设置打分等级的英语作文打分方法及系统。

本发明技术解决方案为:一种可设置打分等级的英语作文打分方法,包括:

步骤S1:设置英语等级的各个等级中的单词等级Word、语法等级KPG、主题度等级TC和流畅度等级Fluency的分值范围;用户输入其起始等级,根据该起始等级,得到该起始等级对应的单词等级Word

步骤S2:对所述待打分英文作文进行预处理,获取其中的句子、单词和实体;

步骤S3:基于所述单词、句子、待打分英文作文和实体分别进行词汇分析、语法点分析、主题度分析以及流畅度分析,得到所述待打分英文作文对应的单词等级、语法等级、主题度等级以及流畅度等级;

步骤S4:基于所述起始等级和所述待打分英文作文的单词等级、语法等级、主题度等级以及流畅度等级进行加权计算,得到最终的作文分数。

本发明与现有技术相比,具有以下优点:

1、本发明公开了一种可设置打分等级的英语作文打分方法,不同水平的英语学习者采用了不同的标准来进行打分,该打分方法更灵活,更具实用性。

2、本发明利用词向量参与作文的主题度计算,使打分不仅分析作文的表面结构,并且结合了语义;在作文流畅度方面,通过分析实体在作文中的分布情况,来判断作文的流畅程度,该方法一定程度避免了取巧者利用技巧欺骗计算机。

附图说明

图1为本发明实施例中一种可设置打分等级的英语作文打分方法的流程图;

图2为本发明实施例中计算待打分英文作文主题度的流程示意图;

图3为本发明实施例中计算待打分英文作文流畅度的流程示意图;

图4为本发明实施例中一种可设置打分等级的英语作文打分系统的结构框图。

具体实施方式

本发明提供了一种可设置打分等级的英语作文打分方法,根据不同水平的英语学习者采用了不同的标准来进行打分,该打分方法更灵活,更具实用性。

为了使本发明的目的、技术方案及优点更加清楚,以下通过具体实施,并结合附图,对本发明进一步详细说明。

实施例一

如图1所示,本发明实施例提供的一种可设置打分等级的英语作文打分方法,包括下述步骤:

步骤S1:设置英语等级的各个等级中的单词等级Word、语法等级KPG、主题度等级TC和流畅度等级Fluency的分值范围;用户输入其起始等级,根据该起始等级,得到该起始等级对应的单词等级Word

步骤S2:对待打分英文作文进行预处理,获取其中的句子、单词和实体;

步骤S3:基于单词、句子、待打分英文作文和实体分别进行词汇分析、语法点分析、主题度分析以及流畅度分析,得到待打分英文作文对应的单词等级、语法等级、主题度等级以及流畅度等级;

步骤S4:基于起始等级和待打分英文作文的单词等级、语法等级、主题度等级以及流畅度等级进行加权计算,得到最终的作文分数。

在一个实施例中,上述步骤S1:设置英语等级的各个等级中的单词等级Word、语法等级KPG、主题度等级TC和流畅度等级Fluency的分值范围;用户输入其起始等级,根据该起始等级,得到该起始等级对应的单词等级Word

本发明实施例按照学习英语的年限,将英语等级划分为五个级别:小学等级-1,初中等级-2,高中等级-3,大学四级-4和大学六级-5,并为每个级别中的单词等级Word、语法等级KPG、主题度等级TC和流畅度等级Fluency设置分值范围,用于后续根据待打分英文作文的得分来确定其对应等级。

用户需要根据自身英语水平,选择起始等级,例如用户选择大学四级-4,则可以得到该用户起始等级4所对应的单词等级Word

在一个实施例中,上述步骤S2:对待打分英文作文进行预处理,获取其中的句子、单词和实体,具体包括:

对每一篇待打分的英文作文,使用StanfordNLPCore工具进行处理,获取其中的句子存储于句子集合SentenceList,单词存储于单词集合WordsList,以及实体存储于实体集合EntityList。

其中,实体是指根据StanfordNLPCore工具得到句子中名词,以及该实体在句子中的成分,例如,主语、宾语或者其他成分。

在一个实施例中,上述步骤S3中基于单词进行词汇分析,得到待打分英文作文对应的单词等级,具体包括:

步骤S301:基于单词集合WordsList,获取每个单词的难度值WordDifficulty,具体包括:

步骤S3011:获取已有公开的英语语料,对英语语料进行分句和分词,统计其中所有单词及其使用频率,得到词典Dictionary、词频m与总词数M,以及每个单词对应的单词等级N;

首先,本发明实施例根据现有的wiki百科语料,提取大约2G大小的英语语料,获取不同英语等级需要掌握的英语单词,分别存List

步骤S3012:获取待打分英文作文WordsList中每个单词word

Info

其中,p

步骤S3013:根据公式(2),可计算得到word

Word

其中,a为预设的系数,本发明实施例中a=0.05,Info

步骤S302:将所有单词按照其难度值降序排列,取前m%,通过累加求和取平均的方法,计算前m%单词的平均难度值AveWordDifficult,根据平均难度值获取其对应的单词等级Word

在一个实施例中,上述步骤S3中基于句子进行语法点分析,得到待打分英文作文对应的语法等级,具体包括:

步骤S311:遍历句子集合SentenceList,以每个句子为单位,利用StanfordNLPCore工具对句子进行分析,得到句法结构,并根据句法结构与其对应英语等级的关系Map,将其对应的英语等级存放于KPGList,其中,构建Map具体包括:

步骤S3111:根据中小学英语教学大纲、大学四级和六级考试要求,获取不同英语等级的语法知识点;利用StanfordNLPCore工具,分析得到语法知识点的句法结构,其中,语法知识点包括:时态(Tense),从句(Clause)和常见短语搭配(Phrase);

步骤S3112:基于句法结构,构建与其对应英语等级的关系Map。

步骤S312:将KPGList按照降序排序,取前m%,累加求和取平均,根据该平均值获取对应的语法等级KPG

例如,分析待打分英文作文中每个句子的语法点,得到每个句子的对应等级,如符合高中等级语法点,则该句子语法等级值为3,降序排序后,取前m%的等级值累加求平均,根据该平均值,确定待打分作文所对应的语法等级KPG

本发明实施例中通过计算英文作文的主题度TC(Topic Conformity)来衡量英文作文符合其主题的程度,其中主题(Topic)指文艺作品中或者社会活动等所要表现的中心思想,泛指主要内容,将英文作文的标题或者第一句话作文英文作文的主题。

在一个实施例中,上述步骤S3中对待打分的英文作文进行主题度分析,得到待打分英文作文对应的主题度等级,具体包括:

步骤S321:收集已有的不同级别的英语作文,按照其对应的等级划分为不同的等级集合Set

步骤S322:获取等级集合中每一篇英文作文,根据英文作文的主题Topic或者将英文作文的第一句作为其主题Topic,去掉主题Topic中的停止词,包括:冠词、介词、副词和连词;得到词袋WordsBag=[Word

其中,I

步骤S323:获取英文作文中的每个句子,重复步骤S322,计算其句向量,并存储于SenVecList;

步骤S324:根据公式(4),计算SenVecList中的句向量与主题向量的夹角距离并求和,记为Distance;如果用采用第一句话作为主题句,则计算除第一句以外的句子的句向量与主题向量的夹角距离并求和:

其中,n为总句数;V

步骤S325:将Distance除以英文作文总句数n,得到平均夹角距离;如果用第一句作为主题,则除以n-1;平均夹角距离作为该篇英文作文的主题度Topic Conformity;

步骤S326:计算每个等级集合Set

步骤S327:根据待打分英文作文,重复步骤S322~S325计算得到其主题度,获取该主题度所对应的主题度等级TC

如图2所示,展示了计算待打分英文作文主题度的流程示意图。

本发明实施例还通过计算流畅度(Fluency),即英文作文的通顺程度,用于衡量作文前后是否连贯、逻辑通顺。

在一个实施例中,上述步骤S3中对实体进行流畅度分析,得到待打分英文作文对应的流畅度等级,具体包括:

步骤S331:使用StandfordNLPCore,对于步骤S321得到不同的等级集合Set

举例来说,表1为一个实体成分表:

表1实体成分表

表1中,表头的数字序号1、2、3、4、5、……为英文作文的句子编号,Object

步骤S332:分析每个实体在句子间的成分转换,用序列{S,O,X,–}

举例来说,有3个英文句子:China is beautiful.I love China.I want to goto China.

针对其中实体China在3个句子中的成分,分别为主语、宾语和宾语,用{S,O,O}表示。

由此,可以得到China的可能的成分转换概率,如表2所示:

表2实体成分转换概率

基于此,可构建实体China的16维向量。

步骤S333:计算每个等级集合Set

步骤S334:根据待打分英文作文,重复步骤S331~S332计算得到其流畅度;获取该流畅度对应的流畅度等级Fluency

如图3所示,展示了计算待打分英文作文流畅度的流程示意图。

在一个实施例中,上述步骤S4:基于起始等级和待打分英文作文的单词等级、语法等级、主题度等级以及流畅度等级进行加权计算,得到最终的作文分数,具体包括:

根据公式(4),计算待打分英文作文的最后得分Score:

Score=a

其中,a

本发明公开了一种可设置打分等级的英语作文打分方法,不同水平的英语学习者采用了不同的标准来进行打分,该打分方法更灵活,更具实用性。本发明利用词向量参与作文的主题度计算,使打分考虑了结构的同时也考虑了语义;在作文流畅度方面,通过分析实体在作文中的分布情况,来判断作文的流畅程度,该方法一定程度避免了取巧者利用技巧欺骗计算机。

实施例二

如图4所示,本发明实施例提供了一种可设置打分等级的英语作文打分系统,包括下述模块:

设置起始等级模块51,用于设置英语等级的各个等级中的单词等级Word、语法等级KPG、主题度等级TC和流畅度等级Fluency的分值范围;用户输入其起始等级,根据该起始等级,得到该起始等级对应的单词等级Word

预处理模块52,用于对所述待打分英文作文进行预处理,获取其中的句子、单词和实体;

确定等级模块53,用于基于所述单词、句子、待打分英文作文和实体分别进行词汇分析、语法点分析、主题度分析以及流畅度分析,得到所述待打分英文作文对应的单词等级、语法等级、主题度等级以及流畅度等级;

打分模块54,用于基于所述起始等级和所述待打分英文作文的单词等级、语法等级、主题度等级以及流畅度等级进行加权计算,得到最终的作文分数。

提供以上实施例仅仅是为了描述本发明的目的,而并非要限制本发明的范围。本发明的范围由所附权利要求限定。不脱离本发明的精神和原理而做出的各种等同替换和修改,均应涵盖在本发明的范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号