首页> 中国专利> 一种线上外语课程的质量评价方法及装置

一种线上外语课程的质量评价方法及装置

摘要

本发明公开了一种线上外语课程的质量评价方法及装置,方法包括:获取待评价课程的课堂语音数据;基于课堂语音数据中人声时段和非人声时段确定课堂语音数据的第一指标;基于人声时段中的第一语种时段和第二语种时段确定课堂语音数据的第二指标;确定第一语种时段对应的第一语种语音数据所包含内容与预设内容的匹配关系,得到课堂语音数据的第三指标;基于第一指标、第二指标、第三指标和预设规则确定待评价课程的质量评价结果。上述实现将课堂质量评价分解成多指标任务,过程中利用了简单易获得的特征,结合各个评价指标综合评判课程质量,不仅效率高而且评价结果全面准确,有利于提升用户的使用体验。

著录项

  • 公开/公告号CN112712822A

    专利类型发明专利

  • 公开/公告日2021-04-27

    原文格式PDF

  • 申请/专利权人 北京读我科技有限公司;

    申请/专利号CN202011530200.X

  • 发明设计人 黄智超;陈现麟;王强;

    申请日2020-12-22

  • 分类号G10L25/51(20130101);G10L15/00(20130101);G10L15/26(20060101);G09B5/04(20060101);

  • 代理机构11227 北京集佳知识产权代理有限公司;

  • 代理人李婷婷

  • 地址 100088 北京市海淀区马甸东路17号22层2612-2

  • 入库时间 2023-06-19 10:44:55

说明书

技术领域

本发明涉及数据处理技术,更具体的说,是涉及一种线上外语课程的质量评价方法及装置。

背景技术

随着我国幼儿学习外语的人数不断增多,近年来在线外语教育开始蓬勃发展。线上教育由于存在即时方便,不受环境的影响的优点,也受到越来越多学生和家长的欢迎。

为了更好的了解并助力于改进线上外语课程的教学效果,需要对线上外语课程进行质量评价。由于线上教育与线下教育迥异的教育模式,使得目前尚不存在针对线上外语课程的合理高效的质量评价方法。

发明内容

有鉴于此,本发明提供如下技术方案:

一种线上外语课程的质量评价方法,包括:

获取待评价课程的课堂语音数据;

确定所述课堂语音数据中人声时段和非人声时段,并基于所述人声时段和所述非人声时段确定所述课堂语音数据的第一指标;

确定所述人声时段中的第一语种时段和第二语种时段,并基于所述第一语种时段和所述第二语种时段确定所述课堂语音数据的第二指标;

确定所述第一语种时段对应的第一语种语音数据所包含内容与预设内容的匹配关系,得到所述课堂语音数据的第三指标;

基于所述第一指标、所述第二指标、所述第三指标和预设规则确定所述待评价课程的质量评价结果。

可选的,所述确定所述课堂语音数据中人声时段和非人声时段,包括:

基于预先训练好的人声检测模型确定所述课堂语音数据中人声时段和非人声时段;

所述基于所述人声时段和所述非人声时段确定所述课堂语音数据的第一指标,包括:

基于所述人声时段和所述非人声时段的比值,或所述人声时段在所述课堂语音数据中的占比确定第一指标。

可选的,所述确定所述人声时段中的第一语种时段和第二语种时段,包括:

基于语种分类检测模型确定所述人声时段中的第一语种时段和第二语种时段;

所述基于所述第一语种时段和所述第二语种时段确定所述课堂语音数据的第二指标,包括:

基于所述第一语种时段和所述第二语种时段的比值,或所述第一语种时段在所述人声时段中的占比确定第二指标。

可选的,所述人声监测模型和所述语种分类检测模型对待处理语音的处理过程包括:

对待处理语音进行分帧,得到分帧语音;

从所述分帧语音中提取音频特征,所述音频特征为40维梅尔倒谱系数。

可选的,所述确定所述第一语种时段对应的第一语种语音数据所包含内容与预设内容的匹配关系,得到所述课堂语音数据的第三指标,包括:

对所述第一语种时段对应的第一语种语音数据进行识别处理,得到文本内容;

将所述文本内容与和所述待评价课程对应的关键内容进行匹配,将匹配结果确定为所述课堂语音数据的第三指标。

可选的,所述基于所述第一指标、所述第二指标、所述第三指标和预设规则确定所述待评价课程的质量评价结果,包括:

基于预先设定的各个指标的权重,对所述第一指标、所述第二指标和所述第三指标进行加权平均处理,得到所述待评价课程的质量评价分数。

一种线上外语课程的质量评价装置,包括:

语音获取模块,用于获取待评价课程的课堂语音数据;

第一确定模块,用于确定所述课堂语音数据中人声时段和非人声时段,并基于所述人声时段和所述非人声时段确定所述课堂语音数据的第一指标;

第二确定模块,用于确定所述人声时段中的第一语种时段和第二语种时段,并基于所述第一语种时段和所述第二语种时段确定所述课堂语音数据的第二指标;

第三确定模块,用于确定所述第一语种时段对应的第一语种语音数据所包含内容与预设内容的匹配关系,得到所述课堂语音数据的第三指标;

质量评价模块,用于基于所述第一指标、所述第二指标、所述第三指标和预设规则确定所述待评价课程的质量评价结果。

可选的,所述第一确定模块具体用于:

基于预先训练好的人声检测模型确定所述课堂语音数据中人声时段和非人声时段;

基于所述人声时段和所述非人声时段的比值,或所述人声时段在所述课堂语音数据中的占比确定第一指标。

可选的,所述第二确定模块具体用于:

基于语种分类检测模型确定所述人声时段中的第一语种时段和第二语种时段;

基于所述第一语种时段和所述第二语种时段的比值,或所述第一语种时段在所述人声时段中的占比确定第二指标。

可选的,所述第一确定模块和所述第二确定模块均包括:

分帧处理模块,用于对待处理语音进行分帧,得到分帧语音;

特征提取模块,用于从所述分帧语音中提取音频特征,所述音频特征为40维梅尔倒谱系数。

经由上述的技术方案可知,与现有技术相比,本发明实施例公开了一种线上外语课程的质量评价方法及装置,方法包括:获取待评价课程的课堂语音数据;确定课堂语音数据中人声时段和非人声时段,并基于人声时段和非人声时段确定课堂语音数据的第一指标;确定人声时段中的第一语种时段和第二语种时段,并基于第一语种时段和第二语种时段确定课堂语音数据的第二指标;确定第一语种时段对应的第一语种语音数据所包含内容与预设内容的匹配关系,得到课堂语音数据的第三指标;基于第一指标、第二指标、第三指标和预设规则确定待评价课程的质量评价结果。上述实现将课堂质量评价分解成多指标任务,过程中利用了简单易获得的特征,结合各个评价指标综合评判课程质量,不仅效率高而且评价结果全面准确,有利于提升用户的使用体验。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1为本发明实施例公开的线上外语课程的质量评价方法流程图;

图2为本发明实施例公开的确定课堂语音数据的第三指标的流程图;

图3为本发明实施例公开的一种线上外语课程的质量评价装置的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

图1为本发明实施例公开的线上外语课程的质量评价方法流程图,参见图1所示,线上外语课程的质量评价方法可以包括:

步骤101:获取待评价课程的课堂语音数据。

其中,课堂语音数据可以为某节线上外语课程的学生侧现场的录音文件。

步骤102:确定所述课堂语音数据中人声时段和非人声时段,并基于所述人声时段和所述非人声时段确定所述课堂语音数据的第一指标。

其中的人声时段是指有人(对应学生)说话的时间段,非人声时段为没有人说话的时间段。人声时段可以是课堂语音数据中所有有人说话的时间段的总和,非人声时段是课堂语音数据中所有没有人说话声音的时间段的总和。

第一指标的确定具有不同的实现方式,在后面的实施例中,将对其进行具体介绍。

步骤103:确定所述人声时段中的第一语种时段和第二语种时段,并基于所述第一语种时段和所述第二语种时段确定所述课堂语音数据的第二指标。

确定出人声时段后,需要确定其中学生说中文和外语的时段分别有多长,例如,人声时段总长10分钟,其中,学生说中文的时段总长为2.5分钟,说英文的时段总长7.5分钟。

同样的,第二指标的确定也具有不同的实现方式,将在后面的实施例中介绍。

步骤104:确定所述第一语种时段对应的第一语种语音数据所包含内容与预设内容的匹配关系,得到所述课堂语音数据的第三指标。

每一节线上课程都有固定的教学内容和教学任务,可以预先将与不同课程的教学内容和教学课程相关的关键词和文本内容存入数据库,后续对于第一语种时段(对应外文时段)识别出的内容,将其与本节课程对应的关键词和文本内容进行匹配,确定本节线上外语课程的教学内容与预设教学内容和教学任务的匹配度是否能够达到要求。本实施例中,将第一语种语音数据所包含内容与预设内容的匹配关系(具体可以是能够量化表示的匹配度)确定为第三指标。

步骤105:基于所述第一指标、所述第二指标、所述第三指标和预设规则确定所述待评价课程的质量评价结果。

本实施例中,确定待评价课程的质量评价结果的具体实现可以是:基于预先设定的各个指标的权重,对所述第一指标、所述第二指标和所述第三指标进行加权平均处理,得到所述待评价课程的质量评价分数。

当然,该实现中,需要将第一指标、第二指标和第三指标都量化表示,以根据预设计算公式计算确定质量评价结果,即质量评价分数。

本实施例所述线上外语课程的质量评价方法,将课堂质量评价分解成多指标任务,过程中利用了简单易获得的特征,结合各个评价指标综合评判课程质量,不仅效率高而且评价结果全面准确,有利于提升用户的使用体验。

上述实施例中,所述确定所述课堂语音数据中人声时段和非人声时段,可以包括:基于预先训练好的人声检测模型确定所述课堂语音数据中人声时段和非人声时段。

所述基于所述人声时段和所述非人声时段确定所述课堂语音数据的第一指标,可以包括:基于所述人声时段和所述非人声时段的比值,或所述人声时段在所述课堂语音数据中的占比确定第一指标。例如,课堂语音数据总时长40分钟,其中人声时段15分钟,非人声时段25分钟,则人声时段和非人声时段的比值是15:25=3:5;人声时段在课堂语音数据中的占比是15:40=3:8。

上述实施例中,所述确定所述人声时段中的第一语种时段和第二语种时段,可以包括:基于语种分类检测模型确定所述人声时段中的第一语种时段和第二语种时段。

所述基于所述第一语种时段和所述第二语种时段确定所述课堂语音数据的第二指标,可以包括:基于所述第一语种时段和所述第二语种时段的比值,或所述第一语种时段在所述人声时段中的占比确定第二指标。

在上述确定第一指标或确定第二指标的过程中,都可以包括如下内容:对待处理语音进行分帧,得到分帧语音;从所述分帧语音中提取音频特征,所述音频特征为40维梅尔倒谱系数。即,本申请实施例对于评价指标的确定,都是以语音帧为单位,基于语音帧中包含的特征进行确定的,因而具有较高的准确度。

图2为本发明实施例公开的确定课堂语音数据的第三指标的流程图,参见图2所示,上述确定所述第一语种时段对应的第一语种语音数据所包含内容与预设内容的匹配关系,得到所述课堂语音数据的第三指标,可以包括:

步骤201:对所述第一语种时段对应的第一语种语音数据进行识别处理,得到文本内容。

其中的第一语种可以是外语,如英语。本步骤中,对外语时段的语音数据进行识别处理,得到文本数据,后续可将处理得到的文本数据与本节课程对应的关键词匹配。

步骤202:将所述文本内容与和所述待评价课程对应的关键内容进行匹配,将匹配结果确定为所述课堂语音数据的第三指标。

本申请具体实现中,可以预先训练人声检测模型,用训练好的模型检测上课学生的音频,得到上课时人声和非人声的比值,学生越频繁开口说明孩子积极性越高;然后将人声送入事先训练好的语种分类检测模型,得到中英(以英语为例)音频比例,英语部分越多,说明孩子越融入课堂;英文音频送入语音识别系统得到英文文本。将英文文本和数据库中的这堂课的关键文本匹配,得到匹配率。最后可以将上面人声和非人声比例,中英文音频比例,关键文本匹配率加权平均得到0-100的课堂打分。

在一个具体实现中,人声检测模型的训练过程可以包括:音频先分帧,然后提取特征,每25ms一帧,帧移10ms,特征为40维梅尔倒谱系数mfcc后文通称mfcc,。提取特征完成后,将每帧按时间标记打上人声或者非人声的标记,特征和标签对应后,用深度神经网络模型训练得到人声检测模型。其中,帧移的概念是多少时间计算一次特征,比如帧移时间是10ms,就是10ms计算一次特征。

梅尔倒谱系数(Mel-scaleFrequencyCepstralCoefficients,简称MFCC)是在Mel标度频率域提取出来的倒谱参数,Mel标度描述了人耳频率的非线性特性,它与频率的关系可用下式近似表示:

式中f为频率,单位为Hz。

人声检测模型检测过程:将学生音频分帧送入人声检测模型,得到每一帧的人声和非人声的概率,人声概率持续10帧大于0.5,说明语音开始,人声概率持续10帧小于0,5说明语音结束,这样就可以得到学生说话的段,和非说话的段。

语种分类模型(如xvector模型,为现有模型)训练过程:音频先分帧,然后提取特征,每25ms一帧,帧移10ms,特征为40维梅尔倒谱系数mfcc后文通称mfcc,每10帧拼在一起,将每帧按标记打上中文还是英文标签,即0或者1,利用dnn训练得到语种分类模型。

语种分类检测模型:音频先分帧,提取特征,送入语种分类模型得到中文还是英文的概率,概率突变的地方就是语种突变的地方,英文概率持续10帧大于0.5,说明英文语音开始,英文概率持续10帧小于0.5说明语音结束,这样就可以得到学生说英文的概率,得到学生英文音频和英文和中文的比例。

语音识别模块:对英语音频提取送入识别平台得到文本。语音技术非常成熟可以利用开源平台训练也可以调用第三方的接口,因为不是本文的关键就不展开来讲。

文本匹配过程:学生英语教育每个教育都有教材,而教材每节课都有固定的关键内容,我们存在数据库中。匹配时根据课堂所在等级,拿到关键词和学生文本做相识度匹配,得到匹配率。

打分过程:利用上面的人声和非人声比例,中文和英文比例,文本匹配率,加权平均得到0到100的得分。

本发明实施例所公开的线上外语课程的质量评价方法,将课堂评价分解成多指标任务,人声和非人声比例可以考察小孩开口次数,而中英文比例可以考察小孩是否融入英文环境,而文本匹配率可以考察小孩对这个课堂关键点具体掌握多少。实现中,利用了简单易获得的特征,将评价问题分了几个子步骤,将每步的评价加权评价,使得课堂质量评价这么抽象的问题分解成一个个技术可以达到的子问题,降低了其解决难度,而效果显著可用,节省了大量教师时间去课堂评价学生反应。

对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。

上述本发明公开的实施例中详细描述了方法,对于本发明的方法可采用多种形式的装置实现,因此本发明还公开了一种装置,下面给出具体的实施例进行详细说明。

图3为本发明实施例公开的一种线上外语课程的质量评价装置的结构示意图,参见图3所示,线上外语课程的质量评价装置30可以包括:

语音获取模块301,用于获取待评价课程的课堂语音数据。

第一确定模块302,用于确定所述课堂语音数据中人声时段和非人声时段,并基于所述人声时段和所述非人声时段确定所述课堂语音数据的第一指标。

第二确定模块303,用于确定所述人声时段中的第一语种时段和第二语种时段,并基于所述第一语种时段和所述第二语种时段确定所述课堂语音数据的第二指标。

第三确定模块304,用于确定所述第一语种时段对应的第一语种语音数据所包含内容与预设内容的匹配关系,得到所述课堂语音数据的第三指标;

质量评价模块305,用于基于所述第一指标、所述第二指标、所述第三指标和预设规则确定所述待评价课程的质量评价结果。

本实施例所述线上外语课程的质量评价装置,将课堂质量评价分解成多指标任务,过程中利用了简单易获得的特征,结合各个评价指标综合评判课程质量,不仅效率高而且评价结果全面准确,有利于提升用户的使用体验。

一个实现中,所述第一确定模块具体可用于:基于预先训练好的人声检测模型确定所述课堂语音数据中人声时段和非人声时段;基于所述人声时段和所述非人声时段的比值,或所述人声时段在所述课堂语音数据中的占比确定第一指标。

一个实现中,所述第二确定模块具体可用于:基于语种分类检测模型确定所述人声时段中的第一语种时段和第二语种时段;基于所述第一语种时段和所述第二语种时段的比值,或所述第一语种时段在所述人声时段中的占比确定第二指标。

一个实现中,所述第一确定模块和所述第二确定模块均可以包括:

分帧处理模块,用于对待处理语音进行分帧,得到分帧语音;

特征提取模块,用于从所述分帧语音中提取音频特征,所述音频特征为40维梅尔倒谱系数。

上述线上外语课程的质量评价装置及其各个模块的具体实现可参见方法实施例中相应部分的内容介绍,在此不再重复赘述。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号