首页> 中国专利> 主旋律提取模型训练方法及组件,歌声检测方法及组件

主旋律提取模型训练方法及组件,歌声检测方法及组件

摘要

本申请公开了计算机技术领域内的一种主旋律提取模型训练方法及组件,歌声检测方法及组件,本申请利用标注有主旋律的有标签歌曲音频帧以及未标注主旋律的无标签歌曲音频帧进行有监督训练和半监督训练,既增强了模型训练量,又能够使模型同时学习到有标签数据和无标签数据的处理能力,还无需额外进行数据标注工作,因此模型训练效率较高,模型泛化能力也得到了提升。并且,该方案可直接对歌曲音频进行处理,无需进行背景音和人声的分离,由此也能提升训练效率和主旋律提取效率。相应地,本申请提供的一种主旋律提取模型训练组件,一种歌声检测方法及组件,也同样具有上述技术效果。

著录项

  • 公开/公告号CN115114993A

    专利类型发明专利

  • 公开/公告日2022-09-27

    原文格式PDF

  • 申请/专利号CN202210831061.7

  • 发明设计人 何礼;

    申请日2022-07-15

  • 分类号G06K9/62(2022.01);G06N3/04(2006.01);G06N3/08(2006.01);G10H1/00(2006.01);G10L25/18(2013.01);G10L25/24(2013.01);

  • 代理机构深圳市深佳知识产权代理事务所(普通合伙) 44285;

  • 代理人张金香

  • 地址 518052 广东省深圳市前海深港合作区前湾一路1号A栋201室(入驻深圳市前海商务秘书有限公司)

  • 入库时间 2023-06-19 17:09:24

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-10-18

    实质审查的生效 IPC(主分类):G06K 9/62 专利申请号:2022108310617 申请日:20220715

    实质审查的生效

  • 2022-09-27

    公开

    发明专利申请公布

说明书

技术领域

本申请涉及计算机技术领域,特别涉及一种主旋律提取模型训练方法及组件,歌声检测方法及组件。

背景技术

目前,提取歌曲主旋律时需要对歌曲信号进行源分离,然后对干声信号进行主旋律提取,所以旋律提取性能受制于源分离模型,提取复杂度也很高。当然,也可以使用机器学习方法提取歌曲主旋律,但现有机器学习方法需要需要懂乐理的标注人员在特制设备上边听边弹,以此录制旋律标签,因此标注数据的成本较高、效率较低。

发明内容

有鉴于此,本申请的目的在于提供一种主旋律提取模型训练方法及组件,歌声检测方法及组件,以提升歌曲主旋律提取效率。其具体方案如下:

为实现上述目的,一方面,本申请提供了一种主旋律提取模型训练方法,包括:

从训练集获取有标签歌曲音频帧以及无标签歌曲音频帧;

从所述有标签歌曲音频帧中提取有标签音频特征,从所述无标签歌曲音频帧中提取无标签音频特征;所述有标签音频特征和所述无标签音频特征均包括:频谱特征和倒谱特征;

将所述有标签音频特征输入有监督学习模块,以对所述有监督训练模块中的目标模型进行有监督训练,并确定相应的有监督损失;

将所述有标签音频特征和所述无标签音频特征输入半监督学习模块,以利用所述半监督学习模块对所述目标模型进行半监督训练,并确定相应的半监督损失;

基于所述有监督损失和所述半监督损失确定综合损失;

若所述综合损失收敛,则将当前目标模型确定为主旋律提取模型;否则,基于所述综合损失更新当前目标模型的模型参数,并从所述训练集中另选有标签歌曲音频帧和无标签歌曲音频帧对更新后的目标模型进行迭代训练,直至所述综合损失收敛。

可选地,所述从所述有标签歌曲音频帧中提取有标签音频特征,从所述无标签歌曲音频帧中提取无标签音频特征,包括:

将所述有标签歌曲音频帧和所述无标签歌曲音频帧分别作为目标对象;

将所述目标对象通过傅里叶变换转换为频谱特征;

对所述频谱特征进行对数运算和傅里叶反变换,得到倒谱特征。

可选地,所述将所述有标签音频特征输入有监督学习模块,以对所述有监督训练模块中的目标模型进行有监督训练,并确定相应的有监督损失,包括:

将所述有标签音频特征输入所述有监督学习模块,以使所述有监督学习模块利用所述目标模型处理所述有标签音频特征,得到是否有主旋律的二分类预测结果和主旋律预测结果,将所述二分类预测结果、所述主旋律预测结果分别与所述有标签歌曲音频帧的标签之间的损失确定为所述有监督损失。

可选地,所述将所述有标签音频特征和所述无标签音频特征输入半监督学习模块,以利用所述半监督学习模块对所述目标模型进行半监督训练,并确定相应的半监督损失,包括:

将所述有标签音频特征和所述无标签音频特征输入所述半监督学习模块,以使所述半监督学习模块执行下述步骤:

利用所述目标模型处理所述有标签音频特征得到第一有标签预测结果;

利用所述目标模型处理所述无标签音频特征得到第一无标签预测结果;

利用所述目标模型处理所述有标签音频特征和扰动向量,得到第二有标签预测结果;

利用所述目标模型处理所述无标签音频特征和扰动向量,得到第二无标签预测结果;

计算所述第一有标签预测结果与所述第二有标签预测结果之间的第一损失、所述第一无标签预测结果与所述第二无标签预测结果之间的第二损失;

将所述第一损失和所述第二损失之和的一半确定为所述半监督损失。

可选地,所述基于所述有监督损失和所述半监督损失确定综合损失,包括:

利用目标公式计算所述综合损失,所述目标公式为:

其中,L

可选地,还包括:

将音乐平台上的歌曲分帧后,对分帧得到的音频帧加窗,得到新无标签歌曲音频帧;

将所述新无标签歌曲音频帧添加至所述训练集,得到新训练集;

利用所述新训练集对所述主旋律提取模型继续训练,并将训练得到的新主旋律提取模型用于歌声检测。

又一方面,本申请还提供了一种歌声检测方法,包括:

将目标歌曲中的各音频帧作为待检测音频帧;

从所述待检测音频帧中提取待检测音频特征;

将所述待检测音频特征输入主旋律提取模型,以使所述主旋律提取模型输出所述目标歌曲的主旋律;所述主旋律提取模型基于前述任一项所述的主旋律提取模型训练方法获得;

将所述主旋律与所述目标歌曲的基准主旋律进行对比,并基于对比结果确定所述目标歌曲的歌声检测结果。

可选地,还包括:

利用所述歌声检测结果进行翻唱识别和/或歌声评价。

又一方面,本申请还提供了一种电子设备,所述电子设备包括处理器和存储器;其中,所述存储器用于存储计算机程序,所述计算机程序由所述处理器加载并执行以实现前述任一方法。

又一方面,本申请还提供了一种存储介质,所述存储介质中存储有计算机可执行指令,所述计算机可执行指令被处理器加载并执行时,实现前述任一方法。

本申请利用标注有主旋律的有标签歌曲音频帧以及未标注主旋律的无标签歌曲音频帧进行有监督训练和半监督训练,既增强了模型训练量,又能够使模型同时学习到有标签数据和无标签数据的处理能力,还无需额外进行数据标注工作,因此模型训练效率较高,模型泛化能力也得到了提升。并且,该方案可直接对歌曲音频进行处理,无需进行背景音和人声的分离,由此也能提升训练效率和主旋律提取效率。

相应地,本申请提供的一种主旋律提取模型训练组件,一种歌声检测方法及组件,也同样具有上述技术效果。组件包括设备及存储介质。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1为本申请提供的一种本申请适用的物理架构示意图;

图2为本申请提供的一种主旋律提取模型训练方法流程图;

图3为本申请提供的一种歌声检测方法流程图;

图4为本申请提供的一种音乐检索方法流程图;

图5为本申请提供的一种主旋律提取模型线上更新逻辑示意图;

图6为本申请提供的一种服务器结构图;

图7为本申请提供的一种终端结构图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。另外,在本申请实施例中,“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。

现有提取歌曲主旋律时需要对歌曲信号进行源分离,然后对干声信号进行主旋律提取,所以旋律提取性能受制于源分离模型,提取复杂度也很高。当然,也可以使用机器学习方法提取歌曲主旋律,但现有机器学习方法需要需要懂乐理的标注人员在特制设备上边听边弹,以此录制旋律标签,因此标注数据的成本较高、效率较低。

鉴于目前所存在的上述问题,本申请提出了主旋律提取模型训练方案,该方案利用标注有主旋律的有标签歌曲音频帧以及未标注主旋律的无标签歌曲音频帧进行有监督训练和半监督训练,既增强了模型训练量,又能够使模型同时学习到有标签数据和无标签数据的处理能力,还无需额外进行数据标注工作,因此模型训练效率较高,模型泛化能力也得到了提升。并且,该方案可直接对歌曲音频进行处理,无需进行背景音和人声的分离,由此也能提升训练效率和主旋律提取效率。

为了便于理解,先对本申请所适用的物理框架进行介绍。

应理解,本申请提供的主旋律提取模型训练方法可以应用于具有主旋律提取模型训练功能的系统或程序中。具体的,具有主旋律提取模型训练功能的系统或程序可以运行于服务器、个人计算机等设备中。相应地,本申请提供的歌声检测方法可以应用于具有歌声检测功能的系统或程序中。具体的,具有歌声检测功能的系统或程序可以运行于服务器、个人计算机等设备中。

如图1所示,图1为本申请适用的物理架构示意图。在图1中,具有主旋律提取模型训练功能的系统或程序可以运行于服务器,该服务器通过网络从其他终端设备中获取训练集,从训练集获取有标签歌曲音频帧以及无标签歌曲音频帧;从有标签歌曲音频帧中提取有标签音频特征,从无标签歌曲音频帧中提取无标签音频特征;有标签音频特征和无标签音频特征均包括:频谱特征和倒谱特征;将有标签音频特征输入有监督学习模块,以对有监督训练模块中的目标模型进行有监督训练,并确定相应的有监督损失;将有标签音频特征和无标签音频特征输入半监督学习模块,以利用半监督学习模块对目标模型进行半监督训练,并确定相应的半监督损失;基于有监督损失和半监督损失确定综合损失;若综合损失收敛,则将当前目标模型确定为主旋律提取模型;否则,基于综合损失更新当前目标模型的模型参数,并从训练集中另选有标签歌曲音频帧和无标签歌曲音频帧对更新后的目标模型进行迭代训练,直至综合损失收敛。

相应地,该服务器通过网络从其他终端设备中获取目标歌曲,将目标歌曲中的各音频帧作为待检测音频帧;从待检测音频帧中提取待检测音频特征;将待检测音频特征输入主旋律提取模型,以使主旋律提取模型输出目标歌曲的主旋律;主旋律提取模型基于前述任一项所述的主旋律提取模型训练方法获得;将主旋律与目标歌曲的基准主旋律进行对比,并基于对比结果确定目标歌曲的歌声检测结果。

图1中示出了多种终端设备,在实际场景中可以有更多或更少种类的终端设备参与到主旋律提取模型训练或歌声检测的过程中,具体数量和种类因实际场景而定,此处不做限定,另外,图1中示出了一个服务器,但在实际场景中,也可以有多个服务器的参与,具体服务器数量因实际场景而定。

应当注意的是,本实施例提供的主旋律提取模型训练方法可以离线进行,即服务器本地存储有训练集,其可以直接利用本申请提供的方案训练得到主旋律提取模型。

可以理解的是,上述具有主旋律提取模型训练功能的系统、程序,可以作为云端服务程序的一种,具体运作模式因实际场景而定,此处不做限定。

具体的,在主旋律提取模型训练完成后,获得主旋律提取模型可用于翻唱识别、歌声评价等场景中。

结合以上共性,请参见图2,图2为本申请实施例提供的一种主旋律提取模型训练方法流程图。如图2所示,该主旋律提取模型训练方法可以包括以下步骤:

S201、从训练集获取有标签歌曲音频帧以及无标签歌曲音频帧。

其中,标签包括:相应歌曲音频帧是否有主旋律的标记,以及有主旋律时相应的主旋律序列(即基频序列)。歌曲音频帧即:对歌曲分帧、加窗处理后得到的一帧一帧的音频。

S202、从有标签歌曲音频帧中提取有标签音频特征,从无标签歌曲音频帧中提取无标签音频特征。

其中,有标签音频特征和无标签音频特征均包括:频谱特征和倒谱特征。

在一种具体实施方式中,从有标签歌曲音频帧中提取有标签音频特征,从无标签歌曲音频帧中提取无标签音频特征,包括:将有标签歌曲音频帧和无标签歌曲音频帧分别作为目标对象;将目标对象通过傅里叶变换转换为频谱特征;对频谱特征进行对数运算和傅里叶反变换,得到倒谱特征。可见,倒谱特征是对频谱特征进一步处理得到的。

S203、将有标签音频特征输入有监督学习模块,以对有监督训练模块中的目标模型进行有监督训练,并确定相应的有监督损失。

在一种具体实施方式中,将有标签音频特征输入有监督学习模块,以对有监督训练模块中的目标模型进行有监督训练,并确定相应的有监督损失,包括:将有标签音频特征输入有监督学习模块,以使有监督学习模块利用目标模型处理有标签音频特征,得到是否有主旋律的二分类预测结果和主旋律预测结果,将二分类预测结果、主旋律预测结果分别与有标签歌曲音频帧的标签之间的损失确定为有监督损失。可见,有监督损失包括两个损失值,一个是“二分类预测结果”与标签中的“是否有主旋律的标记”之间的损失(即目标公式中的L

S204、将有标签音频特征和无标签音频特征输入半监督学习模块,以利用半监督学习模块对目标模型进行半监督训练,并确定相应的半监督损失。

在本实施例中,S203和S204的执行顺序可以互换,也可以同时执行。本实施例仅在有监督学习模块中设置目标模型,半监督学习模块对有监督学习模块中的目标模型进行半监督训练。

在一种具体实施方式中,将有标签音频特征和无标签音频特征输入半监督学习模块,以利用半监督学习模块对目标模型进行半监督训练,并确定相应的半监督损失,包括:将有标签音频特征和无标签音频特征输入半监督学习模块,以使半监督学习模块执行下述步骤:利用目标模型处理有标签音频特征得到第一有标签预测结果;利用目标模型处理无标签音频特征得到第一无标签预测结果;利用目标模型处理有标签音频特征和扰动向量,得到第二有标签预测结果;利用目标模型处理无标签音频特征和扰动向量,得到第二无标签预测结果;计算第一有标签预测结果与第二有标签预测结果之间的第一损失、第一无标签预测结果与第二无标签预测结果之间的第二损失;将第一损失和第二损失之和的一半确定为半监督损失。

可见,半监督学习模块可使目标模型对增加扰动向量后得到的模型输出逼近不增加扰动向量得到的模型输出,从而可使目标模型对抗样本中的干扰。其中,扰动向量γ

其中,半监督损失的计算公式为:

S205、基于有监督损失和半监督损失确定综合损失。

在一种具体实施方式中,基于有监督损失和半监督损失确定综合损失,包括:利用目标公式计算综合损失,目标公式为:

其中,L

具体的,半监督损失L

其中,CE表示交叉熵损失函数,N*表示候选音高数量,Y

S206、判断综合损失是否收敛到预设阈值;若是,则执行S207;若否,则执行S208。

其中,综合损失是否收敛的条件可以为:综合损失足够小,或综合损失在连续几次迭代中无变化或变化很小,具体可以设定预设阈值进行判断。

S207、将当前目标模型确定为主旋律提取模型。

S208、基于综合损失更新当前目标模型的模型参数,并执行S201,以从训练集中另选有标签歌曲音频帧和无标签歌曲音频帧对更新后的目标模型进行迭代训练,直至综合损失收敛。

为了进一步提升主旋律提取模型的性能,可以对训练集进行增强,并利用增强后的训练集继续训练主旋律提取模型。在一种具体实施方式中,还包括:将音乐平台上的歌曲分帧后,对分帧得到的音频帧加窗,得到新无标签歌曲音频帧;将新无标签歌曲音频帧添加至训练集,得到新训练集;利用新训练集对主旋律提取模型继续训练,并将训练得到的新主旋律提取模型用于歌声检测。其中,歌声检测具体可以用于翻唱识别、歌声评价等。

可见,本实施例利用标注有主旋律的有标签歌曲音频帧以及未标注主旋律的无标签歌曲音频帧进行有监督训练和半监督训练,既增强了模型训练量,又能够使模型同时学习到有标签数据和无标签数据的处理能力,还无需额外进行数据标注工作,因此模型训练效率较高,模型泛化能力也得到了提升。并且,该方案可直接对歌曲音频进行处理,无需进行背景音和人声的分离,由此也能提升训练效率和主旋律提取效率。

下述实施例提供了主旋律提取模型的具体使用方案,具有以歌声检测为例进行介绍。

请参见图3,本实施例提供的歌声检测方法包括:

S301、获取目标歌曲。

S302、将目标歌曲中的各音频帧作为待检测音频帧。

S303、从待检测音频帧中提取待检测音频特征。

S304、将待检测音频特征输入主旋律提取模型,以使主旋律提取模型输出目标歌曲的主旋律;主旋律提取模型基于前述任一项所述的主旋律提取模型训练方法获得。

S305、将主旋律与目标歌曲的基准主旋律进行对比,并基于对比结果确定目标歌曲的歌声检测结果。

其中,目标歌曲的基准主旋律可认为是比较标准的歌曲主旋律,若模型输出的主旋律与基准主旋律相近,可认为S301步骤中的目标歌曲的歌声比较标准,否则认为S301步骤中的目标歌曲的歌声不够标准。其中,目标歌曲可以是用户录制的自己歌唱的歌曲,基准主旋律是原唱歌曲的主旋律,那么按照本实施例可以对比用户自己唱的歌和原唱歌曲的区别。

在一种具体实施方式中,还可以利用歌声检测结果进行翻唱识别和/或歌声评价。若歌声检测结果用于进行翻唱识别,那么可检测目标歌曲是否属于翻唱。若歌声检测结果用于进行歌声评价,那么可对目标歌曲的唱功进行评分。

可见,上述实施例训练得到的主旋律提取模型可广泛用于翻唱识别、歌声评价等场景,可见模型通用性较好,应用场景广泛。

下面通过具体的应用场景实例描述,来介绍本申请提供的主旋律提取模型训练方案。即:利用主旋律提取模型提取歌曲主旋律的应用方案。该方案可以用于翻唱识别、歌声评价等场景。

本实施例以音乐检索为例进行具体介绍,在服务器中设置主旋律提取模型。请参见图4,具体流程包括:

S401、用户在终端提交需要检索的歌曲音频。

S402、终端向服务器发送该歌曲音频。

S403、服务器将整个歌曲音频分为音频帧,将得到的各音频帧作为待检测音频帧。

S404、服务器从待检测音频帧中提取待检测音频特征。

S405、服务器将待检测音频特征输入主旋律提取模型,以使主旋律提取模型输出主旋律。

其中,主旋律提取模型基于前述任一实施例所述的主旋律提取模型训练方法获得。

S406、服务器将模型输出的主旋律与预设数据库中的各基准主旋律进行对比,若模型输出的主旋律与库中某一基准主旋律相似度最大,则获取该基准主旋律对应的歌曲音频。

S407、服务器将基准主旋律对应的歌曲音频发送至终端。

S408、用户在终端播放基准主旋律对应的歌曲音频和自己提交的歌曲音频,以进行对比。

其中,终端可以为智能手机、平板电脑、笔记本电脑或台式电脑等设备。用户在终端提交的歌曲可以是自己唱的歌曲,基准主旋律为原唱歌曲的主旋律,那么用户在终端播放原唱歌曲和自己提交的歌曲音频,就可以对比自己所唱歌曲与原唱歌曲的区别。当然,也可以使用歌曲评价工具分析模型输出的主旋律与相似度最大的基准主旋律的相似度,从而给用户所唱歌曲进行评分。

本实施例使用的主旋律提取模型可按照下述过程进行训练。基本处理流程包括:确定训练集、特征提取、有监督学习、半监督学习等。

其中,训练集可通过对已有歌曲分帧、加窗获得。分帧即:将歌曲信号分割成固定时间长度的信号帧,相邻帧间重叠。加窗即:为每个信号帧添加汉宁窗做平滑处理,以防止频谱泄露。训练集中的这些信号帧有的标注有标签,有的没有标注标签。标签即:相应音频帧是否有主旋律的标记,以及有主旋律时相应的主旋律序列。

特征提取即:提取上述各信号帧的频谱特征,并基于频谱特征确定倒谱特征。其中,对歌曲时域信号帧y(t)进行傅里叶变换可得到频谱特征Y

有监督学习即:使用训练集中的有标签音频帧进行有监督训练。具体的,有监督学习模块中的有监督模型可以采用SkipConvNet网络,该网络的输入数据为带标签的Y

半监督学习即采用虚拟对抗学习方式进行半监督训练。具体的,半监督学习模块也针对上述有监督模型进行训练,输入数据为表示有标签数据或无标签数据的Y

当有监督学习模块和半监督学习模块各迭代一次后,计算总损失,以平衡有监督学习和半监督学习的权重,计算公式为:

需要说明的是,利用有监督模块和半监督模块针对同一模型进行训练,如此可在不修改模型原结构及参数的情况下增加模型的loss,以产生正则化的效果,提升模型鲁棒性。

最后输出的主旋律提取模型可用于进行线上翻唱识别、歌声评价等。如此一来,模型在应用过程中会涉及更多新歌曲,而这些新歌曲可以用于增强训练集。如图5所示,主旋律提取模型在业务侧使用时,可及时填充曲库,从而得到新增无标签数据。数据新增后,可在本次利用有监督模块和半监督模块继续训练前次得到的主旋律提取模型,训练完成后,基于新得到的主旋律提取模型更新业务侧线上应用的模型。当然,线上系统可以定时同步拉取最新的离线模型。

可见,本实施例可通过前述学习框架训练一个基础的主旋律提取模型,在有新增的非标注数据时,在基础的主旋律提取模型上进一步迭代训练,从而提高模型对新数据的泛化性能。在提高模型性能的同时,降低对标注数据的依赖,还可以进一步提高主旋律提取模型的准确率,提高音乐信息检索等服务体验。

下面对本申请实施例提供的一种电子设备进行介绍,下文描述的一种电子设备与上述实施例的相关实现步骤可以相互参照。

进一步的,本申请实施例还提供了一种电子设备。其中,上述电子设备既可以是如图6所示的服务器50,也可以是如图7所示的终端60。图6和图7均是根据一示例性实施例示出的电子设备结构图,图中的内容不能被认为是对本申请的使用范围的任何限制。

图6为本申请实施例提供的一种服务器的结构示意图。该服务器50,具体可以包括:至少一个处理器51、至少一个存储器52、电源53、通信接口54、输入输出接口55和通信总线56。其中,所述存储器52用于存储计算机程序,所述计算机程序由所述处理器51加载并执行,以实现前述任一实施例公开的主旋律提取模型训练中的相关步骤。

本实施例中,电源53用于为服务器50上的各硬件设备提供工作电压;通信接口54能够为服务器50创建与外界设备之间的数据传输通道,其所遵循的通信协议是能够适用于本申请技术方案的任意通信协议,在此不对其进行具体限定;输入输出接口55,用于获取外界输入数据或向外界输出数据,其具体的接口类型可以根据具体应用需要进行选取,在此不进行具体限定。

另外,存储器52作为资源存储的载体,可以是只读存储器、随机存储器、磁盘或者光盘等,其上所存储的资源包括操作系统521、计算机程序522及数据523等,存储方式可以是短暂存储或者永久存储。

其中,操作系统521用于管理与控制服务器50上的各硬件设备以及计算机程序522,以实现处理器51对存储器52中数据523的运算与处理,其可以是Windows Server、Netware、Unix、Linux等。计算机程序522除了包括能够用于完成前述任一实施例公开的主旋律提取模型训练方法的计算机程序之外,还可以进一步包括能够用于完成其他特定工作的计算机程序。数据523除了可以包括应用程序的更新信息等数据外,还可以包括应用程序的开发商信息等数据。

图7为本申请实施例提供的一种终端的结构示意图,该终端60具体可以包括但不限于智能手机、平板电脑、笔记本电脑或台式电脑等。

通常,本实施例中的终端60包括有:处理器61和存储器62。

其中,处理器61可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器61可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器61也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器61可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器61还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。

存储器62可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器62还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。本实施例中,存储器62至少用于存储以下计算机程序621,其中,该计算机程序被处理器61加载并执行之后,能够实现前述任一实施例公开的由终端侧执行的主旋律提取模型训练方法中的相关步骤。另外,存储器62所存储的资源还可以包括操作系统622和数据623等,存储方式可以是短暂存储或者永久存储。其中,操作系统622可以包括Windows、Unix、Linux等。数据623可以包括但不限于应用程序的更新信息。

在一些实施例中,终端60还可包括有显示屏63、输入输出接口64、通信接口65、传感器66、电源67以及通信总线68。

本领域技术人员可以理解,图7中示出的结构并不构成对终端60的限定,可以包括比图示更多或更少的组件。

下面对本申请实施例提供的一种存储介质进行介绍,下文描述的一种存储介质与上述实施例的相关实现步骤可以相互参照。

进一步的,本申请实施例还公开了一种存储介质,所述存储介质中存储有计算机可执行指令,所述计算机可执行指令被处理器加载并执行时,实现前述任一实施例公开的主旋律提取模型训练方法。关于该方法的具体步骤可以参考前述实施例中公开的相应内容,在此不再进行赘述。

需要指出的是,上述仅为本申请的较佳实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。

本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号