首页> 中国专利> 一种歌曲演唱评价方法及系统

一种歌曲演唱评价方法及系统

页面导航

摘要
著录项
说明书
相似文献

摘要

本发明公开一种歌曲演唱评价方法及系统。其中，该方法包括：实时获取演唱者的演唱音频，实时按顺序将所述演唱音频进行时域切片，并实时将当前时域切片进行傅里叶变换得到其对应的当前频域信号，计算该当前频域信号的当前频域向量；将所述当前频域向量与原唱对应时域切片的原唱频域向量进行余弦相似度计算，得到当前时域切片对应的相似度值；根据所有时域切片的相似度值计算得到歌曲评价值。通过本发明的余弦相似度计算，体现演唱者在演唱部分内的音高、音色以及节奏与原唱歌曲的匹配度，解决了现有技术中歌曲评分精度不高的问题。

著录项

公开/公告号CN113284482A

专利类型发明专利
公开/公告日2021-08-20

原文格式PDF
申请/专利权人北京雷石天地电子技术有限公司;
展开▼

申请/专利号CN202110394502.7
发明设计人马哲;刘剑;
展开▼

申请日2021-04-13
分类号G10L15/04(20130101);G10L15/10(20060101);G10L25/51(20130101);
代理机构11829 北京城烽知识产权代理事务所(特殊普通合伙);
代理人王新月
地址 100101 北京市朝阳区天畅园8号楼3层8-307
入库时间 2023-06-19 12:16:29

说明书

技术领域

本发明涉及歌曲评分技术领域，具体而言，涉及一种歌曲演唱评价方法及系统。

背景技术

随着网络技术和电子技术的发展，唱歌也越来越受到大众的喜爱，在KTV中，演唱者通过歌曲评分来实时记录自己的演唱水平。

而现有的KTV歌曲评分中，都是通过歌词文本根据演唱者演唱的歌词速率和时间匹配度进行评分，该评分方法精度不高。

针对现有技术中歌曲评分精度不高的问题，目前尚未提出有效的解决方案。

发明内容

本发明实施例中提供一种歌曲演唱评价方法及系统，以解决现有技术中歌曲评分精度不高的问题。

为达到上述目的，一方面，本发明提供了一种歌曲演唱评价方法，该方法包括：

实时获取演唱者的演唱音频，实时按顺序将所述演唱音频进行时域切片，并实时将当前时域切片进行傅里叶变换得到其对应的当前频域信号，计算该当前频域信号的当前频域向量；

将所述当前频域向量与原唱对应时域切片的原唱频域向量进行余弦相似度计算，得到当前时域切片对应的相似度值；

根据所有时域切片的相似度值计算得到歌曲评价值。

可选的，在所述实时获取演唱者的演唱音频之前，包括：

预先将原唱歌曲进行时域切片，并将每个原唱时域切片进行傅里叶变换，得到每个原唱时域切片对应的原唱频域信号；

计算每个原唱频域信号的原唱频域向量；

其中，所述对原唱歌曲进行时域切片以及对演唱者音频进行时域切片所采用的时间步长相等，且每个原唱时域切片与每个当前时域切片按时序一一对应。

可选的，所述实时获取演唱者的演唱音频包括：

实时获取演唱者的音高数据、音色数据以及音调节奏数据。

可选的，所述根据所有时域切片的相似度值计算得到歌曲评价值包括：

将所有时域切片的相似度值求平均，得到平均相似度值；

根据所述平均相似度值计算得到歌曲评价值。

可选的，所述将每个原唱时域切片进行傅里叶变换，得到每个原唱时域切片对应的原唱频域信号包括：

将每个原唱时域切片进行归一化；

将归一化后的每个原唱时域切片进行傅里叶变化，得到每个原唱时域切片对应的原唱频域信号。

另一方面，本发明提供了一种歌曲演唱评价系统，包括：

演唱转换单元，用于实时获取演唱者的演唱音频，实时按顺序将所述演唱音频进行时域切片，并实时将当前时域切片进行傅里叶变换得到其对应的当前频域信号，计算该当前频域信号的当前频域向量；

相似度计算单元，用于将所述当前频域向量与原唱对应时域切片的原唱频域向量进行余弦相似度计算，得到当前时域切片对应的相似度值；

评分单元，用于根据所有时域切片的相似度值计算得到歌曲评价值。

可选的，包括：

第一预处理单元，用于预先将原唱歌曲进行时域切片，并将每个原唱时域切片进行傅里叶变换，得到每个原唱时域切片对应的原唱频域信号；

第二预处理单元，用于计算每个原唱频域信号的原唱频域向量；

可选的，所述评分单元包括：

平均值计算模块，用于将所有时域切片的相似度值求平均，得到平均相似度值；

评分计算模块，用于根据所述平均相似度值计算得到歌曲评价值。

可选的，所述第一预处理单元包括：

归一化转换模块，用于将每个原唱时域切片进行归一化；

傅里叶转换模块，用于将归一化后的每个原唱时域切片进行傅里叶变化，得到每个原唱时域切片对应的原唱频域信号。

另一方面，本发明实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，所述程序被处理器执行时实现上述歌曲演唱评价方法。

本发明的有益效果：

本发明提供了一种歌曲演唱评价方法，该方法对演唱者演唱的音频实时切片并进行傅里叶变化以得到当前频域向量，与原唱音频对应的原唱频域向量进行余弦相似度计算。通过采用余弦相似度，更能体现演唱者在演唱部分内的音高、音色以及音调节奏与原唱歌曲的匹配度，从而能提高歌曲评分的精准度。

附图说明

图1是本发明实施例提供的一种歌曲演唱评价方法的流程图；

图2是本发明实施例提供的一种歌曲演唱评价方法的预处理流程的示意图；

图3是本发明实施例提供的一种歌曲演唱评价系统的结构示意图；

图4是本发明实施例提供的一种歌曲演唱评价系统的预处理部分的结构示意图。

具体实施方式

为了使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明作进一步地详细描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

现有的KTV歌曲评分中，都是通过歌词文本根据演唱者演唱的歌词速率和时间匹配度进行评分，该评分方法精度不高。

因而，本发明提供了一种歌曲演唱评价方法，图1是本发明实施例提供的一种歌曲演唱评价方法的流程图，如图1所示，该方法包括：

S103.实时获取演唱者的演唱音频，实时按顺序将所述演唱音频进行时域切片，并实时将当前时域切片进行傅里叶变换得到其对应的当前频域信号，计算该当前频域信号的当前频域向量；

例如，演唱者在演唱歌曲“白狐”时，实时将演唱音频以5秒为一个步长进行音频时域切片，当演唱完第5s时，将该音频切片并进行傅里叶变化得到对应的当前频域信号，当演唱者演唱到23s时，实时将演唱的15-20s的音频进行时域切片，并将该切片进行傅里叶变换得到对应的当前频域信号，对该当前频域信号进行计算以得到当前频域向量。

S104.将所述当前频域向量与原唱对应时域切片的原唱频域向量进行余弦相似度计算，得到当前时域切片对应的相似度值；

例如，当演唱者演唱到第5s时，将0-5s对应的当前频域向量与原唱音频0-5s对应的原唱频域向量进行余弦相似度计算以得到当前时域切片对应的相似度值；又如，当演唱者演唱到第23s时，将15-20s对应的当前频域向量与原唱音频15-20s对应的原唱频域向量进行余弦相似度计算以得到当前时域切片对应的相似度值。

其中，所述余弦相似度是通过向量空间中两个向量夹角的余弦值来衡量原唱音频与演唱音频的相似度。

S105.根据所有时域切片的相似度值计算得到歌曲评价值。

假设，歌曲“白狐”的音频总长为30s，当演唱者演唱完毕时，则根据0-5s，5-10s，10-15s，15-20s，20-25s，25-30s的所有时域切片的相似度值计算得到歌曲评价值；

又如，当演唱者演唱到23s时，自动结束该歌曲的演唱，此时，则根据实时时域切片的0-5s，5-10s，10-15s，15-20s对应的相似度值计算得到该歌曲评价值。

本发明中，通过采用余弦相似度来计算得到歌曲评价值，相比距离度量，余弦相似度更加注重两个向量在方向上的差异，即演唱音频与原唱音频的“走势”，而非距离或长度上。因而更能体现演唱者在演唱部分内的音高、音色以及节奏与原唱歌曲的匹配度，从而能提高歌曲评分的精准度。

在本实施例的一个可选的实施方式中，所述S101之前还包括对原唱歌曲的预处理，图2是本发明实施例提供的一种歌曲演唱评价方法的预处理流程的示意图，如图示，还包括：

S101.预先将原唱歌曲进行时域切片，并将每个原唱时域切片进行傅里叶变换，得到每个原唱时域切片对应的原唱频域信号；

时域分析与频域分析是对模拟信号的两个观察面。一般而言，时域的表示较为形象与直观，频域分析则更为简练、深刻和方便。对音频信号进行时域分析时，有时原唱音频信号与演唱音频信号的时域参数相同，但并不能说明两个音频信号就完全相同。因为音频信号不仅随时间变化，还与频率、相位等信息有关，这就需要进一步分析音频信号的频率结构，并在频率域中对音频信号进行描述。因而需将每个原唱时域切片进行傅里叶变换，以得到每个原唱时域切片对应的原唱频域信号。

例如，演唱歌曲“白狐”，其原唱音频总长为30s，需将原唱音频以5秒为一个步长进行原唱时域切片，所述对原唱歌曲进行时域切片以及对演唱者音频进行时域切片所采用的时间步长相等(即若原唱音频是以4秒为一个步长进行原唱时域切片，则上述演唱音频也需以4秒为一个步长进行音频时域切片。)，切片完成后，将0-5s，5-10s，10-15s，15-20s，20-25s，25-30s的原唱时域切片进行傅里叶变换，得到每个原唱时域切片对应的原唱频域信号。

S102.计算每个原唱频域信号的原唱频域向量；

通过计算可提取到每个原唱频域信号对应的原唱频域向量，之后将所有原唱频域向量保存并标记时间轴，以供后续与演唱者的当前频域向量计算得到当前时域切片对应的相似度值。例如音频的0-5s的切片转换为频域向量，标记为0；5-10s的切片转换为频域向量，标记为5，以此类推处理完要进行评分的所有原唱音频文件并保存。

本发明中，通过获取原唱音频向量并保存，可以实时供后续与演唱者的当前频域向量计算得到当前时域切片对应的相似度值。

在上述实施方式的基础上进一步优化，所述实时获取演唱者的演唱音频包括：

实时获取演唱者的音高数据、音色数据以及音调节奏数据。

本发明中，演唱者的演唱音频的时域信号的振幅代表了音频的音高、音色以及音调节奏，进而，原唱音频的时域信号的振幅同样代表了音频的音高、音色以及音调节奏，通过将当前音频向量与原唱音频向量作比较，可体现演唱者在演唱部分内的音高、音色以及音调节奏与原唱歌曲的匹配度，从而能提高歌曲评分的精准度。

在上述实施方式的基础上进一步优化，所述根据所有时域切片的相似度值计算得到歌曲评价值包括：将所有时域切片的相似度值求平均，得到平均相似度值；根据所述平均相似度值计算得到歌曲评价值。

例如，音频总长为30s的歌曲“白狐”，当演唱者演唱完毕时，则将0-5s，5-10s，10-15s，15-20s，20-25s，25-30s的所有时域切片的相似度值求平均得到平均相似度值；进而将得出的平均相似度值进行sigmoid函数计算得到的数值*100即可得出百分制的歌曲评价值。

又如，当演唱者演唱到23s时，自动结束该歌曲的演唱，此时，则将实时时域切片的0-5s，5-10s，10-15s，15-20s对应的相似度值求平均得到平均相似度值；进而将得出的平均相似度值进行sigmoid函数计算得到的数值*100即可得出百分制的歌曲评价值。

在上述实施方式的基础上进一步优化，所述将每个原唱时域切片进行傅里叶变换，得到每个原唱时域切片对应的原唱频域信号包括：将每个原唱时域切片进行归一化；将归一化后的每个原唱时域切片进行傅里叶变化，得到每个原唱时域切片对应的原唱频域信号。

本发明中，先将每个原唱时域切片进行归一化，即将每个原唱时域切片求均值，再将每个时域切片中的每个数据减去均值归一化；归一化后的每个原唱时域切片再进行傅里叶变化，可得到每个原唱时域切片对应的原唱频域信号。

进一步的，演唱者实时按顺序将所述演唱音频进行时域切片后，也需将当前时域切片进行归一化，所述归一化与上述原唱时域切片归一化相同，归一化后的当前时域切片再进行傅里叶变化，可得到当前时域切片对应的当前频域信号。

另一方面，本发明提供了一种歌曲演唱评价系统，图3是本发明实施例提供的一种歌曲演唱评价系统的结构示意图，如图3所示，该系统包括：

演唱转换单元203，用于实时获取演唱者的演唱音频，实时按顺序将所述演唱音频进行时域切片，并实时将当前时域切片进行傅里叶变换得到其对应的当前频域信号，计算该当前频域信号的当前频域向量；

相似度计算单元204，用于将所述当前频域向量与原唱对应时域切片的原唱频域向量进行余弦相似度计算，得到当前时域切片对应的相似度值；

其中，所述余弦相似度是通过向量空间中两个向量夹角的余弦值来衡量原唱音频与演唱音频的相似度。

评分单元205，用于根据所有时域切片的相似度值计算得到歌曲评价值。

又如，当演唱者演唱到23s时，自动结束该歌曲的演唱，此时，则根据实时时域切片的0-5s，5-10s，10-15s，15-20s对应的相似度值计算得到该歌曲评价值。

在本实施例的一个可选的实施方式中，还包括预处理部分，图4是本发明实施例提供的一种歌曲演唱评价系统中，预处理部分的结构示意图，如图示，该预处理部分包括：

第一预处理单元201，用于预先将原唱歌曲进行时域切片，并将每个原唱时域切片进行傅里叶变换，得到每个原唱时域切片对应的原唱频域信号；

第二预处理单元202，用于计算每个原唱频域信号的原唱频域向量；

在上述实施方式的基础上进一步优化，所述评分单元205包括：平均值计算模块，用于将所有时域切片的相似度值求平均，得到平均相似度值；评分计算模块，用于根据所述平均相似度值计算得到歌曲评价值。

在上述实施方式的基础上进一步优化，所述第一预处理单元201包括：归一化转换模块，用于将每个原唱时域切片进行归一化；傅里叶转换模块，用于将归一化后的每个原唱时域切片进行傅里叶变化，得到每个原唱时域切片对应的原唱频域信号。

另一方面，本发明还提供了一种计算机可读存储介质，其上存储有计算机程序，所述程序被处理器执行时实现上述的歌曲演唱评价方法。

上述存储介质中存储有上述软件，该存储介质包括但不限于：光盘、软盘、硬盘、可擦写存储器等。

本发明的有益效果：

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 一种歌曲演唱评价方法及系统 [P] . 中国专利： CN113284482A . 2021-08-20
2. 一种歌曲演唱评价方法及系统 [P] . 中国专利： CN109686376A . 2019-04-26
3. Song singing system, has correlation calculating module calculating correlation coefficient between reference recording and recording of user and hitting statement about quality of recording of user based on calculated coefficient [P] . 德国专利： DE202006012890U1 . 2006-12-28

机译：歌曲演唱系统，具有相关性计算模块，该相关性计算模块计算参考记录和用户记录之间的相关系数，并基于计算出的系数来计算关于用户记录质量的击打语句
4. KARAOKE SYSTEM EQUIPPED WITH LIGHTING FUNCTION, CAPABLE OF ILLUMINATING VARIOUS COLOURED BEAMS ACCORDING TO SONG SUNG BY USER [P] . 韩国专利： KR20050019358A . 2005-03-03

机译：配备照明功能的卡拉OK系统，能够照亮用户根据歌曲演唱的各种彩色光束
5. Network based music playing/song accompanying service system and method [P] . 美国专利： US2003014262A1 . 2003-01-16

机译：基于网络的音乐歌曲演唱服务系统及方法