法律状态公告日
法律状态信息
法律状态
2013-01-16
授权
授权
2010-01-27
实质审查的生效
实质审查的生效
2009-12-02
公开
公开
技术领域
本发明涉及媒体编码技术,尤其涉及一种双通道音频编码中单通道信号的生成方法和装置。
背景技术
在移动通讯和IP通讯中,随着宽带传输越来越普及,各种宽带业务也越来越丰富,在各种宽带业务中需要高质量的音频和语音通讯。例如,手持视频电话业务中的语音通讯,视频会议系统的语音通讯,以及多点通讯中高质量的语音及立体环境。
目前,高质量的立体声的语音通讯得到了比较快的发展。在对立体声语音信号进行编码传输中,采用单通道-立体声嵌入式可扩展的配置,以达到在接收端可以更好的恢复单通道和立体声的信号。
现存的多通道编码技术粗略分为两类:参数编码技术和非参数编码技术。在非参数编码技术中,不同的通道独立进行编码。参数编码技术利用通道间的互相关来进行去冗余处理,并且阻止编码速率随通道数成倍增长。
一种典型的参数立体声框架的结构示意图如图1所示。左右通道首先通过下混过程生成较强的单通道信号以及边信号,该下混过程需要充分利用左右通道间的相关性,最大限度地提取左右通道间的幅度和时间延迟上的差异,来实现生成最大的单通道信号。生成的单通道信号以及边信号被送到核心编码器和立体声编码器中,然后,对核心编码器和立体声编码器输出的信号进行码流合成处理。
现有技术中的一种实现立体声框架的下混过程的方法的原理图如图2所示。具体处理过程为:
进行通道间预测及分析处理获得通道间预测参数,该预测及分析处理需要充分利用第一通道和第二通道间的相关性,来得到第一通道和第二通道间的延迟差和幅度比;根据上述获取的预测参数,即第一通道和第二通道间的延迟差和幅度比获取中间预测参数;利用上述获得的中间预测参数以及第一和第二通道的预测信号生成单通道信号。在实现本发明的过程中,发明人发现上述现有技术中存在以下至少一个缺点:当前后相邻两帧的通道间延迟不一致的时候,生成的单通道信号在帧间存在不连续的现象,这种不连续的现象会造成核心编码器的效率降低。
发明内容
本发明的目的是提供一种双通道音频编码中单通道信号的生成方法和装置,从而可以解决单通道信号存在不连续现象的问题。
本发明的目的是通过以下技术方案实现的:
一种双通道音频编码中单通道信号的生成方法,包括:
当第一通道中当前帧的通道间相关延迟和所述第一通道中前一帧的通道间相关延迟不一致时,对从所述第一通道中前一帧的结尾开始的部分长度的信号进行压缩或扩展,获得指定长度的信号,所述部分长度和指定长度的值大于或等于所述前一帧的通道间相关延迟和所述当前帧的通道间相关延迟之间的差值;
将所述第一通道中的指定长度的信号和第二通道中的与所述指定长度的信号对应的信号进行和运算生成单通道的信号,将所述第一通道中的当前帧中所述指定长度之外的其它信号按照当前帧的通道间相关延迟进行延迟后,和第二通道中的对应信号进行和运算生成单通道的信号。
一种双通道音频编码中单通道信号的生成装置,包括:
信号调整模块,用于当第一通道中当前帧的通道间相关延迟和所述第一通道中前一帧的通道间相关延迟不一致时,对从所述第一通道中前一帧的结尾开始的部分长度的信号进行压缩或扩展,获得指定长度的信号,所述部分长度和指定长度的值大于或等于所述前一帧的通道间相关延迟和所述当前帧的通道间相关延迟之间的差值;
信号生成模块,用于将所述第一通道当前帧中的指定长度的信号和第二通道中的与所述指定长度的信号对应的信号进行和运算生成单通道的信号,将所述当前帧中所述指定长度之外的其它信号按照当前帧的通道间相关延迟进行延迟后和第二通道中的对应信号进行和运算生成单通道的信号。
由上述本发明提供的技术方案可以看出,本发明实施例通过在前后帧的通道间相关性延迟不一致时,通过变采样方法对信号进行压缩或扩展,以使信号的延迟在帧间变化平滑,从而保证了生成的单通道信号的连续性,进一步提高了核心编码器的编码效率。
附图说明
图1为现有技术中一种典型的参数立体声框架的结构示意图;
图2为现有技术中的一种实现立体声框架的下混过程的方法的原理图;
图3为本发明实施例提供的单通道信号的生成方法的处理流程图;
图4为本发明实施例提供的在当前帧的最大相关延迟小于前一帧的最大相关延迟时,按照不考虑帧间的最大相关延迟不一致的方法生成的单通道信号存在不连续的情况示意图;
图5为本发明实施例提供的在当前帧的最大相关延迟小于前一帧的最大相关延迟时,用变采样方法生成的连续的单通道信号示意图;
图6为本发明实施例提供的在当前帧的最大相关延迟大于前一帧的最大相关延迟时,用变采样方法生成的连续的单通道信号示意图;
图7为本发明实施例提供的双通道音频编码中单通道信号的生成装置的结构示意图;
图8为本发明实施例所述的双通道音频编码中单通道信号的生成装置的应用场景示意图。
具体实施方式
在本发明实施例中,对当前帧的通道间的相关函数通过加权函数进行加权处理,获取加权处理后的相关函数的最大值,将该最大值确定为所述当前帧的通道间相关延迟。同样,按照上述处理过程,获取前一帧的通道间相关延迟。
当第一通道中当前帧的通道间相关延迟和前一帧的通道间相关延迟不一致时,对从所述前一帧的结尾开始的部分长度的信号通过变采样方法进行压缩或扩展,获得指定长度的信号。所述部分长度和指定长度的值大于或等于所述当前帧的通道间相关延迟和所述前一帧的通道间相关延迟之间的差值。
然后,将所述指定长度的信号和第二通道中的对应信号进行和运算生成单通道的信号,将所述当前帧中所述指定长度之外的其它信号按照当前帧的通道间相关延迟进行延迟后,和第二通道中的对应信号进行和运算生成单通道的信号。
下面结合附图来详细描述本发明实施例,以双通道立体声音频编码为例,本发明实施例提供的双通道音频编码中单通道信号的生成方法的处理流程如图3所示,包括如下步骤:
步骤31、对左右通道间的相关函数进行加权处理,获取左右通道间的最大相关延迟。
通过加权函数对右通道相对于左通道的相关函数进行加权处理,获取加权处理后的相关函数的最大值,将该最大值确定为右通道相对于左通道的最大相关延迟。同样,按照上述处理过程,获取左通道相对于右通道的最大相关延迟。
假设左通道信号为L(n),右通道信号为R(n)。
针对某个数据帧,右通道相对于左通道的相关函数为:
其中,n从0到N-1,m从0到M-1,N为上述数据帧的长度,M为左右通道延迟的最大值,一个n对应于上述某个数据帧中的一个采样点。
为了减少上述相关函数的误差,同时避免预测值的变化过快,本发明实施例通过加权函数w(m)对上述相关函数进行加权处理,该加权处理步骤包括:
rrlw(m)=rrl(m)*w(m)
rlrw(m)=rlr(m)*w(m)
其中,加权函数w(m)可以是线性递减的函数,也可以是其它形式的加权函数。
求取上述加权后的rrlw(m)的最大值,该最大值对应的n为Drm,即:rrl(Drm)=max(rrlw(m)),该Drm即为右通道相对于左通道的最大相关延迟。
求取上述加权后的rlr(Dlm)的最大值,该最大值对应的n为Dlm,即:rlr(Dlm)=max(rlrw(m)),该Dlm即为左通道相对于右通道的最大相关延迟。
按照上述处理过程,可以计算出右通道中当前帧的右通道相对于左通道的最大相关延迟,该最大相关延迟即为右通道中当前帧的通道间相关延迟。
同样可以计算出右通道中前一帧的通道间相关延迟,以及左通道中当前帧和前一帧的通道间相关延迟。
步骤32、当存在帧间的通道间相关延迟不一致时,通过变采样方法来对左通道或右通道进行扩展和压缩,生成连续的单通道信号。
下面以固定左通道,对右通道进行扩展或压缩为例来说明本发明实施例所述方法的处理流程。在实际应用中,还可以固定右通道,对左通道进行扩展或压缩。
当右通道中当前帧的通道间相关延迟和前一帧的通道间相关延迟不一致时,对从右通道中前一帧的结尾开始的部分长度的信号进行压缩或扩展,获得指定长度的信号。所述部分长度和指定长度的值必须大于或等于所述前一帧的通道间相关延迟和所述当前帧的通道间相关延迟之间的差值,比如,可以为该差值的3或4等整数倍,从而可以保证将所述前一帧和当前帧之间的空隙部分完全填充,或者,将所述前一帧和当前帧之间的重叠部分完全替换。
将右通道中所述指定长度的信号和左通道中与所述指定长度的信号对应的信号进行和运算生成单通道的信号。将右通道的当前帧中所述指定长度之外的其它信号按照上述当前帧的通道间相关延迟进行延迟后,和左通道中的对应信号进行和运算生成单通道的信号。
当获取了上述针对某个帧的通道间相关延迟后,在不考虑帧间的通道间相关延迟不一致的情况下,以固定左通道为例,生成的单通道信号为:M(n)=gl*L(n)+gr*R(n-Drm)。
上述gl和gr为左右通道的增益,下面以gl=gr=1/2为例来说明本发明实施例,gl和gr还可以取其他值。
在实际应用中,右通道(当固定右通道时则为左通道)中的当前帧的通道间相关延迟Drmc和前一帧的通道间相关延迟Drmp往往不一致,比如,Drmc<Drmp,此时,按照上述不考虑帧间的通道间相关延迟不一致的方法生成的单通道信号,将存在如图4所示的不连续的情况。在对生成的单通道信号进行编码时,由于信号的不连续会导致编码效率的下降。
本发明实施例设定左右通道间的相关性延迟是一个慢变化的过程,当Drmc和Drmp不一致时,认为在右通道中,当前帧的前部分的帧间相对延迟是从Drmp线性变化到Drmc的,利用变采样方法对右通道中部分长度的信号进行压缩/伸展,以达到消除帧间延迟的突变导致生成的单通道信号的不连续现象,上述部分区间从前帧的末端开始选取。
右通道中部分长度的信号进行压缩/伸展处理后得到的指定长度的信号为上述变采样方法存在多种,本发明实施例采用带限内插的方法,但是并不限于带限内插的方法。
当前后帧的延迟Drmp,Drmc不相同的情况下,包括两种情况,Drmp>Drmc和Drmp<Drmc,下面就分别对这两种情况进行描述:
1、当Drmp>Drmc时,在按照式M(n)=(L(n)+R(n-Drm))/2计算生成的单通道信号的过程中,在右通道的当前帧和上一帧的连接处存在有空隙,空隙的长度为Drmp-Drmc,即右通道存在丢失部分信号的情况。
为解决上述信号丢失的问题,将从右通道的上帧的结尾算起,长度为K*(Drmp-Drmc)的信号通过变采样技术压缩为(K-1)*(Drmp-Drmc)的信号,上述K为预先设定的数值,可以为4或3等,即部分长度为K*(Drmp-Drmc),指定长度为(K-1)*(Drmp-Drmc)。即实现将当前帧中的部分信号填充到上述空隙中,从而保证了右通道中信号的连续性。
通过带限内插的方法来压缩信号是比较经典的方法,在应用中需要根据性能要求来设计不同的系数,通过进行上采样、滤波和下采样处理来完成。结合右通道的当前最大相关延迟,压缩处理后的右通道信号为:
上述一个n代表上述某个数据帧中的一个采样点,(K-1)*(Drmp-Drmc)代表压缩处理后的指定长度的值,代表压缩处理后的指定长度的信号。
2、当Drmp<Drmc时,在按照式M(n)=(L(n)+R(n-Drm))/2计算生成的单通道信号的过程中,在右通道当前帧和上一帧的连接处有重叠现象,重叠区间的长度为:Drmc-Drmp,即右通道存在信号重叠的情况。
为解决上述信号重叠的问题,通过将从右通道上帧的结尾算起,长度为(K-1)*(Drmc-Drmp)的信号通过变采样技术扩展为(K)*(Drmc-Drmp)的信号,即部分长度为(K-1)*(Drmc-Drmp),指定长度为K*(Drmc-Drmp)。实现了将当前帧中的部分信号填充到上述重叠区间中,既保证了右通道中信号的连续性,又消除了右通道中信号的重叠现象。
结合右通道的当前最大相关延迟,扩展处理后的右通道信号为:
上述一个n代表上述某个数据帧中的一个采样点,(K)*(Drmc-Drmp)代表扩展处理后的指定长度的值,代表扩展处理后的指定长度的信号。
上述压缩或扩展处理后的右通道信号在不同的延迟下变的相对平滑,根据上述生成的连续的单通道信号为:
1、当Drmp>Drmc时,上述指定长度为(K-1)*(Drmp-Drmc),并且,
因此,上述M(n)的计算公式可以转化为:
即在上述指定长度内,将右通道中的压缩处理后的指定长度的信号和左通道中的对应信号进行直接相加。
M(n)=(L(n)+R(n-Dmc))/2(K-1)*(Drmp-Drmc)<n<NN为数据帧的长度
即在上述指定长度外,将右通道中的原始信号R(n)按照当前帧的通道间相关延迟Dmc进行延迟后,和左通道中的对应信号进行相加。
在该情况下,生成的连续的单通道信号如图5所示。
2、当Drmp<Drmc时,上述指定长度为K*(Drmc-Drmp),并且,
因此,上述M(n)的计算公式可以转化为:
即在上述指定长度内,将右通道中的扩展处理后的指定长度的信号和左通道中的对应信号进行直接相加。
M(n)=(L(n)+R(n-Dmc))/2K*(Drmc-Drmp)<n<NN为数据帧的长度
即在上述指定长度外,将右通道中的原始信号R(n)按照当前帧的通道间相关延迟Dmc进行延迟后,和左通道中的对应信号进行相加。
下面描述本发明实施例所述方法的一个具体应用实例。
对于第m帧的左声道的信号为L(n),右声道的信号为R(n)。左右声道互相关的关联的最大长度为16,求右通道相对左通道的相关函数为:
线形递减的加权函数为:w(n)=(16-n)/16,0≤n<16,加权处理后的右通道相对左通道的相关函数为:
rrlw(m)=rrl(m)*w(m)
求取上述加权后的rrlw(m)的最大值,该最大值对应的n为Drm,即:rrl(Drm)=max(rrlw(m))。该Drm即为当前帧的右通道相对于左通道的最大相关延迟,假设为9。
假设前一帧即m-1帧的延迟为5,当前帧的延迟9大于前一帧的延迟5。于是,将从右通道上帧的结尾算起,长度为(9-5)*4的信号通过变采样技术扩展为(9-5)*5的信号,即部分长度为(9-5)*4,指定长度为(9-5)*5。如图6所示将黑实线部分的信号扩展为黑虚线部分的信号。
在帧间的部分,从0到(9-5)*5部分采用扩展后的右声道信号和左声道信号直接相加生成单通道信号;对于一帧的其他部分,结合右声道的当前帧的延迟得到单通道信号,单通道信号计算公式如下:
M(n)=(L(n)+R(n-9))/2(9-5)*5≤n<FrameLen。
本发明实施例提供的双通道音频编码中单通道信号的生成装置的结构示意图如图7所示,包括如下模块:
通道间相关延迟获取模块71,用于对所述当前帧的通道间的相关函数进行加权处理,获取加权处理后的相关函数的最大值,将该最大值确定为所述当前帧的通道间相关延迟;对所述前一帧的通道间的相关函数进行加权处理,获取加权处理后的相关函数的最大值,将该最大值确定为所述前一帧的通道间相关延迟。
信号调整模块72,用于当第一通道中当前帧的通道间相关延迟和所述第一通道中前一帧的通道间相关延迟不一致时,对从所述第一通道中前一帧的结尾开始的部分长度的信号进行压缩或扩展,获得指定长度的信号,所述部分长度和指定长度的值大于或等于所述前一帧的通道间相关延迟和所述当前帧的通道间相关延迟之间的差值。包括:信号压缩模块721和信号扩展模块722。
信号生成模块73,用于将所述第一通道中指定长度的信号和第二通道中的与所述指定长度的信号对应的信号进行和运算生成单通道的信号,将所述当前帧中所述指定长度之外的其它信号按照当前帧的通道间相关延迟进行延迟后和第二通道中的对应信号进行和运算生成单通道的信号。
上述的信号调整模块中的信号压缩模块721,用于当第一通道中当前帧的通道间相关延迟小于前一帧的通道间相关延迟时,对从所述前一帧的结尾开始的部分长度的信号进行压缩,获得指定长度的信号,所述部分长度的值大于所述指定长度的值;
上述的信号调整模块中的信号扩展模块722,用于当第一通道中当前帧的通道间相关延迟大于前一帧的通道间相关延迟时,对从所述前一帧的结尾开始的部分长度的信号进行扩展,获得指定长度的信号,所述部分长度的值小于所述指定长度的值。
上述本发明实施例所述的双通道音频编码中单通道信号的生成装置在立体声通讯中的应用场景示意图如图8所示,该装置根据接收到的左声道和右声道的信号生成单通道信号,将该单通道信号传输给核心编码器。核心编码器对接收到的单通道信号进行编码后,将编码后的信号分别与左声道信号和右声道信号进行和运算,分别对左右声道进行互相关预测。将预测处理后的左声道和右声道的残差信号传输给量化模块。
综上所述,本发明实施例所述方法和装置在前后帧的通道间相关性延迟不一致时,通过变采样方法对信号进行压缩或扩展,以使信号的延迟在帧间变化平滑,从而保证了生成的单通道信号的连续性。
本发明实施例所述方法和装置采用加权的相关函数来估计通道间相关性延迟,从而减少了相关函数的误差,避免了通道间相关性延迟的预测值的变化过快。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。
机译: 多通道编码器,包含在多通道编码器中的信号处理器,在多通道编码器中编码输入信号的方法,根据编码方法生成的编码输出数据,多通道解码器,用于信号处理的信号处理器通道解码器,以及在多通道解码器中解码编码数据的方法
机译: 多通道音频编码器,多通道音频解码器,将n个音频信号编码为m个音频信号和相关参数数据,将k个音频信号和相关参数数据解码为n个音频信号并发送和接收编码的多通道音频的方法信号,编码的多通道音频信号,存储介质,传输系统,发送器,接收器,多通道音频播放器,多通道音频记录器以及计算机程序产品
机译: 用于合成双耳音频信号的方法和装置;一种合成立体声音频信号的方法;参数音频解码器;计算机程序上存储的计算机程序产品,可在数据处理设备中执行以执行用于处理音频信号参数编码ADO的数据处理设备,该信号至少包括多个音频通道的组合信号和一组或多组音频描述多声道声像的相应信息;产生编码音频信号参数的方法;音频编码器,用于生成参数音频信号。 Etricamente编码;计算机程序的产品。通过计算机存储在计算机中,并在数据处理设备中可执行以生成编码的音频信号参数