首页> 中国专利> 一种用于声学回声消除的多带结构自适应滤波器切换方法

一种用于声学回声消除的多带结构自适应滤波器切换方法

摘要

本发明公开了一种用于声学回声消除的多带结构自适应滤波器切换方法,首先获取远端语音信号;然后检测语音端点,输出VAD标志位以及改进的包络判决阈值;语音信号送入扬声器作为期望信号,同时输入到自适应滤波器;自适应滤波器采用可切换的多带结构和相应的自适应算法,根据反馈信息,利用最小均方准则,调整滤波器参数,得到最优解;本发明提供的切换方法是在保证了稳态失调的情况下,充分考虑语音特性,利用了算法在收敛速度上的优势,同时实现了和算法复杂度的优化配置。在对回声消除的实际应用中,单一算法很难满足各种多变的需求,而本发明中可变的切换算法为使用者提供了更多的可能性,这对于自适应回声消除的应用有重要的意义。

著录项

  • 公开/公告号CN106782593A

    专利类型发明专利

  • 公开/公告日2017-05-31

    原文格式PDF

  • 申请/专利权人 重庆邮电大学;

    申请/专利号CN201710109956.9

  • 发明设计人 周翊;魏丹丹;师黎明;刘宏清;

    申请日2017-02-27

  • 分类号G10L21/0208(20130101);G10L21/0232(20130101);G10L21/0264(20130101);G10L21/034(20130101);G10L25/18(20130101);G10L25/78(20130101);

  • 代理机构11275 北京同恒源知识产权代理有限公司;

  • 代理人廖曦

  • 地址 400065 重庆市南岸区黄桷垭崇文路2号

  • 入库时间 2023-06-19 02:20:31

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-10-25

    授权

    授权

  • 2017-06-23

    实质审查的生效 IPC(主分类):G10L21/0208 申请日:20170227

    实质审查的生效

  • 2017-05-31

    公开

    公开

说明书

技术领域

本发明涉及信号处理技术领域,特别是一种用于回声消除的多带结构自适应滤波器切换方法。

背景技术

声学回波消除(Acoustic Echo Cancellation,AEC)是由于麦克风和扬声器的耦合而广泛存在于车载系统、电话会议和助听器等通信领域的重要研究课题。它主要通过自适应滤波算法实现,常用自适应算法有最小均方(Least Mean Square,LMS)算法,最小二乘(Recursive Least Square,RLS)法和仿射投影算法(Affine Projection Algorithm,APA)等。

自适应回声消除是将经过系统处理后送往扬声器的信号同时也送往自适应滤波器,输出信号和麦克风输入信号相比较,得到误差信号,然后通过最小均方准则对自适应滤波器系数进行调整,最终使得包含期望信号的目标函数最小化。自适应滤波器是对回声路径的建模,其输出信号接近回声信号,并在系统输入端减去这个回声信号,以达到回声消除的目的。然而,当自适应滤波器的输入信号高度相关时,算法收敛速度明显下降。自适应滤波器的稳态失调较高。当前采用的算法普遍存在着收敛速度和稳态失调间的折中问题,需要对信号的不同状态进行区分,且对于不同的状态利用不同的自适应算法处理。

因此,需要一种用于回声消除的多带结构自适应滤波器切换方法。

发明内容

本发明的目的是提出一种用于回声消除的多带结构自适应滤波器切换方法。

本发明的目的是通过以下技术方案来实现的:

本发明提供的一种用于回声消除的多带结构自适应滤波器切换方法,包括以下步骤:

获取远端语音信号;

然后检测语音端点,采用语音活性检测中的包络法来判别有无语音段,并获得VDA标志位和包络判决阈值;

将语音信号送入扬声器并进行播放,同背景噪声和回声信号一起被话筒拾取,共同构成期望信号,所述期望信号用于自适应滤波器的参考信号,同时将语音信号输入到自适应滤波器;

所述自适应滤波器采用可切换的多带结构,所述多带结构设置有若干采用不同自适应滤波器的子带结构;根据当前输入信号的能量值和包络判决阀值确定多带结构中相应子带结构的自适应算法,利用最小均方准则,得到最优解;

通过相应子带结构中的自适应滤波器输出信号;

并将输出信号与期望信号进行比较得到误差信号;

输出误差信号并反馈到自适应滤波器中;

输出残差信号,并传向远端。

进一步,所述VAD标志位采用快慢包络算法来区分有无语音段,并输出VAD的标志位,具体步骤如下:

输入语音信号经过绝对值运算获得信号绝对值,接着经过慢包络模块和快包络模块,两模块均采用一阶IIR滤波器来平滑输入信号,但用不同的变量因子来调节包络信号跟踪输入信号的速度,然后输出快、慢包络值,用以跟踪输入语音信号的变化趋势;

对比慢包络值、快包络值和背景参数,首先比较慢包络和背景参数值,选择高于背景噪声能量的值作为背景参数,平滑滤波用来估计背景噪声,然后选取背景参数值与快包络值比较,当快包络值大时,表明当前在语音区内,输出VAD的标志位1,反之则是无语音区,输出标志位0,根据当前的VAD值即知道当前的语音状态。

进一步,所述改进的包络判决阈值按照以下步骤来进行:

首先利用得到的快包络和慢包络值进行差值运算,得到快慢包络的差值曲线,然后通过最值运算得到最大幅值,作为阀值来切换子带结构中的滤波器的系数;若输入信号的能量大于阀值则表示当前信号短时能量较大,则提高收敛速度;若输入信号的能量小于包络差值能量,则表示当前信号的短时能量较小,则降低计算复杂度。

进一步,所述子带结构中的自适应滤波器采用基于最小干扰准则的归一化子带自适应滤波算法,按照以下步骤进行:

首先以期望信号和滤波器输出信号的最小均方误差为代价函数,然后用负梯度最陡下降算法对代价函数中的权系数矢量求偏导,利用拉格朗日乘子获得最优解模型,最后,做归一化处理,得到相应权系数更新公式,其中,所述权系数包括用于调整误差和收敛速度的步长参数和避免分母为零的正则化参数。

进一步,所述基于多带结构的归一化子带结构中的自适应滤波器,按照以下步骤进行处理数据:

约束权重系数向量来最小化子带结构输出后验误差向量的一阶范数,然后通过拉格朗日乘数法和对角线假设来解决最优化问题,最后用梯度下降法得到权重更新;如果存在干扰噪声,则将后验误差的能量最小化作为最佳步长的求解,采用变步长矩阵归一化子带结构自适应算法。

进一步,所述子带自适应滤波算法采用基于最大相关熵算法,具体按照以下步骤进行:

首先以期望信号和滤波器输出信号的均方误差的负指数函数为代价函数,然后用负梯度最陡下降算法对代价函数中的权系数矢量求偏导,利用拉格朗日乘子获得最优解模型,最后,做归一化处理,得到相应权系数更新公式,其中,所述权系数包括用于调整误差和收敛速度的步长参数和避免分母为零的正则化参数。

进一步,所述可切换的多带结构按照以下步骤进行工作:

输入信号和期望信号经过分析滤波器,所述分析滤波器包括一个低通滤波器、一个高通滤波器以及多个带通滤波器构成,且所述各滤波器间无重叠,覆盖全部区域,所述输入信号被分析滤波器组分割成多个频率子带,并生成相应的子带信号和子带期望信号;

经过滤波器分频后的采样点数为原信号的多倍,利用下采样降低总的采样数,下采样是将信号频率进行多倍扩展,并以2π为周期延拓,生成信号的频谱;

最后,采样信号通过与阀值比较,若输入信号的能量大于阀值则表示当前信号短时能量较大,则提高收敛速度;若输入信号的能量小于包络差值能量,则表示当前信号的短时能量较小,则降低计算复杂度。

由于采用了上述技术方案,本发明具有如下的优点:

本发明提供的切换方法是在保证了稳态失调的情况下,充分考虑语音特性,实现了算法在收敛速度的优势,同时实现了和算法复杂度的优化选择。克服了现有算法收敛速度的增加与稳态之间的矛盾,在对回声消除的实际应用中,单一算法很难满足各种多变的需求,而本发明中可变的切换算法为使用者提供了更多的可能性,这对于自适应回声消除的应用有重要的意义。

本实施例将与语音信号有重要关联的VAD(Voice Activity Detection)技术引入算法,采用新的切换方法,该方法根据信号短时能量特点,利用VAD技术对信号的不同状态进行区分,对于不同的状态利用不同的自适应算法处理。整合两种相似架构的自适应算法各自在收敛速度和运算量上的优点,最终实现了切换算法在收敛速度和计算复杂度的优化配置。切换算法在声学回声消除中能够有效的提高系统噪声抵消能力。

本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书来实现和获得。

附图说明

本发明的附图说明如下。

图1为整个方法流程图。

图2为快慢包络算法。

图3为可切换的多带结构。

具体实施方式

下面结合附图和实施例对本发明作进一步说明。

实施例1

如图所示,本实施例提供的用于回声消除的多带结构自适应滤波器切换方法,具体步骤如下:获取语音信号,然后检测语音端点,并输出VAD标志位和改进的包络判决阈值;语音信号送入岩石圈作为期望信号,同时输入到自适应滤波器;自适应滤波器采用可切换的多带结构和相应的自适应算法,根据反馈信息,利用最小均方准则,调整滤波参数,得到最优解;通过自适应滤清的子带输出信号;并与期望信号进行比较得到误差信号,输出误差信号并反馈到自适应滤波器中。

本实施例提供的用于回声消除的多带结构自适应滤波器切换方法,包括以下步骤:

获取远端语音信号;

然后检测语音端点,采用语音活性检测中的包络法来判别有无语音段,并根据其中的包络值和能量比较给出改进的包络判决阈值;

语音信号送入扬声器播放出来,同背景噪声和回声信号一起被话筒拾取,共同构成期望信号,用于后面自适应滤波算法的参考信号,同时还将语音信号输入到自适应滤波器;

自适应滤波器采用可切换的多带结构,即根据当前输入信号的能量值和包络判决阀值进行比较,来决定多带结构采取何种自适应算法,根据反馈信息,利用最小均方准则,调整滤波器参数,得到最优解;

通过自适应滤波器的子带输出信号;

并与期望信号进行比较得到误差信号,

输出误差信号并反馈到自适应滤波器中。

所述VAD标志位采用快慢包络算法来区分有无语音段,并输出VAD的标志位;

输入信号经过绝对值运算获得信号绝对值,接着经过慢包络模块和快包络模块,两模块均采用一阶IIR滤波器来平滑输入信号,但用不同的变量因子来调节包络信号跟踪输入信号的速度,然后输出快、慢包络值,用以跟踪输入信号的变化趋势;

对比慢包络值、快包络值和背景参数,首先比较慢包络和背景参数值,选择高于背景噪声能量的值作为背景参数,平滑滤波可用来估计背景噪声,以防止将讲话中的音节停顿误判为无语音区,然后选取其中的较大值同快包络值比较,快包络值大时,表明当前在语音区内,输出VAD的标志位1,反之则是无语音区,输出标志位0,根据当前的VAD值即知道当前的语音状态。

所述改进的包络判决阈值按照以下步骤来进行:

首先利用前文所述快慢包络算法得到的快包络和慢包络值进一步做差值运算,得到快慢包络的差值曲线,然后通过最值运算得到其幅值最大值,将其作为阀值来切换子带滤波器的系数更新算法;若输入信号的能量大于阀值则表示当前信号短时能量较大,需要收敛性能好的自适应算法提高收敛速度;若输入信号的能量小于包络差值能量则表示当前信号的短时能量较小,则使用计算量较低的自适应算法降低计算复杂度。

所述子带自适应滤波算法为基于最小干扰准则的归一化子带自适应滤波算法,按照以下步骤进行:

首先以期望信号和滤波器输出信号的最小均方误差为代价函数,然后用负梯度最陡下降算法对代价函数中的权系数矢量求偏导,利用拉格朗日乘子获得最优解模型,最后,考虑到自适应过程中所受输入滤波的影响,做归一化处理,即得到相应权系数更新公式,其中,包含了用于调整误差和收敛速度的步长参数,和可以避免分母为零的正则化参数。

所述基于多带结构的归一化子带符号自适应滤波,按照以下步骤进行:

可以归结为一个受线性约束的最小化过程,约束权重系数向量来最小化子带输出后验误差向量的一阶范数,然后通过拉格朗日乘数法和对角线假设来解决最优化问题,最后用梯度下降法得到权重更新。如存在干扰噪声,也可进一步将后验误差的能量最小化作为最佳步长的求解,将算法改进为变步长矩阵归一化子带符号自适应算法。

所述子带自适应滤波算法为基于最大相关熵算法,按照以下步骤进行:其步骤与权利5所述类似,只是其代价函数不再是最小均方误差,而是均方误差的负指数函数形式。

所述可切换的多带结构按照以下步骤进行工作:

输入信号和期望信号经过分析滤波器,理想条件下,分析滤波器为一个低通滤波器、一个高通滤波器以及多个带通滤波器构成,且滤波器间无重叠,覆盖全部区域,所以,信号被分析滤波器组分割成多个频率子带,生成相应的子带信号和子带期望信号;

经过滤波器分频后的采样点数为原信号的多倍,为降低计算量,利用下采样降低总的采样数,下采样是将信号频率进行多倍扩展,并以2π为周期延拓,生成信号的频谱;

最后,采样信号通过与阀值比较,采用如权利4所述的方法来选择合适的自适应滤波算法处理。

实施例2

本实施例提供的自适应滤波器采用基于子带和多速率的子带自适应滤波,子带算法利用分析滤波器组将输入信号和期望信号分割成多个频率子带。对子带信号进行抽取获得采样信号,最后对采样信号进行自适应滤波器处理。每个子滤波器的长度通常比全频带滤波器的长度短,计算量低,故收敛速度快。但是这种子带结构会在滤波器的输出端产生混跌分量,从而导致子带自适应滤波器的稳态失调较高。可利用多带结构来解决这一问题;考虑到输入语音信号的高相关性特点,本实施例将与语音信号有重要关联的VAD(VoiceActivity Detection)技术引入算法,采用新的切换方法,该方法根据信号短时能量特点,利用VAD技术对信号的不同状态进行区分,对于不同的状态利用不同的自适应算法处理。整合两种相似架构的自适应算法各自在收敛速度和运算量上的优点,最终实现了切换算法在收敛速度和计算复杂度的优化配置。切换算法在声学回声消除中能够有效的提高系统噪声抵消能力。

1.采用快慢包络算法区分有无语音段,输出VAD的标志位:输入信号经过绝对值运算获得信号绝对值,然后经过慢包络模块和快包络模块后输出慢包络值、快包络值。通过对比慢包络值、快包络值和背景噪声获得VAD的值判断当前语音状态。在语音区内,快包络值比慢包络值大;在无语音区内,快包络值比慢包络值慢,而且短时能量大于背景噪声,包络跟踪方法利用快包络和慢包络跟踪输入信号的变化趋势。同时为了防止将讲话中音节停顿误判为无语音区,需要引入背景参数。选择高于背景噪声能量的值作为背景参数,平滑滤波可用来估计背景噪声。

2.提出一种基于包络的判决阀值:包络差值曲线可反映语音信号瞬时值,因此可以作为输入信号幅值的参考。利用VAD的包络曲线差值的最大值作为阀值切换子带滤波器的系数更新算法。算法切换的关键是区分输入信号的状态。若输入信号的能量大于阀值则表示当前信号短时能量较大,需要收敛性能好的自适应算法提高收敛速度。若输入信号的能量小于包络差值能量则表示当前信号的短时能量较小,则使用计算量较低的自适应算法降低计算复杂度。

3.以声学回声消除中的应用为基础,从不同角度出发,可以采用以下几种子带自适应滤波算法,也可根据实际需求做选择。

a.基于最小干扰准则的归一化子带自适应滤波算法,以子带的最小均方误差准则为代价函数,利用拉格朗日乘子获得最优解模型,通过对自适应滤波器系数进行调整,最终使得包含期望信号的目标函数最小化。利用负梯度最陡下降算法求抽头梯度,可得到相应权系数更新公式,其中,包含了用于调整误差和收敛速度的步长参数,和可以避免分母为零的正则化参数。

b.通过约束权重系数向量来最小化子带输出后验误差向量一范数的归一化子带符号算法,通过拉格朗日乘数法和对角线假设,最后得到权重更新。将后验误差的能量最小化作为求解最佳步长的变步长矩阵归一化子带符号自适应算法。

c.还有各种变设计参数、基于最大相关熵等方案可供选择。

4.本实施例提供的用于切换的多带结构不同于传统子带自适应滤波器;每个子带独享一个自适应子滤波器,基于最小干扰准则的多带结构自适应滤波器,由于各个子带使用相同的全带自适应滤波器,因此可以克服存在于滤波器输出端的混叠分量。在该结构中,输入信号和期望信号经过分析滤波器分割,生成相应的子带信号和子带期望信号。子带信号通过滤波器组将信号和期望信号进行下采样抽取,生成抽取后的子带信号,然后进行自适应滤波器处理后,生成自适应滤波器的子带输出信号。本发明中涉及使用不同算法的两个全带自适应滤波器,根据阀值的取值,来决定选取的算法。

本实施例提供的算法避免了现有算法收敛速度的增加几乎都是以稳态失调为代价的问题,在保证了稳态失调的情况下,充分考虑语音特性,实现了算法在收敛速度的优势,同时实现了和算法复杂度的优化选择。在对回声消除的实际应用中,单一算法很难满足各种多变的需求,而可变的切换算法为使用者提供了更多的可能性,这对于自适应回声消除的应用有重要的意义。

最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本技术方案的宗旨和范围,其均应涵盖在本发明的保护范围当中。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号