基于瞬时频率估计和特征映射的汉语耳语音话者识别

王敏; 赵鹤鸣; 张庆芳

首页> 中文期刊>数据采集与处理 >基于瞬时频率估计和特征映射的汉语耳语音话者识别

基于瞬时频率估计和特征映射的汉语耳语音话者识别

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

耳语音是有别于正常音的一种微弱语音信号,在正常音训练的说话人识别系统中,用耳语音进行识别时会造成系统性能的急速下降.本文在基于语音产生的调幅-调频(AM-FM)模型基础上,采用多带解调分析(Multiband demodulation analysis,MDA)和能量分离算法(Energy separation algorithm,ESA)计算语音信号的瞬时频率,作为语音的一种特征.随后在基于耳语音和正常音来自不同信道的假设下,对语音的参数做特征映射后再进行训练和识别,以减少信道对系统的影响.实验表明,和传统的MFCC参数相比,加入特征映射后系统的识别率得到提高,且IFE的识别率和稳健性都优于MFCC.%Whisper is a special speech production mode different from neutral speech mode. The performance of speaker identification system (SIS), trained mainly with neutral voices, sharply declines when tested with the whispered speech. Based on the AM-FM model representation of speech signal, the multiband demodulation analysis (MDA) and the energy separation algorithm (ESA) are used to compute the instantaneous frequency estimation (IFE) as a character of speech signal. Then, under the condition that whispered speech and neutral speech come from different channels, feature mapping is conducted to reduce the channel effects before SIS training and test. The experimental results show that compared with MFCCs, feature mapping improves the accuracy of the system, and IFE parameter provides better robustness and accuracy results than MFCCs.

著录项

来源
《数据采集与处理》|2011年第6期|686-690|共5页
作者
王敏; 赵鹤鸣; 张庆芳;
展开▼
作者单位

苏州大学电子信息学院,苏州,215006;

苏州大学电子信息学院,苏州,215006;

苏州大学电子信息学院,苏州,215006;

展开▼
原文格式 PDF
正文语种 chi
中图分类语音信号处理;
关键词
耳语音话者识别; AM-FM模型; 瞬时频率估计; 特征映射;
入库时间 2022-08-18 03:16:49

相似文献

中文文献
外文文献
专利

1. 基于大学生的汉语说话人识别语音库设计 [J] . 王宏 ,李鑫 ,高阳 . 昌吉学院学报 . 2008,第006期
2. 基于修正MFCC参数汉语耳语音的话者识别 [J] . 林玮 ,杨莉莉 ,徐柏龄 . 南京大学学报：自然科学版 . 2006,第1期
3. 基于连续语音识别算法和词树约束的汉语词组语音识别 [J] . 杨浩荣 ,孙甲松 . 中文信息学报 . 1998,第004期
4. 基于因子分析和特征映射的耳语说话人识别 [J] . 张庆芳 ,赵鹤鸣 ,龚呈卉 . 数据采集与处理 . 2016,第002期
5. 基于EBF网络的非线性特征映射器及其在鲁棒话者识别中的应用 [J] . 李昕 ,郑宇 ,费敏锐 . 信号处理 . 2003,第003期
6. 新型汉语耳语音频率尺度在说话人识别中的应用 [C] . 林玮 . 2011中国西部声学学术交流会 . 2011
7. 基于瞬时频率估计的耳语音说话人识别研究 [A] . 王敏 . 2010

基于瞬时频率估计和特征映射的汉语耳语音话者识别

摘要

著录项

相似文献

相关主题

期刊订阅