机译:使用F_0轮廓信息的鲁棒语音识别
Department of Computer Science, Tokyo Institute of Technology, Tokyo, 152-8552 Japan;
noise robust speech recognition; prosody; fundamental frequency (F_0) contour; multi-stream HMM; hough transform;
机译:具有说话人归一化功能的低复杂度抛物线形嘴唇轮廓模型,用于噪声鲁棒的视听语音识别中的高级特征提取
机译:通过集成MLLR自适应和特征提取以降低噪声的语音,增强了噪声鲁棒性
机译:噪声稳健性语音识别通过集成MLLR自适应和特征提取来减少语音
机译:基于DNN声学建模在普通话语音识别的实证分解的F_0轮廓分析
机译:压缩非线性表示语音频谱幅度提高语音自动识别的鲁棒性。
机译:通过训练数据的噪声增强将噪声鲁棒性纳入语音命令识别中
机译:基于自适应分位数的噪声估计和语音带增强滤波器组的鲁棒自动语音识别