首页> 中文会议>第十二届全国人机语言通讯学术会议(NCMMSC`2013) >基于多音素类模型的文本无关短语音说话人识别

基于多音素类模型的文本无关短语音说话人识别

摘要

对于基于GMM-UBM方法的文本无关说话人识别,当测试语音时长缩短到很短时,识别率会严重下降.为了充分利用本文内容信息,本文提出了一种基于多音素类模型混合的建模方法.这种方法分为两个阶段,首先音素识别阶段和说话人识别阶段:在音素识别阶段,利用语音识别得到训练语音的音素序列,在说话人识别阶段利用音素序列对每个说话人训练多个音素类模型,测试语音则在最相近的音素类模型上进行打分判决.不同的音素类定义方法在本文中进行了比较.实验结果显示,当测试语音时长小于2秒时,对比GMM-UBM基线系统,本文提出的方法的等错误率(EER)相对下降38.60%.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号