首页> 中文会议>第十二届全国人机语言通讯学术会议（NCMMSC`2013） >基于多音素类模型的文本无关短语音说话人识别

基于多音素类模型的文本无关短语音说话人识别

页面导航

摘要
著录项
相似文献
相关主题

摘要

对于基于GMM-UBM方法的文本无关说话人识别,当测试语音时长缩短到很短时,识别率会严重下降.为了充分利用本文内容信息,本文提出了一种基于多音素类模型混合的建模方法.这种方法分为两个阶段,首先音素识别阶段和说话人识别阶段:在音素识别阶段,利用语音识别得到训练语音的音素序列,在说话人识别阶段利用音素序列对每个说话人训练多个音素类模型,测试语音则在最相近的音素类模型上进行打分判决.不同的音素类定义方法在本文中进行了比较.实验结果显示,当测试语音时长小于2秒时,对比GMM-UBM基线系统,本文提出的方法的等错误率(EER)相对下降38.60%.

著录项

来源
《第十二届全国人机语言通讯学术会议（NCMMSC`2013）》|2013年|1-5|共5页
会议地点贵阳
作者
Chenhao Zhang; 张陈昊; Thomas Fang Zheng; 郑方; Linlin Wang; 王琳琳;
展开▼
作者单位

中国声学学会;

中国中文信息学会;

展开▼
会议组织
正文语种
原文格式 PDF
中图分类语音识别与设备;
关键词
说话人识别; 文本无关短语音; 多音素类模型; 等错误率;

相似文献

中文文献
外文文献
专利

1. 基于高斯语音滤波的稳健文本无关说话人识别 [J] . 周静芳 ,陈一宁 ,李科 . 计算机工程 . 2005,第002期
2. 基于听觉模型特征的与文本无关说话人识别系统 [J] . 卢小春 ,尹俊勋 ,王修信 . 广西师范大学学报（自然科学版） . 2010,第002期
3. 文本无关说话人识别中一种改进的模型PCA变换方法 [J] . 姚志强 ,周曦 ,戴蓓蒨 . 电子与信息学报 . 2007,第002期
4. 基于多流三音素DBN模型的音视频语音识别和音素切分 [J] . 吕国云 ,蒋冬梅 ,樊养余 . 电子与信息学报 . 2009,第002期
5. 基于修正Mel子带系数的文本无关的说话人识别 [J] . 张庆芳 ,赵鹤鸣 . 计算机工程与应用 . 2011,第001期
6. 文本无关说话人识别的人类听觉模型研究 [C] . 罗海风 ,龙长才 ,张冰 . 2010年全国声学学术会议 . 2010
7. 基于语音特征空间分布的文本无关说话人识别方法及系统 [A] . 吴克乾 . 2020

基于多音素类模型的文本无关短语音说话人识别

摘要

著录项

相似文献

相关主题

期刊订阅