基于频域卷积和三元组损失的端到端声纹识别

董元菲; 王康

首页> 中文期刊> 《电子设计工程》 >基于频域卷积和三元组损失的端到端声纹识别

基于频域卷积和三元组损失的端到端声纹识别

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

针对传统i-vector声纹识别模型在背景噪声急剧增加时泛化弱的问题,设计一种能学习丰富频域信息的卷积神经网络,并结合三元组损失构成端到端模型——Triplet-FD-CNN.该模型通过三元组损失约束含有频域卷积的CNN,直接训练特征空间上嵌入间的欧氏距离,使异类距离增大且同类距离缩小;同时拼接相同标签下的不同短语音,以缩小单条语音特征与说话人总体的差异.实验表明,Triplet-FD-CNN模型相对i-vector方法在辨认中的Top-1和Top-5准确率分别提高了45％和28.9％;在确认中的最小检测代价和等错误率分别减少了14％和25.5％.实验验证了Triplet-FD-CNN模型的鲁棒性强,能得到的嵌入类别区分性好.

著录项

来源
《电子设计工程》 |2020年第13期|154-159|共6页
作者
董元菲; 王康;
展开▼
作者单位

武汉邮电科学研究院湖北武汉430074;

南京烽火天地通信科技有限公司江苏南京210019;

南京烽火天地通信科技有限公司江苏南京210019;

展开▼
原文格式 PDF
正文语种 chi
中图分类语音识别与设备;
关键词
声纹识别; 端到端模型; 深度说话人嵌入; 三元组损失; 卷积神经网络;

相似文献

中文文献
外文文献
专利

1. 基于LSTM的端到端声纹识别算法实现 [J] . 王飞 ,徐颖捷 . 软件工程与应用 . 2021,第004期
2. 基于角度间隔嵌入特征的端到端声纹识别模型 [J] . 王康 ,董元菲 . 计算机应用 . 2019,第010期
3. 基于膨胀卷积网络的端到端文档语义分割 [J] . 许灿辉 ,史操 ,陈以农 . 中南大学学报 . 2021,第006期
4. 基于特征融合卷积神经网络的端到端加密流量分类 [J] . 薛文龙 ,于炯 ,郭志琦 . 计算机工程与应用 . 2021,第018期
5. 基于prony算法的双端频域测距原理 [C] . 康小宁 ,屈亚军 ,李绍頔 . 中国高等学校电力系统及其自动化专业第二十七届学术年会 . 2011
6. 基于改进的端到端卷积神经网络的目标检测算法研究 [A] . 周方禹 . 2020

基于频域卷积和三元组损失的端到端声纹识别

摘要

著录项

相似文献

相关主题

期刊订阅