基于深度嵌入向量的说话人分割研究

许铭洋; 王华朋; 闫道申; 杨海涛; 楚宪腾

首页> 中文期刊> 《刑事技术》 >基于深度嵌入向量的说话人分割研究

基于深度嵌入向量的说话人分割研究

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

为提高多说话人混合语音分割的准确度,本文提出了采用广义端到端损失函数训练说话人深度嵌入向量提取模型用于多说话人分割。该方法首先训练基于长短时记忆的深度神经网络作为深度嵌入向量提取器;其次,在音频文件中截取每个说话人的参考语音段并训练其嵌入向量;最后,比较音频文件的连续嵌入与每个说话人嵌入之间的余弦相似度得分,实现说话人分割。该方法采用先识别后分割的原理,在能够预知说话人数量的场景中有较好的分割效果,可以为多说话人自动识别系统自动分割目标说话人语音,提高工作效率。

著录项

来源
《刑事技术》 |2023年第5期|466-472|共7页
作者
许铭洋; 王华朋; 闫道申; 杨海涛; 楚宪腾;
展开▼
作者单位

中国刑事警察学院公安信息技术与情报学院;

展开▼
原文格式 PDF
正文语种 chi
中图分类计算技术、计算机技术;
关键词
说话人分割; 长短时记忆; 广义端到端; 音频嵌入; 余弦相似度;

相似文献

中文文献
外文文献
专利

1. 基于孪生自动编码器的深度说话人嵌入向量 [J] . 陈杰 ,叶瑶瑶 . 现代计算机（专业版） . 2021,第10期
2. 说话人识别中基于深度信念网络的超向量降维的研究 [J] . 李为州 ,杨印根 . 电脑知识与技术 . 2017,第22期
3. 基于说话人聚类和支持向量机的说话人确认研究 [J] . 侯风雷 ,王炳锡 . 计算机应用 . 2002,第10期
4. 基于预分割的说话人分割方法 [J] . 郑铁然 ,李海峰 ,刘先 . 通信学报 . 2009,第2期
5. 基于辨别性深度信念网络的说话人分割 [C] . Yong Ma ,马勇 ,Chang-chun Bao . 第十二届全国人机语言通讯学术会议（NCMMSC`2013） . 2013
6. 深度学习与超向量在说话人识别中的应用 [A] . 李为州 . 2018

基于深度嵌入向量的说话人分割研究

摘要

著录项

相似文献

相关主题

期刊订阅