System fusion and speaker linking for longitudinal diarization of TV shows

机译：系统融合和扬声器链接，实现电视节目的纵向差异化

获取原文

页面导航

摘要
著录项
相似文献
相关主题

摘要

Performing speaker diarization while uniquely identifying the speakers in a collection of audio recordings is a challenging task. Based on our previous work on speaker diarization and linking, we developed a system for diarizing longitudinal TV show data sets based on the fusion of speaker diarization system outputs and speaker linking. Agreement between multiple diarization outputs is found prior to speaker linking, largely reducing the diarization error rate at the expense of keeping some speech data unlabelled. To deal with noisy clusters, a linear prediction based technique was used to label speakers after linking. Considerable gains for both fusion and labelling are reported. Despite the challenges of the longitudinal diarization task, this system obtained similar performance for linked and non-linked tasks under moderate session variability, highlighting the viability of a linking approach to longitudinal diarization of speech in the presence of noise, music and special audio effects.

机译：在唯一地识别一组录音中的说话者的同时执行说话者区分是一项艰巨的任务。基于我们以前关于扬声器区分和链接的工作，我们开发了一个基于扬声器区分系统输出和扬声器链接融合的纵向电视节目数据集数字化系统。在说话者链接之前，先找到多个数字化输出之间的一致性，这大大降低了数字化错误率，但以保持某些语音数据未标记为代价。为了处理嘈杂的群集，链接后使用了基于线性预测的技术来标记说话者。据报道融合和标记都获得了相当大的收益。尽管存在纵向差异化任务的挑战，但该系统在中等会话可变性的情况下，对于链接和非链接任务仍获得了相似的性能，突出了在噪声，音乐和特殊音频效果下，语音纵向差异化的链接方法的可行性。

著录项

来源
《IEEE International Conference on Acoustics, Speech and Signal Processing》|2016年|5495-5499|共5页
会议地点
作者
Marc Ferrs; Srikanth Madikeri; Petr Motlicek; Herv Bourlard;
展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类
关键词
clustering; fusion; i-vector; linking; longitudinal; speaker diarization; ward;

机译：聚类;融合; i-向量;链接;纵向;扬声器二分法;病房;

相似文献

外文文献
中文文献
专利

1. A Multimodal Approach to Speaker Diarization on TV Talk-Shows [J] . Vallet F., Essid S., Carrive J. Multimedia, IEEE Transactions on . 2013,第3期

机译：电视脱口秀中说话人差异化的一种多模式方法
2. Speaker Diarization and Linking of Meeting Data [J] . Marc Ferràs, Srikanth Madikeri, Hervé Bourlard Audio, Speech, and Language Processing, IEEE/ACM Transactions on . 2016,第11期

机译：演讲者区分和会议数据链接
3. Development of a Speaker Diarization System for Speaker Tracking in Audio Broadcast News: a Case Study [J] . Mihelic France, Vesnicer Bostjan, Zibert Janez Journal of computing and information technology . 2008,第3期

机译：音频广播新闻中演讲者跟踪的演讲者区分系统的开发：一个案例研究
4. System fusion and speaker linking for longitudinal diarization of TV shows [C] . Marc Ferr??s, Srikanth Madikeri, Petr Motlicek, IEEE International Conference on Acoustics, Speech and Signal Processing . 2016

机译：电视节目纵向日复速度的系统融合与扬声器
5. Automatic Speaker Recognition and Diarization in Co-Channel Speech [D] . Shokouhi, Navid. 2017

机译：同频道语音中的说话人自动识别和区分
6. LINKS BETWEEN PARENTS AND GIRLS TELEVISION VIEWING BEHAVIORS: A LONGITUDINAL EXAMINATION [O] . Kirsten Krahnstoever Davison, Lori A. Francis, Leann L. Birch -1

机译：父母和女孩的电视观看行为之间的联系：纵向检查
7. Constrained speaker diarization of TV series based on visual patterns [O] . Xavier Bost, Georges Linares 2014

机译：基于视觉模式的电视剧约束扬声器日复速度

System fusion and speaker linking for longitudinal diarization of TV shows

摘要

著录项

相似文献

相关主题

期刊订阅