首页> 外文学位 >Discrimination parole/musique et etude de nouveaux parametres et modeles pour un systeme d'identification du locuteur dans le contexte de conferences telephoniques (French text).
【24h】

Discrimination parole/musique et etude de nouveaux parametres et modeles pour un systeme d'identification du locuteur dans le contexte de conferences telephoniques (French text).

机译:在电话会议中识别语音/音乐,并研究说话人识别系统的新参数和模型(法文)。

获取原文
获取原文并翻译 | 示例

摘要

La mise en oeuvre de systèmes de compréhension automatique de parole pouvant fonctionner dans des conditions réelles implique de reproduire certaines aptitudes de l'être humain. Outre les aptitudes à comprendre la parole même lorsqu'elle est cor rompue par du bruit, nous sommes capables de tenir une conversation impliquant plusieurs interlocuteurs. Ce dernier point est lié au fait que nous identifions implicitement les interlocuteurs. Cette caractérisation du locuteur nous permet par exemple de réaliser des conversations téléphoniques en mode conférence. En plus de la reconnaissance du vocabulaire ou de l'identification du locuteur, on est également capable de distinguer les séquences de la musique (en alternance, en arrière plan, etc.) qui peuvent apparaître lorsqu'un des correspondants se place en mode attente.; En partant de ce contexte, on s'est intéressé à développer un système capable d'une part de discriminer entre les séquences de Parole/Musique et d'autre part d'identifier le locuteur dans des conditions téléphoniques fonctionnant en mode conférence avec une variabilité des combinés. Autrement dit, cette thèse s'intéresse à deux sujets du domaine du traitement de la parole. Le premier sujet porte sur la recherche de nouveaux paramètres pour améliorer les performances des algorithmes qui identifient les locuteurs en mode téléphonique. Le deuxième sujet est consacré à la proposition de nouvelles approches en discrimination de la parole, de la musique et de la musique chantée.; En discrimination du locuteur, on présentera une première étude visant à caractériser le locuteur par des paramètres AM-FM synchrones à la glotte, extraits à la sortie d'un banc de filtres cochléaires. L'objectif visé est de trouver de nouveaux paramètres plus robustes aux bruits et à la variabilité des combinés téléphoniques. Comme résultats, on a obtenu des scores presque similaires entre le système proposé et le système de référence. Les meilleures performances ont été enregistrées lorsque le système utilise une architecture parallèle composée de deux reconnaisseurs qui se basent respectivement sur les paramètres MFCC et AM-FM. (Abstract shortened by UMI.)
机译:可以在真实条件下运行的自动语音理解系统的实现涉及再现人类的某些技能。除了即使在被噪音打断的情况下也能够理解语音,我们还可以进行涉及多个对话者的对话。最后一点与我们隐式识别对话者这一事实有关。说话者的这种特征使我们可以例如在会议模式下进行电话对话。除了识别词汇或识别说话者外,我们还能够区分当通讯员进入待机模式时可能出现的音乐序列(交替,在后台等)。 。从这种背景出发,我们对开发一种能够区分语音/音乐序列,并且另一方面能够在电话条件下以会议模式操作的语音条件下识别讲话者的系统感兴趣。手机。换句话说,本文主要研究语音处理领域中的两个主题。第一个主题涉及寻找新参数以提高识别电话模式下说话者的算法的性能。第二个主题致力于提出区分语音,音乐和演唱音乐的新方法。在说话人辨别中,我们将进行首次研究,目的是通过与声门同步的AM-FM参数表征说话人,并从一组耳蜗滤波器的输出中提取出来。目的是找到对电话听筒的噪声和可变性更鲁棒的新参数。结果,在提议的系统和参考系统之间获得了几乎相似的分数。当系统使用由两个分别基于参数MFCC和AM-FM的识别器组成的并行体系结构时,记录了最佳性能。 (摘要由UMI缩短。)

著录项

  • 作者

    Ezzaidi, Hassan.;

  • 作者单位

    Universite du Quebec a Chicoutimi (Canada).;

  • 授予单位 Universite du Quebec a Chicoutimi (Canada).;
  • 学科 Engineering Electronics and Electrical.
  • 学位 Ph.D.
  • 年度 2002
  • 页码 145 p.
  • 总页数 145
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类 无线电电子学、电信技术;
  • 关键词

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号