首页> 外文会议>Conference on traitement automatique des langues naturelles et rencontres des etudiants chercheurs en informatique pour le traitement automatique des langues >Quelques variations sur les mesures de comparabilité quantitatives et évaluations sur des corpus comparables Français-Anglais synthétiques
【24h】

Quelques variations sur les mesures de comparabilité quantitatives et évaluations sur des corpus comparables Français-Anglais synthétiques

机译:定量可比性测度的一些变化以及对合成的法语-英语可比语料库的评估

获取原文

摘要

Dans la suite des travaux de (Li et Gaussier, 2010) nous abordons dans cet article l'analyse d'une famille de mesures quantitatives de comparabilité pour la construction ou l'évaluation des corpus comparables. Après avoir rappelé la définition de la mesure de comparabilité proposée par (Li et Gaussier, 2010), nous développons quelques variantes de cette mesure basées principalement sur la prise en compte des fréquences d'occurrences des entrées lexicales et du nombre de leurs traductions. Nous comparons leurs avantages et inconvénients respectifs dans le cadre d'expérimentations basées sur la dégradation progressive du corpus parallèle Europarl par remplacement de blocs selon la méthodologie suivie par (Li et Gaussier, 2010). L'impact sur ces mesures des taux de couverture des dictionnaires bilingues vis-à-vis des blocs considérés est également examiné.
机译:在(Li and Gaussier,2010)的其余工作中,我们在本文中分析了一系列可比性的定量度量,用于构建或评估可比语料库。在回顾了(Li and Gaussier,2010)提出的可比性度量的定义之后,我们主要根据词汇条目的出现频率及其翻译次数来开发该度量的一些变体。我们在实验的框架内比较了它们各自的优缺点,该实验基于平行的Europarl语料库的逐步退化,方法是按照随后的方法进行块替换(Li和Gaussier,2010年)。还考察了双语词典相对于所考虑的模块的覆盖率对这些度量的影响。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号