首页> 外文会议>European conference on research and advanced technology for digital libraries >Une technique d'elargissement de requetes fondee sur la similarite de mots pour la recherche d'information inter langues
【24h】

Une technique d'elargissement de requetes fondee sur la similarite de mots pour la recherche d'information inter langues

机译:基于单词相似性的设计者扩展技术进行交互信息搜索

获取原文

摘要

Nous proposons une technique d'elargissement du champ de recherche d'une requirete pour ameliorer la receher, dans plusieurs langues, de mots ou d'expressions dans un document (meme si la requete contient les mots ou expressions recherches dans une seule langue, le systeme va rechercher leurs equivalents dans plusieurs langues). La recherche do mots ou d'sexpressions en plusieurs langues est fondee sur l'utilisation d'un dictionnaire et se nomme en anglais CLIR (Cross-Language Information Retrieval). Pour resoudre les ambiguites de traduction de mots, nous utilisions une technqiue fondee sur la similarite de mots. Nous aviouns deja propose cette technique dans un travail precedent. Elle servait a rendre plus juste la traduction d'une requete a l'aide d'un dictionnaire. La technique employee pour elargir le champ de recherche d'une requete est alors utilisee pour traduire les requretes afin de rendre la recherche plus pertinente. Nous montrons que combiner les deux techniques afin d'exprimer des requetes de recherche de mots ou d'expressions en trois langues (allemand, espagnol et indonesien) est efficace. Ces requetes servent a interroger une collection de documents ecrits en anglais dans le standard TREC (en anglais, Text Retrieval Conference). Nos experiences montrent que, plus il y a d'expressions dans les requretes, plus les techniques fondees sur la similarite de mots sont performantes. De plus, nos resultats vont dans le meme sens que des travaux de recherche deja effectues. Ceux-ci montraient que la reconnaissance d'expression et la traduction sont cruciaux pour l'efficacite de la methode CLIR.
机译:我们建议扩大的搜索领域的技术要求,以提高接收器,多国语言,词语或表达的一个文件(即使该请求中包含一种语言的单词或短语搜索时,系统会搜索自己的数当量语言)。在几种语言的单词或sexpressions搜索是基于使用字典和英语CLIR(跨语言检索参考)而得名。为了解决单词的翻译的模糊性,我们采用基于词的相似度technqiue。我们Aviouns已经在以前的工作提出了这一技术。她被用来制造要求更借助字典的帮助下翻译。然后用于扩展请求的搜索领域的技术是用于翻译,使研究更具相关性的要求。我们发现,为了结合两种技术来表达三种语言(德语,西班牙语,印尼语)的单词或短语的搜索请求是有效的。这些请求服务来查询英语TREC标准的书面文件的集合(英语,文本检索会议)。我们的经验表明,越是表现有任何的要求,更多的基于文字的相似性的技术是有效的。此外,我们的结果进入的研究工作已经做了同样的方式。这些表明识别的表达和翻译的是该方法CLIR的效率是至关重要的。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号