首页> 外文期刊>Bioinformatics >Building an abbreviation dictionary using a term recognition approach
【24h】

Building an abbreviation dictionary using a term recognition approach

机译:使用术语识别方法构建缩写词典

获取原文
获取原文并翻译 | 示例
           

摘要

Motivation: Acronyms result from a highly productive type of term variation and trigger the need for an acronym dictionary to establish associations between acronyms and their expanded forms. Results: We propose a novel method for recognizing acronym definitions in a text collection. Assuming a word sequence co-occurring frequently with a parenthetical expression to be a potential expanded form, our method identifies acronym definitions in a similar manner to the statistical term recognition task. Applied to the whole MEDLINE (7811 582 abstracts), the implemented system extracted 886 755 acronym candidates and recognized 300 954 expanded forms in reasonable time. Our method outperformed base-line systems, achieving 99% precision and 82-95% recall on our evaluation corpus that roughly emulates the whole MEDLINE.
机译:动机:首字母缩略词是由术语转换的高生产率类型产生的,并触发了首字母缩写词词典的建立,以在首字母缩写词及其扩展形式之间建立关联。结果:我们提出了一种新颖的方法来识别文本集合中的缩写词定义。假设经常与括号表达同时出现的单词序列是潜在的扩展形式,我们的方法以与统计术语识别任务相似的方式识别首字母缩写词定义。应用于整个MEDLINE(7811 582摘要),该实施系统在合理的时间内提取了886755个首字母缩写词候选者并识别了300954个扩展形式。我们的方法优于基线系统,在大致模拟整个MEDLINE的评估语料库上,实现了99%的精度和82-95%的召回率。

著录项

  • 来源
    《Bioinformatics》 |2006年第24期|p. 3089-3095|共7页
  • 作者

    Okazaki N; Ananiadou S;

  • 作者单位

    Univ Tokyo, Grad Sch Informat Sci & Technol, Bunkyo Ku, Tokyo 1138651, Japan;

    JSPS, Chiyoda Ku, Tokyo, Japan;

  • 收录信息 美国《科学引文索引》(SCI);美国《化学文摘》(CA);
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类 生物科学;
  • 关键词

    IDENTIFICATION; ALGORITHM; MEDLINE;

    机译:识别;算法;MEDLINE;

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号