首页> 美国卫生研究院文献>AMIA Annual Symposium Proceedings >A Fast Document Classification Algorithm for Gene Symbol Disambiguation in the BITOLA Literature-Based Discovery Support System
【2h】

A Fast Document Classification Algorithm for Gene Symbol Disambiguation in the BITOLA Literature-Based Discovery Support System

机译:基于BITOLA文献的发现支持系统中用于基因符号消除歧义的快速文档分类算法

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

Gene symbol disambiguation is an important problem for biomedical text mining systems. When detecting gene symbols in MEDLINE® citations one of the biggest challenges is the fact that many gene symbols also denote other, more general biomedical concepts (e.g. CT, MR). Our approach to this problem is first to classify the citations into genetic and non-genetic domains and then to detect gene symbols only in the genetic domain. We used ontological information provided by Medical Subject Headings (MeSH®) for this classification task. The proposed algorithm is fast and is able to process the full MEDLINE distribution in a few hours. It achieves predictive accuracy of 0.91. The algorithm is currently implemented in the BITOLA literature-based discovery support system ().
机译:基因符号消除歧义是生物医学文本挖掘系统的重要问题。在MEDLINE®引用中检测基因符号时,最大的挑战之一是许多基因符号还表示其他更通用的生物医学概念(例如CT,MR)。我们针对此问题的方法是首先将引文分为遗传域和非遗传域,然后仅在遗传域中检测基因符号。我们使用医学主题词(MeSH®)提供的本体信息来完成此分类任务。所提出的算法速度很快,并且能够在几个小时内处理完整的MEDLINE分布。它的预测精度为0.91。该算法当前在基于BITOLA文献的发现支持系统()中实现。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号