首页> 外文会议>Canadian conference on artificial intelligence >Extracting Information-Rich Part of Texts Using Text Denoising
【24h】

Extracting Information-Rich Part of Texts Using Text Denoising

机译:使用文本去噪提取文本中信息丰富的部分

获取原文

摘要

The aim of this paper is to report on a novel text reduction technique, called Text Denoising, that highlights information-rich content when processing a large volume of text data, especially from the biomedical domain. The core feature of the technique, the text readability index, embodies the hypothesis that complex text is more information-rich than the rest. When applied on tasks like biomedical relation bearing text extraction, keyphrase indexing and extracting sentences describing protein interactions, it is evident that the reduced set of text produced by text denoising is more information-rich than the rest.
机译:本文的目的是报告一种称为文本降噪的新颖文本缩减技术,该技术在处理大量文本数据(尤其是来自生物医学领域的文本数据)时突出显示信息丰富的内容。该技术的核心特征,即文本可读性索引,体现了以下假设:复杂文本比其他文本具有更多的信息丰富性。当将其应用于诸如带有文本提取,关键短语索引和提取描述蛋白质相互作用的句子之类的生物医学关系的任务时,很明显的是,通过文本去噪产生的减少的文本集比其余部分具有更多的信息丰富性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号