首页> 美国卫生研究院文献>Journal of Cheminformatics >Extracting and connecting chemical structures from text sources using chemicalize.org
【2h】

Extracting and connecting chemical structures from text sources using chemicalize.org

机译:使用chemicalize.org从文本源中提取和连接化学结构

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

BackgroundExploring bioactive chemistry requires navigating between structures and data from a variety of text-based sources. While PubChem currently includes approximately 16 million document-extracted structures (15 million from patents) the extent of public inter-document and document-to-database links is still well below any estimated total, especially for journal articles. A major expansion in access to text-entombed chemistry is enabled by chemicalize.org. This on-line resource can process IUPAC names, SMILES, InChI strings, CAS numbers and drug names from pasted text, PDFs or URLs to generate structures, calculate properties and launch searches. Here, we explore its utility for answering questions related to chemical structures in documents and where these overlap with database records. These aspects are illustrated using a common theme of Dipeptidyl Peptidase 4 (DPPIV) inhibitors.
机译:背景技术探索生物活性化学需要在来自各种基于文本的来源的结构和数据之间导航。尽管PubChem目前包括大约1600万个文档提取结构(其中1500万个来自专利),但是公共文档间以及文档到数据库的链接的程度仍然远远低于任何估计的总数,尤其是期刊文章。通过chemicalize.org,可以大大扩展使用文本加密化学方法的途径。该在线资源可以处理IUPAC名称,SMILES,InChI字符串,CAS号和粘贴文本,PDF或URL中的药物名称,以生成结构,计算属性并启动搜索。在这里,我们探索其实用程序,用于回答与文档中化学结构有关的问题以及与数据库记录重叠的化学结构问题。这些方面使用二肽基肽酶4(DPPIV)抑制剂的共同主题进行说明。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号