首页> 美国卫生研究院文献>Patterns >Looking through glass: Knowledge discovery from materials science literature using natural language processing
【2h】

Looking through glass: Knowledge discovery from materials science literature using natural language processing

机译:透过玻璃看:使用自然语言处理的材料科学文献知识发现

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

Most of the knowledge in materials science literature is in the form of unstructured data such as text and images. Here, we present a framework employing natural language processing, which automates text and image comprehension and precision knowledge extraction from inorganic glasses’ literature. The abstracts are automatically categorized using latent Dirichlet allocation (LDA) to classify and search semantically linked publications. Similarly, a comprehensive summary of images and plots is presented using the caption cluster plot (CCP), providing direct access to images buried in the papers. Finally, we combine the LDA and CCP with chemical elements to present an elemental map, a topical and image-wise distribution of elements occurring in the literature. Overall, the framework presented here can be a generic and powerful tool to extract and disseminate material-specific information on composition–structure–processing–property dataspaces, allowing insights into fundamental problems relevant to the materials science community and accelerated materials discovery.
机译:大部分材料科学文献知识是非结构化数据,如文本和图像的形式。这里,我们提出使用自然语言处理的框架,它由无机玻璃文献自动文本和图像的理解和精度知识提取。这些摘要是使用隐含狄利克雷分配(LDA)进行分类和语义搜索链接出版物自动分类。同样地,使用标题簇图(CCP)呈现的图像和图形的全面总结,提供给埋在报纸上的图像的直接访问。最后,我们结合LDA和CCP与化学元素以呈现元素图,在文献中出现的元件的局部和图像方式分布。总体而言,框架提出在这里可以是通用的,强大的工具来提取及发放材料特有的信息组成结构处理属性数据空间,允许见解根本问题相关的材料科学界和加速材料发现。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号