首页> 外文会议>International Conference on Web Information Systems and Technologies >USING THE STRUCTURAL CONTENT OF DOCUMENTS TO AUTOMATICALLY GENERATE QUALITY METADATA
【24h】

USING THE STRUCTURAL CONTENT OF DOCUMENTS TO AUTOMATICALLY GENERATE QUALITY METADATA

机译:使用文档的结构内容自动生成质量元数据

获取原文

摘要

Giving search engines access to high quality document metadata is crucial for efficient document retrieval efforts on the Internet and on corporate Intranets. Presence of such metadata is currently sparsely present. This paper presents how the structural content of document files can be used for Automatic Metadata Generation (AMG) efforts, basing efforts directly on the documents' content (code) and enabling effective usage of combinations of AMG algorithms for additional harvesting and extraction efforts. This enables usage of AMG efforts to generate high quality metadata in terms of syntax, semantics and pragmatics, from non-homogenous data sources in terms of visual characteristics and language of their intellectual content.
机译:给出搜索引擎访问高质量文档元数据对于互联网和企业内网上的高效文件检索工作至关重要。目前稀疏存在这种元数据。本文介绍了文档文件的结构内容如何用于自动元数据生成(AMG)努力,直接基于文档内容(代码)的工作,并实现了AMG算法组合的有效使用,以便进行额外的收获和提取努力。这使得可以使用AMG努力在其智力内容的视觉特征和语言方面,从非同质数据源的语法,语义和语用来实现高质量元数据。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号