首页> 外文会议>Proceedings of the 2008 international conference on internet computing >Extracting Informative Sections of Web Documents Based on Scoring DOM Subtrees
【24h】

Extracting Informative Sections of Web Documents Based on Scoring DOM Subtrees

机译:基于评分DOM子树提取Web文档的信息部分

获取原文
获取原文并翻译 | 示例

摘要

Web documents can be represented and manipulated by DOM trees. In this paper, we present a novel method of automatically extracting informative sections of web documents by using their DOM trees. It gives a score to each DOM subtree of a web page and effectively extracts content by finding a subtree with the highest score.
机译:Web文档可以由DOM树表示和操纵。在本文中,我们提出了一种使用DOM树自动提取Web文档信息部分的新方法。它给网页的每个DOM子树一个分数,并通过找到分数最高的子树来有效地提取内容。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号