识别网页上的表单和表结构

摘要

如何从Web这个巨大的信息库中获取所需的信息是近年来的研究热点之一.由于人们的表达习惯,Web网页上有许多信息,特别是关系信息常常以表单(list)或表(table)的形式出现,自动地识别这些结构是Web内容挖掘的重要工作之一.本文提出了一种基于逻辑结构分析的识别方法,可实现自动地识别Web上的各种形式不同的、带有不同HTML标记的表单和表结构.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号