首页> 中文期刊> 《渤海大学学报(自然科学版)》 >基于模板的网页信息抽取技术研究

基于模板的网页信息抽取技术研究

         

摘要

It is significant for retrieval system to mine information of web page .A method of extracting infor-mation in web page based on the template is used for extracting information .The technique of web crawler and data-template technology in this method could self -discover and self -extract the information of web page . The experimental results in Yahoo website indicate that this method is efficient for retrieval information .%准确挖掘网页中的信息对检索系统非常重要。提出了一种基于模板的网页信息抽取方法进行网页信息抽取。该方法采用网页抓取与数据模板技术实现了网页信息的自动发现与抽取。在Yahoo网站上的实验结果表明,该方法具有较好的检索效果。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号