首页> 中文期刊> 《南宁职业技术学院学报》 >基于Heritrix的主题网络爬虫设计与实现

基于Heritrix的主题网络爬虫设计与实现

         

摘要

通过介绍主题网络爬虫,以及使用Java开发的开源网络爬虫Heritrix的系统构架,设计基于遗传算法的主题网络爬虫算法,并使用Heritrix构造基于遗传算法的主题网络爬虫.实验结果表明,采用Heritrix实现的基于遗传算法的主题网络爬虫,能取得不错的效果.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号