首页> 中文期刊> 《电子世界》 >基于Nutch的网页排序算法研究

基于Nutch的网页排序算法研究

         

摘要

网页排序算法对根据用户查询词搜索到的大量页面进行排序,从而返回给用户,因此排序算法对搜索引擎的好坏起着关键作用.Nutch搜索引擎只实现了基本的综合排序模型,针对Nutch默认排序算法的不足,在PageRank算法中加入时间因子、链接权重因子,并结合HowNet来计算网页的语义相似度,将改进后的PageRank算法和基于语义的主题相关度算法应用在Nutch排序算法中.实验结果表明:改进的排序算法使得Nutch的搜索结果排序准确率和首页命中率都有了明显提升.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号