首页> 中文学位 >基于时间反馈和分类技术的PageRank算法改进研究
【6h】

基于时间反馈和分类技术的PageRank算法改进研究

代理获取

目录

声明

学位论文数据集

摘要

第一章 绪论

1.1 本文的研究背景和意义

1.2 国内外研究现状

1.3 本文主要工作

1.4 本文的结构

第二章 搜索引擎技术分析

2.1 搜索引擎的发展轨迹

2.2 搜索引擎的分类

2.3 搜索引擎的工作原理

2.4 搜索引擎的主要技术

2.5 搜索引擎的评价指标

2.6 本章小结

第三章 经典的搜索引擎排序算法研究

3.1 PageRank算法

3.2 Hits算法

3.3 Hits算法与PageRank算法比较

3.4 基于PageRank算法的改进算法

3.5 本章小结

第四章 搜索引擎排序算法的改进

4.1 分类技术研究

4.2 时间反馈研究

4.3 结合时间反馈和分类技术的Pagerank改进算法

4.4 本章小结

第五章 实验数据分析

5.1 技术选型

5.2 Nutch介绍

5.3 实验设计

5.4 算法验证

5.5 实验数据分析

5.6 改进后的算法评价

第六章 总结与展望

6.1 总结

6.2 展望

参考文献

致谢

研究成果及发表的学术论文

作者简介

展开▼

摘要

当前的信息时代,互联网快速发展,网络上不断产生大量无序的信息,当用户需要搜寻自己关心的信息时,就需要利用搜索引擎快速而准确的反馈结果。这就对搜索引擎的搜索技术提出了更高的挑战,在这一搜索引擎改进过程中,搜索引擎网页排序算法理所当然的成为搜索引擎改进的关键问题。在搜索引擎产生的初期,传统的搜索引擎排名算法中,PageRank算法和Hits算法是两个经典算法,它们都是基于网页链接结构的,这些算法也是国内外搜索引擎算法改进的依据和基础,同时也出现了一些行之有效的改进算法。
   本文首先阐述了搜索引擎排序算法的研究背景和意义,以及国内外关于搜索引擎的发展现状等,分析了搜索引擎的工作原理与技术,以及搜索引擎网站的评测指标。然后通过分析传统PageRank算法、Hits算法的优势和不足,为本文对PageRank算法的综合改进奠定了基础。
   本文的重点内容在于对已有PageRank算法的改进算法进行进一步融合,提出了结合网页分类技术和具有时间反馈因子的PageRank算法的综合改进算法,并依据该算法,改进了PR值的计算公式。并对改进后的算法进行设计验证,将改进前后算法的实验结果进行对比,验证了改进后的算法可以一定程度上提高搜索引擎的查准率和查全率。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号