首页> 中文学位 >检索重排序和文献权威度判定方法研究
【6h】

检索重排序和文献权威度判定方法研究

代理获取

目录

声明

摘要

第一章 绪论

1.1 研究背景与意义

1.1.1 文本检索重排序

1.1.2 文献权威度判定

1.2 研究现状

1.2.1 文本检索重排序研究现状

1.2.2 引文分析研究现状

1.3 本文工作

1.4 本文的组织结构

第二章 基于层次聚类的悖向重排序方法

2.1 悖向重排序主体框架

2.2 基于层次聚类的悖向重排序

2.2.1 基于配角特征的悖向意图构建

2.2.2 重排序方法中的相似度计算

2.2.3 基于层次距离的重排序算法

2.2.4 基于倔强系数的加强算法

2.3 实验设计和分析

2.4 本章小结

第三章 基于相关子主题消解的重排序方法

3.1 悖向重排序主体框架

3.2 正向主题的意图抽取

3.2.1 基于TextTiling方法的子主题获取

3.2.2 基于相关子主题聚类的正向意图主题抽取

3.3 基于相关子主题消解的悖向意图构建

3.4 悖向重排序策略

3.4.1 悖向重排序中的相似度计算方法

3.4.2 融合悖向重排序

3.5 实验设计

3.5.1 语料集和基础检索集合的生成

3.5.2 评价方法

3.5.3 实验系统

3.6 实验分析

3.6.1 训练结果

3.6.2 查询词的负面约束

3.6.3 配角特征的适用性

3.6.4 测试结果与分析

3.7 本章小结

第四章 基于HITS算法的文献权威度判定方法

4.1 权威度判定方法

4.2 HITS算法介绍

4.3 影响因子和被引频次

4.3 基于HITS算法的文献权威度判定方法

4.3.1 HITS算法的具体实现

4.3.2 实验数据的获取

4.3.3 实验结果以及分析

4.4 本章小结

第五章 总结和展望

参考文献

攻读学位期间公开发表的论文

致谢

展开▼

摘要

文献检索是科学研究中非常重要的一项任务。搭建文献检索系统的意义是:能够有效地让科技工作者检索到与其领域相关的科技文献,借以提高研究效率。针对这一任务,本文给出两项研究工作,分别是基于相悖理论的检索结果重排序方法和基于HITS算法的科技文献权威度自动判定方法。
   基于相悖理论的重排序方法(简称悖向重排序),侧重利用已有的相关与非相关判定结果,对文献检索列表进行重排序,提升用户检测到相关科技信息的概率。由于检索系统的缺陷,“倔强”非相关结果充斥检索列表,难以被准确识别和屏蔽,悖向重排序的关键问题即是构建准确而纯粹的悖向查询意图,作为识别“倔强”非相关结果的标杆。本文针对此问题,提出了两种悖向重排序方法,分别是使用层次聚类的悖向重排序方法和基于相关子主题消解的悖向重排序方法。首先使用层次聚类解决查询意图描述的泛化问题,然后进一步使用相关子主题消解的方法,获得更加精确的正向意图,从而优化重排序性能。
   科技文献权威度自动排序侧重建立一种有效的权威度度量过程,以及基于权威度的检索结果推荐机制,借以实现权威科技文献的快速检索。其中,权威度的自动判定是实现这一目标的关键问题。本文提出的基于HITS算法的文献权威度判定方法。其核心思想是以引文形成的关联网络为线索,通过使用基于关联关系度量权威性的HITS算法,实现自动的文献权威度计算。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号