首页> 中文学位 >信息检索中的相关反馈技术研究
【6h】

信息检索中的相关反馈技术研究

代理获取

目录

文摘

英文文摘

声明

1绪论

1.1问题的提出、研究意义及现状

1.1.1问题的提出

1.1.2研究意义和研究现状

1.2本研究的目的和研究内容

1.2.1研究目的

1.2.2研究内容

1.2.3主要工作和创新点

1.3论文的章节安排

2信息检索与相关反馈

2.1信息检索

2.1.1信息检索模型

2.1.2信息处理技术

2.1.3技术应用研究

2.2相关反馈技术基本原理

2.2.1相关反馈技术基本原理

2.2.2相关反馈技术的特点

2.2.3相关反馈中研究的问题

2.2.4相关反馈技术性能的评估

3布尔模型和向量空间模型中的相关反馈

3.1布尔模型中的相关反馈

3.1.1 Dillon方法

3.1.2 DNF方法

3.2向量空间中的相关反馈

3.2.1向量空间模型中的3种反馈策略

3.2.2 Rocchio公式计算检索词权重

3.2.3 Rocchio公式的修正

3.2.4应用Rocchio公式的改进

3.3 Web文档前处理在VSM中相关反馈里的应用

3.3.1概述

3.3.2标签影响因子算法

3.3.3实验与结论

4概率模型中的相关反馈

4.1概率检索模型中的文献输出理论

4.2经典概率检索模型中的相关反馈方法

4.3经典概率检索模型相关反馈方法的特点

4.4概率检索模型的扩展

5基于辐射场的PAM聚类算法

5.1聚类方法综述

5.1.1聚类检索

5.1.2聚类策略

5.1.3检索步骤

5.1.4文献相似度

5.1.5聚类浏览

5.2主要聚类方法

5.3划分方法

5.3.1划分方法综述

5.3.2 PAM聚类方法及其改进

6概率潜在语义模型中的相关反馈技术

6.1概率潜在语义模型

6.2文档集的语义空间

6.3潜在语义空间中的相关反馈技术

6.3.1本文采用的聚类技术

6.3.2类标题的生成模式

6.3.3反馈的过程

6.4实验数据证明

7结论

致谢

参考文献

附录

展开▼

摘要

信息检索时,需求的模糊导致查询结果不尽人意。为使检索更有效,需采用各种相关反馈途径对检索策略进行修改,以发现用户的信息需求。近年来,研究者提出了基于各种检索模型下的反馈方法,比较突出的有向量空间模型和概率模型。在本文中首先系统地介绍了信息检索以及各种检索模型下的相关反馈技术。在对反馈技术进行仔细分析的前提下,本文提出了如下创新: 首先分析了向量空间模型及其中的相关反馈。研究发现,向量空间模型检索精度及其中相关反馈的查准率,都在一定程度上受到原始矩阵中数据准确度的影响。传统的权值构造方法是词频.逆文档频率法及其扩展方法。这些方法在处理Web文档的时候,没有考虑到不同Web标签中同一词汇的影响程度有所不同这一特点,故不能准确地反映文档集特点。本文提出了Web标签影响因子算法,通过对大量的训练文档进行分析,从而获得比较准确的标签因子,用其对原始矩阵数据进行了一定程度的精化。通过实验,发现对改善系统查准率有一定帮助。 文中重点分析了概率潜在语义模型中的相关反馈技术。首先对PAM算法进行了初始k点选择优化,优化技术为辐射场,并对辐射场技术中每个参数的选择提出了具体的解决办法。在概率潜在语义模型的基础上,结合这种改良的聚类算法本文提出了新的相关反馈流程。 用概率潜在语义模型构造的数据矩阵为本次研究的基础数据,用k-中心点算法(PAM)的聚类结果来近似的拟合潜在语义类别。由于聚类的结果只与输入矩阵的数据有关;而建立概率潜在语义模型的算法,其唯一依据也是原始矩阵数据;若将PAM算法中聚类个数限定为潜在语义类的类别数目,就可以认为二者有较强的联系,可以用聚类结果类别来近似拟合潜在语义类。类别拟合完毕以后,文中还给出了类标题生成方法,且构建了反馈后对原始查询的查询词扩展方法。用查全率和查准率两个指标来衡量改良后的检索结果,实验数据表明,系统性能在一定程度上得到了改善。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号