融合词项重要性的多层Markov网络检索模型

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

信息检索是当今计算机领域研究的热点之一，其目的是为了满足用户对信息需求，即从海量信息中查找到所需信息。但是由于用户查询与文档表示的不确定性，往往会影响文档与查询的匹配效果，导致检索效果低下。
　　在检索模型中，图模型的方法被用于表示文档及查询语句，Markov网络检索模型是其中的一种图模型，利用Markov网络可构造词项子空间、文档子空间，从中提取最大词项团与最大文档团，通过对文档集做初次的检索，从检索的结果中构造查询子空间，从中提取出最大查询团，可构造扩展的Markov网络检索模型。在前述的研究中，度量词项采用的是BM25的形式，其缺点是BM25权重假定了词项之间的独立性，在计算时仅考虑了词项的频率信息，忽略了词项之间的依赖关系、位置特征、语序特征等。
　　针对上述问题，本文将基于词重要性的词项权重的计算方法应用于多层的Markov网络查询扩展模型中，该方法首先建立了文档的词项图，然后根据词项图得到词项的共现矩阵和词项间的概率转移矩阵，最后利用马尔科夫链的计算方法得到词项的权重。将得到的词项权重运用在扩展的Markov网络模型中。在5个常用的标准测试集ADI，MED，CRAM，CISI和CRAN中进行了实验，结果表明本文提出的模型优于一般的基于词袋权重的多层Markov网络检索模型。
　　本文的工作在于：
　　（1）在多层Markov网络扩展的检索模型中使用了基于词重要性的方法来度量词项的权重。模型先构造多层Markov网络模型，分别是词项子空间，文档子空间，查询子空间。将这三层Markov网络信息加入到检索模型得到扩展的Markov网络模型，且在模型中词项的权重考虑了词项之间的依赖关系即采用了基于词项重要性的方法。
　　（2）验证并且分析了本文提出的模型的检索效果，通过调节模型中的参数考察了其对检索效果的影响，结果表明，相比于一般的基于词袋权重的多层Markov网络检索模型，融合词重要性的多层Markov网络检索模型具有更好的检索效率。

著录项

作者
王千千;
展开▼
作者单位

江西师范大学;

展开▼
授予单位江西师范大学;
学科计算机科学与技术
授予学位硕士
导师姓名王明文,左家莉;
年度 2017
页码
总页数
原文格式 PDF
正文语种中文
中图分类检索机;
关键词
词项图; Markov网络; 查询扩展; 信息检索; 词重要性;

相似文献

中文文献
外文文献
专利

1. 基于文档团的Markov网络检索模型 [J] . 汤皖宁 ,王明文 ,万剑怡 . 计算机研究与发展 . 2014,第010期
2. 多层的贝叶斯网络检索模型 [J] . 白彦霞 ,云彩霞 ,李珊 . 计算机工程与应用 . 2009,第016期
3. 基于多层Markov网络的信息检索模型 [J] . 廖亚男 ,王明文 ,左家莉 . 中文信息学报 . 2016,第001期
4. 基于迭代方法的多层Markov网络信息检索模型 [J] . 洪欢 ,王明文 ,万剑怡 . 中文信息学报 . 2013,第005期
5. 基于词重要性的Markov网络查询扩展模型 [J] . 王千千 ,罗文兵 . 计算机与现代化 . 2017,第011期
6. 基于隐Markov模型和滑动时窗的多层位追踪算法 [C] . 王婷 ,蒋延生 ,张安学 . 2010年全国电磁散射与逆散射学术年会 . 2010
7. 基于文档团的Markov网络检索模型 [A] . 汤皖宁 . 2013

融合词项重要性的多层Markov网络检索模型

目录

摘要

著录项

相似文献

相关主题

期刊订阅