维吾尔文Web信息检索中基于改进VSM的文档表示及相似度研究

摘要

基于向量空间模型的信息检索技术中,用向量空间模型来表示Web文档,以索引词权重作为主要依据进行用户查询与Web文档之间的相似度计算,并根据相似度大小进行查询结果的排序。本文在传统TFIDF的基础上,用索引词的位置加权系数对权值进行调整,综合考虑索引词权重、索引词在文档中的位置、相互距离、顺序以及维吾尔文单词相似度等因素的贡献,进行了用户查询与Web文档相似度度量。在维吾尔文搜索引擎中测试实验,结果表明,改进的方法明显提高了Web信息检索系统的查准率、查全率和输出结果的排序能力。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号