首页> 中文学位 >基于倒排索引的XML文档全文检索技术研究
【6h】

基于倒排索引的XML文档全文检索技术研究

代理获取

目录

文摘

英文文摘

声明

第1章引言

1.1研究内容的背景

1.2国内外研究现状

1.2.1 XML规范

1.2.2 XML查询语言

1.2.3全文检索技术

1.2.4 XML数据库

1.3本文的主要工作

第2章XML文档的倒排索引及其检索

2.1 XML文档倒排索引模型

2.1.1主索引文件的结构

2.1.2标记索引文件的结构

2.1.3倒排索引文件的结构

2.1.4倒排文件的结构

2.2索引信息的建立

2.3基于倒排索引的XML文档检索技术

2.4本章小结

第3章XML文档的倒排索引更新策略

3.1基于可扩展位示图的倒排索引更新策略

3.1.1可扩展位示图的结构

3.1.2更新策略

3.2索引算法的改进

3.3性能分析及改进

3.4本章小结

第4章缓冲技术在XML全文检索系统中的应用

4.1缓冲技术概述

4.2 XML全文检索系统中的缓冲池管理

4.2.1采用缓冲技术的可能性和必要性

4.2.2全文检索缓冲池的结构

4.2.3缓冲池的管理算法

4.3本章小结

第5章XML全文检索原型系统的实现

5.1原型系统的总体结构

5.2索引处理

5.3实验环境与结果分析

5.4本章小结

结论

参考文献

攻读硕士学位期间发表的论文和取得的科研成果

致谢

个人简历

展开▼

摘要

随着信息技术的不断发展,XML规范已经得到普遍接受和应用,如何更高效地查询XML文档中的信息也已成为学术界和工业界的研究热点。目前的几种XML文档查询技术中,基于索引的全文检索技术具有很高的技术背景和广阔的应用前景。 本文在研究和分析基于倒排索引的全文检索技术的基础上,设计了一组支持XML文档倒排索引和全文检索的存储模型及算法。上述结构和算法已经在本论文研究期间完成的原型系统中得到了应用,并与Xpath、XQuery两种查询语言的查询效率进行了对比。 考虑到全文检索技术是一种I/O密集型的技术,尤其对大规模文档集合进行全文检索时需要频繁地访问外存设备,因此本文给出了利用交叉缓冲队列对倒排文件进行缓冲处理的思想。另外,为了能够支持文档集合的更新需要,本文还研究了基于可扩展位示图的倒排文件存储结构,并对相关算法进行了描述。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号