文摘
英文文摘
声明
第一章引言
1.1课题来源及研究意义
1.2数据压缩技术的发展
1.3全文本数据库压缩技术概述
1.4全文本数据库的正文压缩技术及其研究现状
1.5全文本数据库索引技术及索引压缩技术研究现状
1.6本文所做工作
1.7论文的结构安排
第二章背景知识
2.1数据压缩技术概述
2.2一种基于词汇的面向字节的霍夫曼编码方法
2.3 Moura-Navarro中压缩过程、解压缩过程及其性能分析
2.3.1压缩过程
2.3.2解压缩过程
2.4使用Tagged霍夫曼压缩编码技术压缩的文本上的查找过程
2.5块地址索引压缩技术
第三章一个全文本数据库压缩方法和相关的查找算法
3.1一种压缩编码方法
3.2压缩编码的建立算法
3.3压缩全文本数据库的算法
3.4解压缩算法
3.5查找算法
3.5.1单个词汇的查找算法
3.5.2多个词汇的查找算法
3.5.3布尔查找算法BWS
3.6解压缩过程以及性能分析
3.6.1解压缩过程
3.6.2解压缩过程算法的性能分析
3.7文本数据库的更新处理
3.7.1新增文档的算法
3.7.2删除文档的算法
第四章全文本数据库压缩索引BACI
4.1 BACI的倒排链表
4.2 BACI的词汇表
4.3 BACI的建立算法
4.4 BACI上的几个查找算法
4.4.1单个词汇的查找算法
4.4.2多个词汇的查找算法
4.4.3布尔查找算法
4.5索引的维护
4.5.1删除文档
4.5.2新增文档
第五章算法的实验结果
5.1查找算法的实验结果
5.1.1单个词汇查找算法的实验结果
5.1.2多个词汇查找算法的实验结果
5.1.3布尔查找算法的实验结果
5.1.4查找算法与传统算法的比较分析
5.2压缩算法的实验结果
5.3解压缩过程算法的实验结果
5.4 BACI与传统倒排索引的比较
5.4.1 BACI与传统倒排索引的空间需求
5.4.2单个词汇查找算法的实验结果
5.4.3多个词汇查找算法的实验结果
5.4.4布尔查找算法的实验结果
第六章全文本数据库正文压缩原型系统FDCPS
6.1 FDCPS概述
6.2系统维护模块
6.3数据压缩模块
6.4词汇查找模块
第七章结论与未来的工作
参考文献
致谢