声明
致谢
摘要
1 绪论
1.1 选题背景
1.2 国内外研究现状
1.3 研究目的及意义
1.4 研究内容和论文结构
1.4.1 研究内容
1.4.2 论文结构
2 相关理论与技术综述
2.1 全文检索相关理论及现状研究
2.1.1 全文检索概念
2.1.2 全文检索的一般过程
2.1.3 全文检索技术研究现状
2.1.4 全文检索系统及其发展
2.2 Lucene全文检索工具包研究
2.2.1 Lucene概述
2.2.2 Lucene系统结构和功能
2.2.3 Lucene应用现状
2.3 Lucene关键技术及现状研究
2.3.1 中文分词及研究现状
2.3.2 索引结构和索引过程
2.3.3 检索结果排序及研究现状
3 基于Lucene的电子公文检索主要问题及访问控制模型研究
3.1 主要研究问题
3.1.1 电子公文检索安全问题
3.1.2 Lucene实时索引问题
3.1.3 检索结果排序问题
3.2 电子公文流转安全性分析
3.2.1 电子公文流转过程
3.2.2 电子公文安全性分析
3.3 几种访问控制模型研究
3.3.1 DAC模型和MAC模型
3.3.2 基于角色的访问控制模型
3.4 引入用户和组扩展的访问控制模型
3.4.1 模型定义
3.4.2 模型结构设计
3.4.3 模型实现方式
4 Lucene实时索引研究与电子公文检索系统索引构建
4.1 实时更新索引必要性分析
4.2 Lucene检索实时索引研究
4.2.1 新增文档实时索引
4.2.2 删除文档实时索引
4.2.3 更新文档实时索引
4.3 电子公文检索系统索引构建
4.3.1 系统索引域选项
4.3.2 系统实时索引构建
5 基于Lucene的电子公文检索结果排序策略研究
5.1 Lucene检索结果排序策略
5.1.1 Lucene排序原理
5.1.2 Lucene评分机制
5.1.3 改进Lucene排序策略的原因
5.2 改进的检索结果排序策略
5.2.1 电子公文检索结果排序影响因素分析
5.2.2 改进的检索结果排序策略
5.3 理论验证和实验分析
5.3.1 理论验证
5.3.2 实验分析
6 基于Lucene的电子公文检索原型系统设计与实现
6.1 原型系统设计
6.1.1 整体思路及架构设计
6.1.2 整体处理流程设计
6.1.3 开发环境与开发工具选择
6.2 原型系统实现
6.2.1 文本抽取模块实现
6.2.2 中文分词模块实现
6.2.3 索引模块实现
6.2.4 检索模块实现
6.2.5 系统运行结果展示
6.2.6 检索结果对比分析
7 总结与展望
7.1 论文总结
7.2 工作展望
参考文献
作者简历及攻读硕士学位期间取得的研究成果
学位论文数据集