文摘
英文文摘
独创性声明及关于论文使用授权的说明
第1章绪论
1.1网络安全现状
1.2弱点信息与弱点数据库
1.2.1弱点信息的描述
1.2.2国内外研究现状
1.3面向特定领域的搜索技术
1.4研究内容及意义
1.5本章小结
第2章搜索引擎技术研究
2.1搜索引擎概述
2.2通用搜索引擎
2.2.1通用搜索引擎工作原理
2.2.2通用搜索引擎分类
2.2.3通用搜索引擎存在的问题
2.2.4通用搜索引擎发展趋势
2.3主题搜索引擎
2.3.1主题搜索引擎产生背景
2.3.2主题搜索引擎工作原理
2 3.3主题搜索引擎研究现状
2.4本章小结
第3章弱点信息搜索引擎总体设计
3.1系统目标
3.2设计思想和策略
3.2.1搜索策略选择
3.2.2弱点信息识别方式
3.3系统架构
3.4可行性分析
3.5开发环境
3.6本章小结
第4章弱点信息采集
4.1网络机器人技术
4.2主题机器人
4.3链接队列的数据结构
4.4初始化种子链接
4.5网页纯文本提取
4.5.1网页的结构分析
4.5.2网页控制符分析
4.5.3提取文本
4.6网页内容分析
4.6.1分析方式
4.6.2匹配算法
4.6.3相关度计算
4.7网页链接提取
4.8网页链接分析
4.8.1现有算法
4.8.2改进算法
4.9注意的问题
4.9.1搜索程序专用协议
4.9.2避免网络陷阱
4.9.3避免锤打
4.10本章小结
第5章弱点信息存储
5.1临时数据库
5.2弱点数据库
5.2.1弱点的分级
5.2.2弱点的分类
5.2.3主要实现
5.3索引数据库
5.3.1正排表和倒排表
5.3.2双向索引
5.4数据库的更新
5.5本章小结
第6章弱点信息检索
6.1信息检索模型
6.1.1布尔逻辑模型
6.1.2向量空间模型
6.1.3概率论模型
6.2信息检索流程
6.2.1提交查询
6.2.2专业词典
6.2.3相关度排序
6.2.4结果显示
6.3本章小结
结论
参考文献
致谢