摘 要
Abstract
第1章 绪论
1.1 课题背景
1.2 基于主题标引的智能网站检索
1.3 本文研究的主要内容
1.4 本文的组织结构
第2章 基于主题标引的智能网站检索系统方案设计
2.1 系统整体设计
2.2 智能网站检索主要问题分析
2.2.1 网页内容分析技术
2.2.2 网站结构分析技术
2.2.3 网站主题标引、概念获取与检索技术
2.3 本章小结
第3章 网页内容分析技术
3.1 网页解析器的构造
3.2 网页类别判断
3.3 索引网页分析技术
3.3.1 链接去噪与修复
3.3.2 链接特征提取
3.4 内容网页分析技术
3.5 实验与评价
3.6 本章小结
第4章 网站结构分析
4.1 爬虫技术
4.2 URL 链接索引表
4.3 节点关系分析
4.4 基于URL 目录相似度的网站结构分析算法
4.5 网站结构分析实验与评价
4.6 本章小结
第5章 网站主题标引、概念获取与检索
5.1 网页主题标引技术
5.1.1 分词与词频统计
5.1.2 加权词标引
5.2 网站主题概念获取技术
5.2.1 向量空间简化技术
5.2.2 基于网站结构的网站主题概念获取
5.3 索引与检索
5.4 Web2.0 技术与网站主题获取
5.5 实验系统
5.6 本章小结
结论
参考文献
哈尔滨工业大学硕士学位论文原创性声明
哈尔滨工业大学硕士学位论文使用授权书
哈尔滨工业大学硕士学位涉密论文管理
致谢