网站主题目录重要性评价
EVALUATION SIGNIFICANCE OF WEBSITE’S SUBJECT CATALOG
摘要
Abstract
第1章 绪论
1.1 课题研究背景及意义
1.2 本课题国内外相关研究
1.2.1 网络信息资源评价研究综述
1.2.2 特定网络资源评价
1.2.3 网站信息描述
1.3 网站主题目录重要性评价概述
1.3.1 综合门户网站特点概述
1.3.2 网页信息预处理概述
1.4 本文主要研究内容及组织
第2章 网站主题目录重要性评价
网站主题目录抽取
2.1.1 链接文本信息熵
2.1.2 网站主题目录抽取算法
2.1.3 网页集合对应链接主题的确定
2.2 网站主题目录的归并
2.2.1 Naive-Bayes文本分类算法
2.2.2 改进的Naive-Bayes分类算法
2.2.3 HTML网页净化
2.2.4 文本表示及分类特征选择
2.3 网站主题目录重要性评价
2.3.1 评价指标选取
2.3.2 权重选取
2.4 本章小结
第3章 网站主题目录重要性评价系统设计与实现
3.1 系统总体模块设计
3.2 系统各模块简介及流程设计
3.3 本章小结
第4章 系统测试结果及错误分析
4.1 网站主题目录重要性测试
4.1.1 网站主题目录重要性评价结果评价方案及标准答案
4.1.2 网站主题目录自动抽取结果评价
4.1.3 网站主题目录归并相关实验
4.1.4 网站主题目录重要性评价结果的评价
4.2 实验结果错误分析
4.2.1 网站主题目录重要性评价结果错误分析及改进方案
4.2.2 相关链接抽取错误分析及改进方案
4.3 本章小结
结论
参考文献
附录
攻读硕士期间发表论文
哈尔滨工业大学学位论文原创性声明
哈尔滨工业大学学位论文使用授权书
哈尔滨工业大学学位论文涉密论文管理
致谢