文摘
英文文摘
声明
第1章绪论
1.1应用背景
1.2面向主题搜索的研究现状
1.3本文的主要研究内容
第2章主题搜索策略涉及的基本问题及本文的应对策略
2.1主题搜索策略与通用搜索策略的比较
2.2主题搜索的分类
2.3主题页面在Web上的分布特征
2.4主题爬行起点的选择
2.5用户查询主题的表示
2.6 Spider研究
2.7页面分析
2.8 URL与主题的相关性判定
2.9页面与主题的相关性判定
2.10如何结束搜索
第3章形式概念分析及其在主题搜索中的应用
3.1形式概念分析研究现状
3.2概念格的构建
3.3概念格在主题搜索中的应用
3.4概念格上隐含的关系
3.5格上核心概念的定义
3.6格上概念距离的计算
3.7概念相似度的计算
第4章主题爬行策略研究
4.1主题爬行策略的定义
4.2爬行技术的分类
4.3主题爬行中几个度量指标的研究
4.4基于内容的主题爬行策略
4.5基于学习的主题爬行策略
4.6基于链接结构的主题爬行策略
4.7基于形式概念分析的主题爬行策略
第5章系统组建及实验结果分析与评价
5.1构建主题爬行系统
5.2实验过程
5.3实验结果分析与评价
总结与展望
参考文献
攻读硕士学位期间科研成果
致谢