声明
第1章 绪论
1.1研究背景与意义
1.2研究现状
1.2.1搜索结果表示方法的研究现状
1.2.2 K-means初始聚类中心的研究现状
1.3研究内容
1.4本文组织结构
第2章 基于位图的文本表示方法研究
2.1 向量空间模型及其存在的问题
2.1.1 向量空间模型思想
2.1.2 向量空间模型存在的问题
2.2 基于位图的文本表示方法
2.2.1 位图文本表示方法的提出
2.2.2 基于位图的文本特征表示
2.2.3 基于位图的文本相似度计算
2.3 实验结果与分析
2.3.1 实验环境
2.3.2 实验数据集和评价指标
2.3.3 实验设置
2.3.4 实验1不同的实验参数对K-means算法聚类效果的影响
2.3.5 实验2不同文本表示方法的聚类效果对比实验
2.3.6 实验3不同文本表示方法的聚类耗时对比实验
2.3.7 实验4不同文本表示方法占用的存储空间对比
2.4 本章小结
第3章 基于悲观准则和近邻算法的初始聚类中心选择算法
3.1 K-means算法存在的问题
3.2 PC算法
3.2.1 悲观准则
3.2.2 PC算法的提出
3.2.3 PC算法满足初始聚类中心第一准则证明
3.2.4 PC算法过程
3.3 PC-KNN初始聚类中心选择算法
3.3.1 PC-KNN算法的提出
3.3.2 PC-KNN算法同时满足初始聚类中心两个准则证明
3.3.3 PC-KNN算法过程
3.4 实验结果与分析
3.4.1 实验环境
3.4.2 实验数据集和评价指标
3.4.3 实验设置
3.4.4 实验1近邻数k对PC-KNN算法的影响
3.4.5 实验2不同初始聚类中心选择算法的聚类效果对比
3.4.6 实验3不同初始聚类中心选择算法的聚类收敛速率对比
3.4.7 实验4不同初始聚类中心选择算法在公开数据集上的聚类效果
3.5 本章小结
第4章 聚类搜索引擎原型系统的设计与实现
4.1 原型系统构建的目的与意义
4.2 原型系统的设计
4.2.1 系统的框架设计
4.2.2 系统的功能模块设计
4.3 原型系统的实现
4.3.1 系统开发环境
4.3.2 数据采集模块实现
4.3.3 数据预处理模块实现
4.3.4 特征表示模块实现
4.3.5 聚类模块实现
4.4 原型系统的运行效果及对比
4.4.1 后端运行效果
4.4.2 前端运行效果及对比
4.5 本章小结
第5章 总结与展望
5.1 工作总结
5.2 展望
致谢
参考文献
攻读学位期间获得与学位论文相关的科研成果目录
武汉理工大学;