文摘
英文文摘
声明
第一章引言
1.1选题背景和研究意义
1.2国内外研究现状
1.2.1用户兴趣挖掘研究现状
1.2.2文本聚类算法研究现状
1.3全文的组织结构
第二章用户兴趣挖掘与文本聚类相关技术
2.1 Web挖掘分类
2.2用户兴趣挖掘
2.2.1用户兴趣建模方式
2.2.2用户兴趣信息获取
2.2.3用户兴趣的表示
2.2.4用户兴趣模型的更新
2.3文本聚类相关技术
2.3.1文本预处理
2.3.2向量空间模型
2.3.3常用的文本聚类算法
2.3.4聚类结果的评价标准
2.4本章小结
第三章基于参考区域的k-means初始化
3.1问题的提出
3.2 CURD算法
3.3 k-means文本聚类算法
3.4参考区域的生成
3.4.1输入参数的确定
3.4.2确定参数k及初始分区的生成
3.4.3改进算法流程
3.4.4算法时间复杂性分析
3.5实验和算法评估
3.6本章小结
第四章基于局部迭代的k-means文本聚类
4.1问题的提出
4.2最优化相关问题
4.3面向文本聚类的迭代优化
4.4算法修改
4.4.1目标函数的变化
4.4.2修改算法及复杂度分析
4.4.3算法迭代的自动确定
4.5实验和算法评估
4.6本章小结
第五章面向用户兴趣聚类系统的生成
5.1面向用户兴趣的聚类系统结构
5.2用户兴趣的生成
5.2.1向量空间模型表示兴趣
5.2.2基于概化方法的兴趣主题词抽取
5.2.3用户子兴趣的生成
5.3实验测试及分析
5.4本章小结
结 论
参考文献
攻读硕士学位期间取得的学术成果
致 谢