声明
致谢
摘要
第一章 绪论
1.1 论文研究背景和意义
1.1.1 研究背景
1.1.2 研究意义
1.2 国内外研究现状
1.2.1 数据流聚类算法研究现状
1.2.2 话题检测研究现状
1.3 论文研究内容与方法
1.4 论文章节安排
第二章 数据流聚类和文本挖掘基本理论
2.1 聚类基础理论
2.1.1 聚类分析定义
2.1.2 聚类分析的数据基础
2.1.3 相似度计算方法
2.1.4 数据挖掘对聚类分析的要求
2.1.5 聚类算法主要类别
2.2 数据流聚类算法
2.2.1 数据流的概念与特征
2.2.2 数据流聚类特点
2.2.3 数据流计算模型
2.3 文本数据流聚类算法
2.3.1 文本对象特征表示方法
2.3.2 常用文本数据流聚类算法
2.4 本章小结
第三章 近邻传播算法基本原理及其扩展
3.1 AP聚类算法简介
3.1.1 AP算法相关定义
3.1.2 AP算法步骤
3.1.3 AP算法分析
3.2 加权的AP算法
3.3 分级加权的AP算法
3.4 本章小结
第四章 在线近邻传播文本数据流聚类算法
4.1 OAP-s算法
4.1.1 OAP-s算法基本思想
4.1.2 OAP-s算法步骤
4.1.3 OAP-s算法分析
4.2 OWAP-s算法
4.2.1 OWAP-s算法基本思想
4.2.2 OWAP-s算法步骤
4.2.3 OWAP-s算法分析
4.3 实验验证
4.3.1 评价指标
4.3.2 实验环境
4.3.3 实验结果及分析
4.3.4 算法性能分析
4.4 本章小结
第五章 基于OWAP-s算法的股票事件检测
5.1 事件检测流程
5.2 数据抓取方法
5.2.1 网络爬虫原理
5.2.2 R语言概述
5.3 实验验证
5.3.1 实验环境及工具
5.3.2 实验结果及分析
5.4 本章小结
第六章 总结与展望
6.1 总结
6.2 展望
参考文献
攻读硕士学位期间的学术活动及成果情况
合肥工业大学;