基于句子排序和组合分类的中文文本分类方法研究
RESEARCH ON CHINESE TEXT CLASSIFICATION BASED ON SENTENCE RANKING AND COMBINATIONAL CLASSIFICATION
摘要
Abstract
目 录
绪论
1.1 课题研究的背景及意义
1.1.1 课题的研究背景
1.1.2 课题的研究意义
1.2 文本分类概述
1.2.1 文本分类的定义
1.2.2 文本分类方法概述
1.2.3 文本分类的系统构成
1.3 本文完成的主要工作
1.4 本文的结构
第2章 文本分类的各阶段及其实现
2.1 引言
2.2 文本表示
2.2.1 文本表示的概念
2.2.2 文本预处理
2.2.3 向量空间模型
2.2.4 权重计算
2.3 特征降维
2.3.1 概述
2.3.2 常用的特征选择函数
2.3.3 基于LSI的特征重构方法
2.4 基于机器学习的分类器训练
2.4.1 机器学习理论概述
2.4.2 Na?ve Bayes分类算法
2.4.3 K-近邻算法
2.4.4 支持向量机算法
2.4.5 多类分类问题
2.5 测试和性能评价
2.6 本章小结
第3章 基于句子排序和权重调整的KNN分类方法
3.1 引言
3.2 句子排序
3.2.1 基于图的句子排序算法
3.2.2 根据句子排序截取句子
3.2.3 根据句子排序调整权重
3.3 利用KNN进行分类
3.4 特征降维方法的选择
3.5 实验结果及分析
3.5.1 实验结果及对比
3.5.2 结论和分析
3.6 本章小结
第4章 基于VSM和LSI结合的分类方法
4.1 引言
4.2 基于VSM和SVM的分类方法
4.3 基于LSI和SVM分类方法
4.4 基于SVM后验概率的VSM和LSI的组合分类
4.4.1 SVM后验概率和准确率的统计
4.4.2 算法描述
4.4.3 实验结果和分析
4.5 基于局部准确率的VSM和LSI组合分类
4.5.1 方法的提出
4.5.2 KNN算法的置信度和准确率的统计
4.5.3 算法描述
4.5.4 实验结果和分析
4.6 本章小结
结论
参考文献
哈尔滨工业大学硕士学位论文原创性声明
哈尔滨工业大学硕士学位论文使用授权书
哈尔滨工业大学硕士学位涉密论文管理
致谢