文摘
英文文摘
第一章 引言
1.1 研究背景及意义
1.2 国内外研究历史及现状
1.3 本文的主要工作
1.4 论文结构
第二章 文本分类的关键技术
2.1 文本分类过程
2.2 文本预处理
2.3 常用文本表示方法
2.3.1 布尔模型(Boolean Model)
2.3.2 概率模型(Probabilistic Model)
2.3.3 向量空间模型(Vector Space Model)
2.4 常用特征选择方法
2.4.1 文档频率(DF)
2.4.2 信息增益(IG)
2.4.3 互信息(MI)
2.4.4 X2统计量(CHI)
2.5 常用分类方法
2.5.1 朴素贝叶斯(NB)
2.5.2 K近邻(KNN)
2.5.3 支持向量机(SVM)
2.5.4 人工神经网络(ANN)
2.5.5 决策树(DT)
2.6 性能评价指标
2.7 小结
第三章 词语权重计算方法的改进
3.1 常用词语权重计算方法
3.1.1 布尔权重
3.1.2 词频权重(TF)
3.1.3 IDF权重
3.1.4 TF-IDF权重
3.2 传统方法的不足
3.3 改进的方法
3.4 分类器的设计
3.5 小结
第四章 实验结果及分析
4.1 实验介绍
4.1.1 数据集
4.1.2 参数设定
4.2 实验结果
4.3 分析与讨论
4.4 小结
第五章 总结和展望
5.1 总结
5.2 进一步工作
参考文献
致谢
在学期间公开发表论文情况