声明
摘要
1.1 课题研究背景及意义
1.2 问题描述
1.3 本文工作
1.4 论文结构
第二章 相关工作
2.1 基于用户行为的属性推断
2.2 用户评论数据的文本分析
2.2.1 基于人工标注特征提取
2.2.2 基于特定词特征提取
2.2.3 基于语义关系特征提取
2.3 不平衡数据的分类学习
2.3.1 采样技术
2.3.2 代价敏感学习
2.3.3 集成学习
2.4 小结
第三章 用户评论行为建模
3.1 用户评论样式特征
3.2 用户评论行为数据的上下文特征
3.3 用户评论行为数据的客体特征
3.4 基于语义知识库的评论分析
3.4.1 语义知识库的选择
3.4.2 层次化语义分析
3.4.3 语义特征的路径向量表示
3.5 基于词向量的评论挖掘
3.5.1 词向量模型
3.5.2 基于词向量的用户建模
3.6 小结
第四章 基于特征重要性的概率选择
4.2 特征重要性度量
4.2.1 基于熵的特征重要性度量
4.2.2 基于基尼指数的特征重要性度量
4.2.3 特征重要性与概率选择
4.3 基于信息增益的概率包裹式特征筛选
4.4 基于启发式概率特征搜索算法
4.5 小结
第五章 数据不平衡分类学习
5.1 基于分类学习的属性推断
5.2 面向不均衡属性分布的增强学习
5.3 小结
6.1 数据集与数据预处理
6.2 性能度量指标
6.3 实验结果
6.3.1 属性推断方法对比
6.3.2 用户行为建模分析
6.3.3 特征筛选算法对比及参数分析
6.3.4 不均衡样本比例处理方法对比及参数分析
6.3.5 用户行为不均衡性对分类结果的影响
6.4 小结
7.1 总结
7.2 展望
参考文献
致谢
攻读学位期间发表的学术论文和参加科研情况
攻读学位期间参加的科研项目