声明
1绪论
1.1研究背景和意义
1.1.1研究背景
1.1.2研究意义
1.2国内外研究现状
1.2.1患者安全事件的识别
1.2.2患者就医体验文本挖掘
1.2.3不均衡分类
1.3研究目标和内容
1.4研究技术路线
1.5论文结构安排
2相关概念
2.1患者安全
2.2患者安全事件
2.3患者投诉
2.4不均衡数据集分类
3数据来源和数据标注
3.1数据来源
3.2数据标注
3.2.1标注指南
3.2.2标注过程
3.2.3数据的统计性描述
4研究方法
4.1重采样方法
4.1.1欠采样
4.1.2过采样
4.1.3混合采样
4.2分类方法
4.2.1支持向量机
4.2.2随机森林
4.2.3 AdaBoost
4.2.4梯度提升决策树
5实验设计
5.1患者投诉文本的预处理
5.2分类模型的训练与测试
5.3评估
6实验结果分析
6.1无处理的数据分类结果
6.2欠采样结果分析
6.3过采样结果分析
6.4混合采样结果分析
6.5实验小结
7讨论
7.1讨论
7.1.1不同采样方法的影响
7.1.2不同分类器的自动识别性能
8.结论与展望
8.1结论
8.2局限性
8.3展望
致谢
参考文献
综述:健康领域的文本分类及不均衡样本分类应用研究
附件1 攻读学位期间发表论文目录
华中科技大学;