声明
致谢
摘要
1.1 研究背景及意义
1.2 研究现状
1.2.1 命名实体识别研究现状
1.2.2 特定领域命名实体识别的研究现状
1.3 研究内容与目标
1.4 论文组织结构
2 相关理论与技术基础
2.1 特定领域命名实体识别通用方法实现的难点
2.1.1 特征的选取
2.1.2 标注样本匮乏
2.2 条件随机场
2.3 神经网络的词向量
2.3.1 词向量的定义
2.3.2 词向量模型训练
2.4 半监督学习与主动学习
2.4.1 半监督学习
2.4.2 主动学习
2.5 本章小结
3 基于词向量和条件随机场的特定领域命名实体识别方法
3.1 基本思想与方法
3.2.1 语料标注
3.2.2 统计特征选取
3.3 词向量相似度特征
3.3.1 Wrod2vec训练词向量
3.3.2 相似度特征计算
3.3.3 训练实验结果与分析
3.4 实验设置及实验结果分析
3.4.1 实验评价标准
3.4.2 实验设置
3.4.3 实验结果及分析
3.5 本章小结
4 主动学习和自学习相结合的特定领域命名实体识别
4.1 融合动机
4.1.1 自学习算法的弊端
4.1.2 主动学习算法的弊端
4.2 算法描述
4.2.1 基于置信度的样本选择
4.2.2 算法的处理流程
4.3 实验设置与实验结果分析
4.3.1 自学习算法与主动学习算法结合方法验证实验
4.3.2 主动学习算法样本选取实验
4.3.3 自学习算法样本选取实验
4.4 本章小结
5 总结与展望
参考文献
作者简历及攻读硕士学位期间取得的研究成果
学位论文数据集