文摘
英文文摘
声明
1绪论
1.1研究背景及意义
1.2生物命名实体识别研究的特点及难点
1.3研究现状
1.4本文的工作
2相关统计模型
2.1条件随机域(CRFs)模型
2.1.1无向图结构
2.1.2势函数表示
2.1.3参数估计
2.1.4概率计算
2.2改进的条件随机域模型(Mecab)
2.2.1 词图信息
2.2.2改进的CRFs
2.2.3特征选取
3基于条件随机域(CRFs)的生物命名实体识别
3.1生物命名实体的类型与标注方法
3.1.1生物命名实体的定义
3.1.2生物命名实体的类型
3.1.3生物命名实体的标注方法
3.2基于CRFs的生物命名实体识别特征选取
3.3基于CRFs的生物命名实体识别模型构建
4基于词典和机器学习相结合的生物命名实体识别
4.1系统流程
4.2 词典的构建
4.2.1 普通词典
4.2.2实体词典
4.3分组策略
4.4后续处理
5实验结果与分析
5.1 实验语料
5.2测评参数
5.3实验设计与实验结果分析
5.3.1各特征对生物命名实体识别的影响
5.3.2基于CRFs统计机器学习方法的生物命名实体识别
5.3.3不同标记集的识别结果
5.3.4基于词典和机器学习相结合的生物命名实体识别
5.3.5后续处理对识别效果的影响
5.3.6与相关文献的实验结果的比较
5.3.7实验展望
结 论
参考文献
附录
攻读硕士学位期间发表学术论文情况
致谢