文摘
英文文摘
资金来源
第一章 引言
1.1 选题背景及意义
1.2 词法标注方法介绍
1.2.1 基于规则的词法标注方法
1.2.2 基于统计的词法标注方法
1.2.3 规则和统计相结合的方法
1.3 蒙古语词法标注研究现状
1.4 研究方法及语料库介绍
1.4.1 研究方法
1.4.2 20万词级词法标注语料库
1.5 论文的主要工作
1.6 论文结构
第二章 MGLEX系统介绍
2.1 蒙古语构形特征
2.2 模型结构
2.3 实验
第三章 语料库校对
3.1 标记集问题
3.2 理论问题
3.2.1 复数后缀问题
3.2.2 数词的标注问题
3.2.3 名词的标注问题
3.2.4 “UGEI”的标注
3.2.5 第二类助动词的标注
3.2.6 其他
3.3 技术问题
第四 章MGLEX系统的改进
4.1 语料库分析
4.2 具体措施
4.2.1 规则导致的错误及解决方案
4.2.2 未登录词干的识别问题
4.2.3 人名地名标注错误及解决方案
4.2.4 兼类词处理
4.3 实验
结论
参考文献
附录1 :20万语料库TXT格式
附录2 :20万语料库中出现的兼类词
附录3 :MGLEX系统标注结果示例:(NARAN-V D00R_A)
致谢
攻读硕士学位期间发表过的学术论文