蒙古语词法标注语料库的构建及相关技术研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

近年来,随着统计方法在自然语言处理中的广泛应用,语料库语言学已经成为一个十分引人注目的研究方向。语料库语言学已经成为语言研究的主流。基于语料库的自然语言处理需要对原始的语料进行不同层次的加工,才能从中获取所需的语言知识。
　　词法标注是语料库最基本的加工,蒙古文信息处理工作的词处理阶段,词法标注是多项后续工作的基础。如:词汇和词尾的统计,各种词典的编制,进行句处理,篇章处理等都需要以正确的“切分标注”为基础。
　　本论文围绕蒙古语的词法标注,研究了相关的技术问题。首先对20万词级词法标注语料库进行了人工校对,对其存在的问题提出了具体的解决方案；其次,利用规则方法改进了基于统计的Mglex词法分析器。实验结果表明,统计和规则相结合的Mglex系统,得到了令人满意的切分标注结果:以20万词级词法标注语料库为训练语料,系统的消歧率从原来的84.6％提高到90.1％；系统的正确率由原来的93.5％提高到97.7％。

著录项

作者
吴金星;
展开▼
作者单位

内蒙古大学;

展开▼
授予单位内蒙古大学;
学科语言学及应用语言学
授予学位硕士
导师姓名那顺乌日图;
年度 2011
页码
总页数
原文格式 PDF
正文语种中文
中图分类文字信息处理;蒙古语;
关键词
蒙古语; 词法标注; 语料库语言学; Mglex词法分析器; 自然语言处理;

相似文献

中文文献
外文文献
专利

1. 蒙古语语料库的词法标注 [J] . 吴金星 . 内蒙古社会科学：蒙文版 . 2013,第005期
2. 蒙古语语料库语义角色标注中存在的问题及其解决方法 [J] . 包其里木格1 ,海银花1 . 内蒙古社会科学：蒙文版 . 2019,第001期
3. 蒙古语自然口语标注加工语料库查询统计系统研究 [J] . 呼日乐吐什 . 内蒙古社会科学：蒙文版 . 2013,第005期
4. 蒙古语语音合成语料库的设计及韵律标注规范的建立 [J] . 郭淑妮 ,图雅 ,斯琴高娃 . 电脑与电信 . 2012,第003期
5. 蒙古语语料库中的助动词标注程序 [J] . 包·萨仁图雅李永强 . 内蒙古社会科学：蒙文版 . 2011,第006期
6. 蒙古语词法标注语料库以及标注系统Mglex的最新进展 [C] . WU Jin-Xing ,吴金星 ,En-He-Ba-Ya-Er . 第四届全国少数民族青年自然语言信息处理学术研讨会 . 2012
7. 蒙古语语料库标注及相关对策研究 [A] . 牧仁高娃 . 2008

蒙古语词法标注语料库的构建及相关技术研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅