基于半监督隐马尔科夫的汉语词性标注研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着信息技术和网络技术的不断进步与发展，计算机成为了人类生活必不可少的一种工具。由计算机智能地处理人类语言的技术，即自然语言处理(Natural LanguageProcessing，NLP)技术便应运而生。词性标注(Part-Of-Speech Tagging)作为其中较为基础的一种预处理程序，对后续的工作和课题研究都起着至关重要的作用。
　　本文使用基于隐马尔科夫模型(Hidden Markov Model)的词性标注方法，从如下几个方面进行了改进，以提高标注的准确率。首先，利用小规模训练语料进行半监督学习，通过反复迭代不断扩充语料，增强马尔科夫标注效果，尤其对于不同领域的语料，这种迁移学习也能提高标注准确率;其次，通过词语相似度的方法，给每个高频的未登录词都标上候选词性，对于频率低于10的低频未登录词，则采用相似字符串查找的方式找到相似上下文，用于标记词性;最后，在隐马尔科夫标注时，不仅选取一条路径，而是选两条最佳路径，并通过二次选择，得到最后标注结果。实验证明，该方法与传统隐马尔科夫标注方法相比提高了2.6％，汉语词性标注准确率达到了95.65％。

著录项

作者
韩霞;
展开▼
作者单位

大连理工大学;

展开▼
授予单位大连理工大学;
学科计算机应用技术
授予学位硕士
导师姓名黄德根;
年度 2015
页码
总页数
原文格式 PDF
正文语种中文
中图分类文字信息处理;自动推理、机器学习;
关键词
汉语词性标注; 半监督学习; 隐马尔科夫模型; 词语相似度;

相似文献

中文文献
外文文献
专利

1. 基于隐马尔科夫模型的古汉语词性标注 [J] . 杨新生 ,胡立生 . 微型电脑应用 . 2020,第005期
2. 基于改进的隐马尔科夫模型的汉语词性标注 [J] . 王敏 ,郑家恒 . 计算机应用 . 2006,第0z2期
3. 基于改进的隐马尔科夫模型的词性标注方法 [J] . 袁里驰 . 中南大学学报（自然科学版） . 2012,第008期
4. 基于隐马尔科夫模型的词性标注 [J] . 赵红丹 ,王希杰 . 安阳师范学院学报 . 2010,第005期
5. 隐马尔科夫模型在词性标注中的应用 [J] . 才华 . 西藏大学学报（自然科学版） . 2012,第002期
6. 基于分层隐马尔科夫模型的连续手势识别研究 [C] . Tao Chongben ,陶重犇 ,Li Chunguang . 2017年全国高性能计算学术年会 . 2017
7. 基于改进的隐马尔科夫模型汉语词性标注 [A] . 王敏 . 2007

基于半监督隐马尔科夫的汉语词性标注研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅