首页> 中文期刊> 《中文信息学报》 >蒙古文停用词和英文停用词比较研究

蒙古文停用词和英文停用词比较研究

         

摘要

In this paper, we initially set the Mongolian stop words with the union entropy algorithm (union entropy, UE), and then remove Mongolian entities nouns and homographs from Mongolian stop words, finally we compare the parts of speech of English stop words and Mongolian stop wordsto determine the Mongolian stopword list. We test the Mongolian stopword list and the English stopword list on document information retrieval task. The results show that the method used in this paper to determine the Mongolian stopword list has higher accuracy in Mongolian document retrieval than the simple translation English stop words into Mongolian.%该文采用联合熵算法(Union Entropy,UE)初步确定了蒙古文停用词,接着从初步确定的蒙古文停用词中去掉蒙古文实体名词及同形异义词,再通过对英文停用词和蒙古文停用词的词性比较,确定了蒙古文停用词表.最后用蒙古文停用词表和英文停用词表进行了文档信息检索的对比实验.实验结果表明,用该文所述方法确定的蒙古文停用词表进行蒙古文文档检索,比用英文停用词翻译成蒙古文进行蒙古文文档检索的准确率更尚.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号