首页> 中文期刊> 《中文信息学报》 >自动获取汉语词语搭配

自动获取汉语词语搭配

         

摘要

作为一种词汇现象,词语搭配在自然语言处理的许多领域具有重要的应用.本文对4种词语相关性度量和3种词语结构分布度量分别进行了比较分析,并提出了一种基于互信息与熵融合的获取词语搭配的方法.实验结果表明:在同现频率较高情况下,互信息、Cosine系数、x2测试和似然比测试4种相关性度量对搭配判定有大致相同的效果;在度量词语的结构分布方面,熵要优于方差和离散度.本文所提方法依赖度量指标少,阈值容易选取,且与其他已有的方法具有同等效果.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号