首页> 中文会议>第四届全国信息检索与内容安全学术会议 >基于可信度的中文完整词自动识别

基于可信度的中文完整词自动识别

摘要

中文自动分词是中文信息检索中预处理工作的一部分,也是中文信息检索技术中的重要问题之一.针对在信息检索中完整词整体表达更有意义、更能体现用户查询目的的问题,结合完整词的成词特点,将互信息和完整词前后缀的计算,与组成完整词的可信度相关联,提出基于可信度的三种中文完整词自动识别方法,分别构成基于全信度、偏信度,以及前两者加权平均的混信度的完整词识别方法,设计及实现了基于可信度的三种完整词自动识别中文分词原型系统.最后给出了对第二届SIGHAN(2005)北大测试集语料的各实验测试结果和分析,结果表明该原型系统的识别性能良好,且能同时满足多种性能的需求.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号