首页> 中文期刊> 《现代计算机:下半月版》 >有限状态机在中文文本分词中的应用

有限状态机在中文文本分词中的应用

         

摘要

提出并实现一种有限状态机算法,该方法结合二分查找树算法将整个词典构造成一个有限状态机,从而使词典中的每个不同的汉字以不同弧权值的形式存在于有限状态机中。当要判断某个字符串是不是词时,只要从这个有限状态机的第一个状态结点依次进行查找即可。实验显示,通过这个有限状态机词典可以实现对字符串的快速查找。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号