基于角色标注的中国人名自动识别研究

摘要

中国人名自动识别是中文未登录词识别的重点和难点,目前的解决方案自身存在一些本质的缺陷,实际效果还难以满足需求.本文提出了一种基于角色标注的中国人名自动识别方法.即:根据在人名识别中的作用,采取Viterbi算法对切词结果进行角色标注,在角色序列的基础上,进行模式最大匹配,最终实现中国人名的识别.识别过程中我们只需要某个词作为特定角色的概率以及角色之间的转移概率.该方法的实用性还在于:这些角色信息完全可以从语料库中自动抽取得到.通过对16M字节真实语料库的封闭与开放测试,该方法取得了接近98%的召回率,准确率也非常不错.总之,该方法是行之有效、能够成功地解决中国人名自动识别问题

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号