首页> 中文期刊> 《计算机科学》 >汉字种子混淆集的构建方法研究

汉字种子混淆集的构建方法研究

         

摘要

汉字混淆集是错别字识别中的重要资源之一.在本项研究中,首先手工整理了11935个汉字的可能的错别字,然后以这些汉字为节点、“可错成”关系为边,将混淆集构造成一个错别字混淆集图.由于人工总结错别字具有很大的局限性,因此在种子错别字混淆集图的基础上,设计了自扩展算法和开源外部补充算法来对错别字混淆集图进行扩展,以发现新的错别字对.根据实验,新发现了15133组错别字对.经过随机抽样校对,准确率达到87.35%.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号