首页> 中国专利> 一种搜索引擎中错别字自动更正方法和服务器

一种搜索引擎中错别字自动更正方法和服务器

摘要

本发明提供了一种搜索引擎中错别字自动更正方法和服务器,能够更高效的纠正文本中的错别字,通过深度学习模型和高维向量化,将每个字映射到高位空间中,并通过高维向量表示字与字之间的关系,再利用字的上下文信息和其在句子中的作用来识别其是否是错别字。该方法不用花费大量的成本去构建错别字与正确字之间的一一对应关系,而仅仅是构建一个合适的错别字训练纠正模型,学习错别字的特征。本发明采用的技术方案时考虑了句子的语义和句法、词性和词的上下文信息来对句子中的错别字进行识别和纠正,它能识别的错别字不仅仅只是同音字和形近字,还可以识别和改正其他类型的错别字,大大提高了错别字的纠正效率。

著录项

  • 公开/公告号CN106777073A

    专利类型发明专利

  • 公开/公告日2017-05-31

    原文格式PDF

  • 申请/专利权人 深圳爱拼信息科技有限公司;

    申请/专利号CN201611142645.4

  • 发明设计人 黄威威;潘嵘;张晋斌;

    申请日2016-12-13

  • 分类号G06F17/30(20060101);G06F17/27(20060101);

  • 代理机构

  • 代理人

  • 地址 518057 广东省深圳市南山区南山街道科技园中区科苑路15号科兴科学园B栋3单元1801号单元

  • 入库时间 2023-06-19 02:23:20

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-06-23

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20161213

    实质审查的生效

  • 2017-05-31

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号