首页> 中国专利> 以无模式输入将一种文本形式转换成另一种文本形式的语言输入体系结构

以无模式输入将一种文本形式转换成另一种文本形式的语言输入体系结构

摘要

一种语言输入体系结构把语音文本(例如中文拼音)输入串转换成语言文本(例如中文汉字)输出串,其转换方式使打字错误和从语音文本到语言文本转换过程中发生的转换错误达到最少。该语言输入体系结构有搜索引擎、一个或多个打字模型、一个语言模型、以及一个或多个用于不同语言的字典。每个打字模型在真实数据上受训练并学习打字错误概率。该打字模型被配置成根据概率产生可能用于代替输入串的可能打字候选串列表,这些概率表明有多大可能每个候选串被不正确地输入作为输入串。这些可能的打字候选串可以存储在数据库中。该语言模型根据概率为每个打字候选串提供可能的转换串,这些概率表明一个可能的转换输出串有多大可能代表该候选串。搜索引擎把打字模型和语言模型的概率结合,以找出代表输入串转换后形式的最可能的转换串。通过产生打字候选串,然后使用相关联的转换串去代替输入串,该体系结构可消除许多普遍性的打字错误。当利用多个打字模型时,该体系结构能自动地区分多种语言,无需为输入多种语言而进行模式切换。

著录项

  • 公开/公告号CN100492350C

    专利类型发明授权

  • 公开/公告日2009-05-27

    原文格式PDF

  • 申请/专利权人 微软公司;

    申请/专利号CN00814906.2

  • 发明设计人 李凯夫;陈征;韩建;

    申请日2000-10-13

  • 分类号G06F17/27(20060101);G06F17/28(20060101);

  • 代理机构中国国际贸易促进委员会专利商标事务所;

  • 代理人吴丽丽

  • 地址 美国华盛顿

  • 入库时间 2022-08-23 09:02:25

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2015-12-09

    未缴年费专利权终止 IPC(主分类):G06F 17/27 授权公告日:20090527 终止日期:20141013 申请日:20001013

    专利权的终止

  • 2015-05-20

    专利权的转移 IPC(主分类):G06F 17/27 变更前: 变更后: 登记生效日:20150506 申请日:20001013

    专利申请权、专利权的转移

  • 2009-05-27

    授权

    授权

  • 2003-03-05

    实质审查的生效

    实质审查的生效

  • 2002-12-11

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号