首页> 外国专利> BROAD-COVERAGE NORMALIZATION SYSTEM FOR SOCIAL MEDIA LANGUAGE

BROAD-COVERAGE NORMALIZATION SYSTEM FOR SOCIAL MEDIA LANGUAGE

机译:社交媒体语言的广泛覆盖标准化系统

摘要

A method for identification of a standard text token in a dictionary that corresponds to a non-standard token identified in text includes identification of a first standard token that is associated with the non-standard using a predetermined conditional random field (CRF) model and identification of a second standard token that is associated with the non-standard token using a spell checker. The method further includes identification of noisy channel scores using data from the CRF model and the spell checker for the first standard token and the second standard token, respectively. The method further includes presentation of one of the first and second standard tokens having the greatest identified noisy channel score to a user with a user interface device.
机译:一种用于在字典中标识与文本中标识的非标准标记相对应的标准文本标记的方法,包括使用预定的条件随机字段(CRF)模型对与该非标准相关联的第一标准标记进行标识和标识使用拼写检查器与非标准令牌关联的第二标准令牌的确定。该方法还包括分别使用来自CRF模型和拼写检查器的数据针对第一标准令牌和第二标准令牌来识别噪声信道分数。该方法还包括通过用户界面设备向用户呈现具有最大识别的噪声信道得分的第一和第二标准令牌中的一个。

著录项

  • 公开/公告号EP2820567A2

    专利类型

  • 公开/公告日2015-01-07

    原文格式PDF

  • 申请/专利权人 ROBERT BOSCH GMBH;LIU FEI;WENG FULIANG;

    申请/专利号EP20130710195

  • 发明设计人 LIU FEI;WENG FULIANG;

    申请日2013-02-27

  • 分类号G06F17/27;

  • 国家 EP

  • 入库时间 2022-08-21 15:04:20

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号