要解决的问题:在不使用教师数据的情况下创建语言模型并拆分单词。
解决方案:语言模式创建设备使用语言模型132随机选择存储在字符串数据131中的多个句子,并创建一个字符串拆分模式组,该字符串拆分模式组指示在所选句子中作为单词标点候选的字符串将与字符串分割模式组的字符串分割模式相对应的句子的概率记录在存储器中,并基于该概率从字符串分割模式组中选择字符串模式。使用所选择的字符串分割模式来更新语言模型132。对存储在字符串数据131中的所有句子执行这样的处理,并且优化语言模型132。使用以这种方式优化的语言模型132,执行句子的最可能单词的分割。
版权:(C)2010,日本特许厅&INPIT
公开/公告号JP5199901B2
专利类型
公开/公告日2013-05-15
原文格式PDF
申请/专利权人 日本電信電話株式会社;
申请/专利号JP20090010931
申请日2009-01-21
分类号G06F17/27;
国家 JP
入库时间 2022-08-21 16:54:44