要解决的问题:基于连续象形文字等的实际用法创建字典。
解决方案:用于连续象形文字等的分析装置包括:用于提取连续象形文字等的装置,引用单象形文字或类似的字典的句子和物品以从获得的内容中提取。数据,连续象形文字等,包括连续象形文字的句子以及包括该句子的文章;文章特征词提取装置,其参考词词典从提取的文章中提取文章特征词;一种用于提取不包括连续象形文字等的句子的装置,该装置从所获取的内容数据中提取与所提取的句子中不包括连续象形文字等的部分匹配的另一句子;句子特征词提取装置,参考词词典从另一个提取的句子中提取句子特征词;特征词相似性确定装置,其参考相似词词典来确定所提取的文章特征词是否与句子特征词相似;以及用于注册连续象形文字或类似数据的装置,如果确定它们相似,则将所提取的连续象形文字或类似物与句子特征词相关联以将它们注册在连续象形文字或类似字典中。
版权:(C)2011,日本特许厅&INPIT
公开/公告号JP2010271870A
专利类型
公开/公告日2010-12-02
原文格式PDF
申请/专利权人 YAHOO JAPAN CORP;
申请/专利号JP20090122389
发明设计人 KIMURA KEI;
申请日2009-05-20
分类号G06F17/27;G06F17/21;G06F17/22;
国家 JP
入库时间 2022-08-21 18:21:35