要解决的问题:提供一种文本句子搜索设备,文本句子搜索方法和文本句子搜索程序,用于在考虑文本句子的语义内容的同时高精度地搜索文本句子。
解决方案:单词划分/单词类别提供部分14将查询文本句子划分为单词,并为每个单词提供单词类别。语法/含义分析部分16基于单词分段/单词类别给出数据来分析语义块,中心单词和查询文本句子的情况。特征量生成部18设定语义块权重和中心词权重,并使用这些权重,词分割/词类给出数据,文本查询文本句子的DF值来生成查询文本句子的语义矢量特征量。统计数据存储部分20中存储的单词的DF值中的一个等等。相似度计算部分22计算查询文本句子的语义矢量特征量与存储在数据库存储部分24中的搜索对象文本句子的语义矢量特征量之间的相似度,并将结果存储在存储部分26中。
COPYRIGHT:(C )2006,日本特许厅
公开/公告号JP4534666B2
专利类型
公开/公告日2010-09-01
原文格式PDF
申请/专利权人 富士ゼロックス株式会社;
申请/专利号JP20040243739
申请日2004-08-24
分类号G06F17/30;G06F17/27;
国家 JP
入库时间 2022-08-21 18:59:33