首页> 外国专利> Multi-concept latent semantic analysis queries

Multi-concept latent semantic analysis queries

机译:多概念潜在语义分析查询

摘要

A method includes accessing text, identifying a plurality of terms from the text, determining a plurality of term vectors associated with the identified plurality of terms, and clustering the determined plurality of term vectors into a plurality of clusters, the plurality of clusters comprising a first and a second cluster, the first and second clusters each comprising two or more of the determined term vectors. The method further includes creating a first pseudo-document according to the first cluster, creating a second pseudo-document according to the second cluster, identifying a first set of terms associated with the first cluster using latent semantic analysis (LSA) of the first pseudo-document, identifying a second set of terms associated with the second cluster using LSA of the second pseudo-document, and combining the first and second sets of terms into a list of output terms.
机译:一种方法包括访问文本,从文本中识别多个术语,确定与所标识的多个术语相关联的多个术语向量,以及将确定的多个术语向量聚类为多个簇,所述多个簇包括第一簇。第二和第二聚类,第一和第二聚类各自包括两个或多个确定的项向量。该方法还包括根据第一集群创建第一伪文档,根据第二集群创建第二伪文档,使用第一伪集群的潜在语义分析(LSA)识别与第一集群相关联的第一术语集-文档,使用第二伪文档的LSA标识与第二群集相关联的第二术语集,并将第一和第二术语集组合为输出术语列表。

著录项

  • 公开/公告号US9026535B2

    专利类型

  • 公开/公告日2015-05-05

    原文格式PDF

  • 申请/专利权人 BRAINSPACE CORPORATION;

    申请/专利号US201313732869

  • 发明设计人 PAUL A. JAKUBIK;

    申请日2013-01-02

  • 分类号G06F17/30;G06F17/27;

  • 国家 US

  • 入库时间 2022-08-21 15:17:04

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号