首页> 中国专利> 一种从文本语料中提取持续性热点短语的方法、装置及存储介质

一种从文本语料中提取持续性热点短语的方法、装置及存储介质

摘要

本发明实施例公开了一种从文本语料中提取持续性热点短语的方法、装置及存储介质;该方法可以包括:将原始文本语料划分为多个与时间区间相对应的文本集合;基于每个文本集合所包含的文本后缀及各文本后缀出现的频率构造每个文本集合对应的频率后缀树;基于查询指令所指示的热点持续时间区间以及最小出现频率阈值遍历所述热点持续时间区间所对应的频率后缀树,查询获得在所述热点持续时间区间内出现频率不低于所述最小出现频率阈值的热点短语。

著录项

  • 公开/公告号CN112966505B

    专利类型发明专利

  • 公开/公告日2021-10-15

    原文格式PDF

  • 申请/专利权人 哈尔滨工业大学;

    申请/专利号CN202110079692.3

  • 申请日2021-01-21

  • 分类号G06F40/289(20200101);G06F40/216(20200101);G06F40/242(20200101);G06F16/33(20190101);

  • 代理机构61253 西安维英格知识产权代理事务所(普通合伙);

  • 代理人李斌栋;归莹

  • 地址 150006 黑龙江省哈尔滨市南岗区西大直街92号

  • 入库时间 2022-08-23 12:36:44

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号