首页> 中国专利> 一种文本核心内容提取方法及装置

一种文本核心内容提取方法及装置

摘要

一种文本核心内容提取方法及装置,所述方法包括:获取待处理文本并提取所述待处理文本中的关键词;将所述待处理文本中的各段落划分为多个主题;根据所述主题中各句子对应的指标参数分别提取各所述主题的核心句子,其中,所述指标参数包括:各句子在所述待处理文本的位置、各句子的词频总数占所在主题词频总数的比重、各句子的设定词汇的数量及各句子包含的关键词的频次;将所述核心句子按照预设的组合策略进行组合,形成摘要文本。本申请提供的文本核心内容提取方法及装置,采用多维度的综合评价策略,能够根据文本中的不同主题,对文本核心内容进行有代表性的提取,全面客观地反映文本内容。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-10-11

    专利申请权的转移 IPC(主分类):G06F16/34 专利申请号:202010575748X 登记生效日:20220927 变更事项:申请人 变更前权利人:中国建设银行股份有限公司 变更后权利人:建信金融科技有限责任公司 变更事项:地址 变更前权利人:100033 北京市西城区金融大街25号 变更后权利人:200120 上海市浦东新区自由贸易试验区银城路99号12层、15层 变更事项:申请人 变更前权利人:建信金融科技有限责任公司 变更后权利人:

    专利申请权、专利权的转移

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号