首页> 中国专利> 一种词汇表的筛选方法

一种词汇表的筛选方法

摘要

本发明提供了一种词汇表的筛选方法,包括:确定预设词汇在预先存储的语料库中出现的频率;确定预设词汇在预先存储的语料库中的预设语段中的位置信息,并根据所述位置信息获得所述预设词汇对应的位置熵;根据所确定的预设词汇在预先存储的语料库中出现的频率和获得的所述预设词汇对应的位置熵,计算出所述预设词汇的权重;根据所计算出的所述预设词汇的权重结果,从预先存储的语料库中筛选出相关的预设词汇,构成筛选词汇表。用以提高筛选词汇的准确性和可靠性。

著录项

  • 公开/公告号CN110134767B

    专利类型发明专利

  • 公开/公告日2021-07-23

    原文格式PDF

  • 申请/专利权人 云知声(上海)智能科技有限公司;

    申请/专利号CN201910390439.2

  • 发明设计人 陈峰;

    申请日2019-05-10

  • 分类号G06F16/33(20190101);G06F40/216(20200101);G06F40/30(20200101);G06F40/284(20200101);G06K9/62(20060101);

  • 代理机构11399 北京冠和权律师事务所;

  • 代理人朱健;张国香

  • 地址 200000 上海市徐汇区桂箐路65号1幢702室03单元

  • 入库时间 2022-08-23 12:11:02

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号