首页> 中国专利> 一种提取文本语素数据的方法、存储介质和系统

一种提取文本语素数据的方法、存储介质和系统

摘要

本发明公开一种提取文本语素数据的方法、存储介质和系统,方法包括:从预设的训练样本集中提取出多个候选文本语素组合,以一个基因序列表示一个文本语素数据组合,生成包括多个基因序列的初始文本语素集合;适应度计算步骤:对本代文本语素集合中的每个所述基因序列,计算每个所述基因序列所表示的文本语素数据组合对于预设的测试集的测试结果作为基因序列的适应度,如果本代文本语素集合满足预设的输出条件,则根据预设的输出规则,输出本代文本语素集合所包括的基因序列所表示的文本语素数据组合作为用于文本分析的输出文本语素数据组合。本发明实现了基于遗传算法实现文本语素的提取,可以获取比传统算法更加高效和准确的文本语素数据组合。

著录项

  • 公开/公告号CN112183054A

    专利类型发明专利

  • 公开/公告日2021-01-05

    原文格式PDF

  • 申请/专利权人 菏泽学院;

    申请/专利号CN202010890208.0

  • 发明设计人 杨玉珍;赵春桥;

    申请日2020-08-28

  • 分类号G06F40/205(20200101);G06F40/284(20200101);G06F40/289(20200101);G06F16/35(20190101);G06N3/12(20060101);

  • 代理机构11491 北京国坤专利代理事务所(普通合伙);

  • 代理人赵红霞

  • 地址 274015 山东省菏泽市大学路2269号菏泽学院综合办公楼

  • 入库时间 2023-06-19 09:26:02

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-01-18

    实质审查的生效 IPC(主分类):G06F40/205 专利申请号:2020108902080 申请日:20200828

    实质审查的生效

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号