首页> 中国专利> 一种生物文本中蛋白质相互关系的半监督抽取方法

一种生物文本中蛋白质相互关系的半监督抽取方法

摘要

本发明公开了一种生物文本中蛋白质相互关系的半监督抽取方法,按如下步骤进行:(1)将训练样本集和未标注样本集输入预处理器,分别进行蛋白质命名实体识别、分句处理和指代消解处理;(2)在预处理过的训练样本集中提取候选蛋白质作用对;(3)在候选蛋白质作用对中提取分类模型需要的特征集,对特征集的特征值进行基于信息强度的加权;(4)将基于信息强度加权的特征值与未标注样本集一起输入到分类模型中进行半监督学习,对中样本进行标注,将最有价值的生物文本加入到样本标注集,用更新训练样本集和未标注样本集,对分类过程进行迭代,直到收敛。本发明简洁高效、性能高、收敛快、抽取效率高并保证数据真实性、节约实验资源。

著录项

  • 公开/公告号CN103136361B

    专利类型发明专利

  • 公开/公告日2016-11-30

    原文格式PDF

  • 申请/专利权人 陈一飞;

    申请/专利号CN201310072341.5

  • 发明设计人 陈一飞;

    申请日2013-03-07

  • 分类号G06F17/30(20060101);

  • 代理机构32102 南京苏科专利代理有限责任公司;

  • 代理人姚姣阳

  • 地址 211815 江苏省南京市浦口区雨山西路86号

  • 入库时间 2022-08-23 09:49:05

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-05-03

    专利权的转移 IPC(主分类):G06F 17/30 登记生效日:20170410 变更前: 变更后:

    专利申请权、专利权的转移

  • 2016-11-30

    授权

    授权

  • 2013-07-10

    实质审查的生效 IPC(主分类):G06F 17/30 申请日:20130307

    实质审查的生效

  • 2013-06-05

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号