首页> 中国专利> 面向大规模高维序列数据的交互特征并行选择方法

面向大规模高维序列数据的交互特征并行选择方法

摘要

本发明提供一种面向大规模高维序列数据的交互特征并行选择方法,包括:对原始高维SNP数据进行编码;通过基于图论的块过滤,保留与目标类相关的编码后的SNP数据;将与目标类相关的SNP数据执行细粒度的特征过滤;以γ为粒度划分特征过滤后的序列数据集为若干块,并基于极大等位公共子序列MACS得到特征候选区域;对候选区域对应的数据集基于MapReduce进行特征区域的多样性选择,得到代表性特征区域;对代表性特征区域采用置换搜索的并行蚁群算法进行交互特征选择,得到显著性特征子集集合,即显著SNP位点集合。本发明为解决在大规模序列数据中进行交互特征选择提出一个全新的框架,使得特征选择更加高效、功能更为强大。

著录项

  • 公开/公告号CN108897990B

    专利类型发明专利

  • 公开/公告日2021-10-29

    原文格式PDF

  • 申请/专利权人 东北大学;

    申请/专利号CN201810575946.9

  • 申请日2018-06-06

  • 分类号G16B20/20(20190101);G16B40/00(20190101);G06N3/00(20060101);G06K9/46(20060101);

  • 代理机构21109 沈阳东大知识产权代理有限公司;

  • 代理人胡晓男

  • 地址 110819 辽宁省沈阳市和平区文化路3号巷11号

  • 入库时间 2022-08-23 12:42:27

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号