首页> 中文会议>第十一届中国人工智能学术年会 >基于阶乘矩及时间序列方法识别人类基因编码区

基于阶乘矩及时间序列方法识别人类基因编码区

摘要

本文以人类基因编码区中50bp以下(短)、100bp左右(平均)及300bp以上(长)三种长度外显子为对象,运用阶乘矩和时间序列方法将生物位点特征、统计特征相结合,在较高精度上识别外显子特别是较长和较短的外显子.通过使外显子与内含子差异最大的k-tuple作为阶乘矩特征向量,分别采用50bp、100bp和200bp三种窗口计算相应长度外显子序列的阶乘矩,突显外显子和内含子统计特性差别.再采用时间序列Time-Delayembedding方法将得到的数据展开成二维空间,进一步突出统计特性差异,并在第三维空间加入生物位点特征.最后用贪婪算法进行聚类,得到短外显子Sn为0.70,平均长度外显子Sn为0.92,长外显子Sn为0.78.本项目研究结果在保证一般长度外显子识别精度的同时解决目前对较长及较短外显子识别精度普遍低下的问题,有较高的精度和较强的学习能力.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号