首页> 中文会议>2004年全国卫生统计学术会议 >数据挖掘技术在生物信息学基因变异规律研究中的应用

数据挖掘技术在生物信息学基因变异规律研究中的应用

摘要

目的:聚类分析中适宜类别数的确定和结果的验证一直是难以解决的问题,而在生物信息学的抗原变异规律研究中这一问题尤为突出,本文试图将数据挖掘技术引入这一领域,以期能有所帮助。rn 方法:以甲型流感病毒的H3序列为例,按照数据挖掘的思想将其拆分为训练集和验证集,然后使用两阶段聚类法和自组织图进行聚类分析,利用验证集对聚类结果进行验证,并进行各类的特征描述。rn 结果:两阶段聚类法可自动搜索适宜的类别数,两种聚类方法结果相互验证,以及验证集的结果验证都证实了聚类结果的准确性。rn 结论:数据挖掘方法体系中的智能聚类技术可以满足基因序列数据聚类问题的需求,其相关技术可较好的解决类别数判定、结果验证等问题,值得在该领域中推广。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号