声明
摘要
第一章 绪论
1.1 研究背景与研究意义
1.2 研究现状综述
1.2.1 真核生物基因组结构注解方法
1.2.2 基于定阶次马尔科夫模型的k-tuple频率计算方法
1.3 本文主要工作及创新点
第二章 真核生物基因组注解方法
2.1 基于物种相似性的真核生物基因组注解方法
2.1.1 动态规划算法在基因注解中的主要思想
2.1.2 基于动态规划的主要流程
2.2 主要分析流程的代码实现
2.3 实验数据描述
2.4 实验结果分析
2.4.1 实验1:GASS实验结果与RefSeq-rheMac3直接比较的结果分析
2.4.2 实验2:基于RNA-Seq数据集的结果分析
2.5 探索性发现
2.5.1 实验3:RefSeq-rheMac3基因组序列组装错误分析
2.6 本章小结
第三章 基于k-tuple特征原核生物基因组测序数据研究
3.1 k-tuple思路的主要原理及主要分析流程
3.1.1 k-tuple序列特征方法的核心思想
3.1.2 k-tuple方法的分析流程
3.2 VLMC,IMM,ICM三种模型描述
3.2.1 VLMC模型描述
3.2.2 IMM模型描述
3.2.3 ICM模型描述
3.3 实验数据描述
3.3.1 细菌基因组数据描述
3.3.2 海洋微生物(硅藻)转录组数据描述
3.3.3 海洋微生物宏转录组与宏基因组数据描述
3.3.4 全球海洋宏转录组样本数据描述
3.4 实验结果与分析
3.4.1 基于细菌基因组样本的聚类分析
3.4.2 基于海洋微生物宏转录组样本聚类分析
3.4.3 基于海洋微生物宏转录组与宏基因组样本聚类分析
3.4.4 基于全球海洋宏转录组样本聚类分析
3.5 本章小结
第四章 总结与展望
参考文献
在学期间发表以及完成的论文
致谢
厦门大学;