文摘
英文文摘
声明
第一章绪论
1.1研究的背景
1.2国内外发展情况
1.3 DNA序列编码区的研究
1.3.1新基因的发现与鉴定
1.3.2非编码区信息结构分析
1.3.3非编码区功能预测
1.4本文研究的主要内容
1.5本文的结构安排
第二章生物信息学
2.1生物信息学的诞生及其重要性
2.2生物信息学的定义
2.3生物信息学研究内容
2.3.1生物信息的收集、存储、管理与提供
2.3.2基因组序列信息的提取和分析
2.3.3生物大分子结构模拟和药物设计
2.4生物信息学的主要研究方法
第三章 基于CpG含量分类技术预测基因区域
3.1研究CpG岛的意义
3.2 CpG含量预测步骤
3.3 CpG岛的预测方法
3.3.1 Markov模型法
3.3.2 CG频率法
3.4材料
3.4.1值搜寻CpG岛
3.4.2滑动方法二次搜寻CpG岛
3.4.3三次搜寻CpG岛
第四章 基于CpG岛和信息熵技术预测DNA序列编码区
4.1 Shannon熵
4.2互熵利离数量
4.2.1互熵的定义
4.2.2 Jensen—Shannon离散量
4.2.3β-KL离散量
4.3 DNA序列的新向量构建方法(R14)
4.3.1终止密码子的统计
4.3.2 DNA序列的R8与R14表示
4.4应用实例与数据验证
4.4.1材料和方法
4.4.2 进一步讨论
4.5试验结果验证
第五章 总结
5.1论文的创新点
5.2展望
5.3建议
致 谢
参考文献
附录:作者在攻读硕士学位期间发表的论文