声明
摘要
缩略词表
1.1计算基因组学
1.1.1基因组学
1.1.2生物信息学与计算基因组学
1.2基因组调控元件
1.2.1顺式调控元件与反式调控元件
1.2.2转录因子及家族
1.2.3转录因子调控机制
1.3转录因子结合位点识别方法
1.3.1基于实验方法的TFBS识别
1.3.2基于计算方法的TFBS识别
1.4深度学习
1.4.1神经网络与深度学习的历史发展
1.4.2卷积神经网络
1.5本文研究内容与目的
2.1背景介绍
2.2数据及预处理
2.2.1基于TF蛋白质序列的相似性比对
2.2.2基于TF motifs的相似性比对
2.3结果与分析
2.4讨论
3基于深度卷积神经网络的拟南芥转录因子结合位点预测模型
3.1背景介绍
3.2材料与方法
3.2.1数据来源与预处理
3.2.2基于深度卷积神经网络的TFBS预测模型构建
3.2.3全基因扫描预测流程
3.2.4生成Motif及Motif富集分析
3.3结果与分析
3.3.1与gkmSVM和MEME-ChIP方法的比较
3.3.2 TFBS的全基因组扫描预测
3.3.3预测结果在TF家族间差异性富集
3.3.4特征分析
3.3.5数据来源对预测结果的影响
3.4讨论
4.1前言
4.2材料与方法
4.2.1数据来源与预处理
4.2.2随机森林模型预测功能非编码SNPs
4.3结果与分析
4.3.1 SNP对TFBS预测的差异性影响
4.3.2负样本选择对随机森林预测的影响
4.4讨论
5.1背景
5.2材料与方法
5.2.1数据来源
5.2.2基于TF蛋白质序列和TF motif相似性的跨物种预测
5.3结果与分析
5.3.1正负样本预测结果平衡性控制
5.3.2植物领域跨物种迁移学习
5.4讨论
6总结
6.1深度学习预测拟南芥TFBS
6.2基于深度学习模型预测结果的功能非编码SNP优选
6.3迁移学习在植物跨物种TFBS预测中的应用
参考文献
附录
致谢