声明
摘要
第一章 绪论
1.1 引言
1.2 研究背景和意义
1.2.1 胚胎干细胞
1.2.2 组蛋白修饰与组蛋白密码
1.2.3 DNA甲基化
1.2.4 高通量测序技术
1.2.5 表观遗传学调控基因表达机制的生物信息学分析
1.3 论文内容与结构
第二章 研究方法
2.1 基因表达值和组蛋白修饰值的计算
2.1.1 基因表达值的计算
2.1.2 基因组五个功能区域上组蛋白修饰值的计算
2.1.3 基因组转录起始位点侧翼区域上组蛋白修饰值的计算
2.2 相关性的计算
2.2.1 Pearson相关系数
2.2.2 Spearman相关系数
2.2.3 偏相关系数
2.3 预测算法
2.3.1 支持向量机
2.3.2 评价方法
第三章 人类胚胎干细胞中组蛋白修饰分布与基因表达的关联分析
3.1 数据集
3.2 组蛋白修饰与基因表达之间Pearson相关系数的计算
3.3 组蛋白修饰与基因表达相互作用网络的构建
3.4 高、低表达基因的划分以及功能分析
3.5 组蛋白修饰在转录起始位点侧翼区域的相关分析
3.5.1 组蛋白修饰在转录起始位点侧翼区域的分布
3.5.2 转录起始位点侧翼区域组蛋白修饰与基因表达相关系数的分布
3.5.3 高、低表达两类基因的组蛋白修饰簇
3.6 组蛋白修饰在五个功能区域内的相关分析
3.6.1 组蛋白修饰在高表达基因中主要定位于基因的启动子,低表达基因中则定位于外显子
3.6.2 组蛋白修饰值在外显子区域较其他区域有更小的变化范围
3.7 关键转录因子基因上组蛋白修饰分布的类型特异性和区域偏好性
3.8 小结
第四章 人类胚胎干细胞启动子CpG含量与组蛋白修饰的相关性
4.1 数据来源及预处理
4.2 特征和量化
4.2.1 划分HCG启动子和LCG启动子
4.2.2 提取启动子区组蛋白修饰谱
4.2.3 组蛋白修饰Heatmap图
4.3 HCG启动子和LCG启动子
4.4 HCG和LCG启动子区域内组蛋白修饰分布
4.5 HCG和LCG启动子区域内组蛋白修饰的相互作用
4.6 关键转录因子基因启动子的分类及组蛋白修饰分布
4.7 结论
第五章 结合表观修饰信息和序列信息的基因表达分类预测
5.1 数据集
5.2 特征提取
5.2.1 转录起始位点侧翼区域组蛋白修饰、DNA甲基化、染色体可及性信号提取
5.2.2 转录因子结合分数
5.2.3 DNA序列信息
5.3 方法
5.4 单特征的评价能力
5.5 组蛋白修饰以及DNA甲基化组合模型的评价指标
5.6 多特征融合模型的评价指标
5.7 小结
第六章 总结和展望
6.1 本文工作总结
6.2 工作展望
参考文献
附录
致谢
攻读学位期间发表和完成的学术论文’