...
首页> 外文期刊>統計数理 >異種ゲノムデータの統合による遺伝子ネットワーク推定手法
【24h】

異種ゲノムデータの統合による遺伝子ネットワーク推定手法

机译:整合异构基因组数据的基因网络估计方法

获取原文
获取原文并翻译 | 示例
           

摘要

細胞内で生成されるタンパクは生物の主要な構成要素であり,遺伝子はその設計図に相当する.遺伝子がタンパクに変換される時期・量の制御も遺伝子の働きによるものであり,生物は遺伝子同士が協調して作用することによって生命を維持している.このような遺伝子間の依存関係を,頂点と枝から構成されるグラフを用いて表現したものを遺伝子ネットワークという.近年のマイクロアレイ技術の発展により,細胞内の遺伝子の活動状態を網羅的に観測できるようになり,遺伝子発現データとして蓄積されている.遺伝子発現データに基づく遺伝子ネットワークの推定問題は,バイオインフォマティクスにおいて最も重要な課題の1つと考えられる.遺伝子ネットワークの推定問題は,遺伝子の発現量を確率変数として見なすことにより,グラフィカルモデルの推定問題として定式化される.しかし,ネットワークに含まれる遺伝子は一般に数百以上と多く,そのためモデルに含まれるパラメータの数は膨大となる.したがって,発現データへの過適合を避けるためのモデリングの方法論を構築することが必要不可欠といえる.本稿ではこのような問題を解決するための方法として,著者らが開発した2つの異なるァプローチによる遺伝子ネットワーク推定手法について解説する.1つは同一の遺伝子から直接の制御を受ける遺伝子のDNA配列上流領域に共通の制御配列が存在することに着目し,共通配列探索と発現データを組み合わせた方法.他方は2種類の異なる生物種の遺伝子ネットワータを,両種に進化的に保存されている情報を互いに利用しながら同時に推定する手法である.両手法は,ベイジアンネットワークを遺伝子ネットワークのモデルとして用い,ネットワークをグラフ構造の事後確率最大化に基づいて推定する.その際,配列情報および進化情報をネットワークの事前確率を構成するために用いることが特徴となっている.開発した手法はシミュレーションおよび実データヘの適用を通してその有効性を確認した.
机译:细胞中产生的蛋白质是生物体的主要成分,基因与它们的蓝图相对应。基因转化为蛋白质的时间和数量的控制也归因于基因的功能,有机体通过相互合作来维持生命。基因网络使用由顶点和分支组成的图表达基因之间的这种依赖关系。随着微阵列技术的最新发展,有可能全面观察细胞中基因的活性状态,该状态作为基因表达数据而积累。基于基因表达数据的基因网络估计问题被认为是生物信息学中最重要的问题之一。通过将基因的表达水平视为随机变量,将基因网络的估计问题表述为图形模型估计问题。但是,网络中包含的基因数量通常很大,超过数百个,而模型中包含的参数数量也很大。因此,可以说必须构建一种建模方法,以避免过度拟合表达数据。在本文中,作为解决此问题的方法,我们解释了作者使用两种不同方法开发的基因网络估计方法。一种方法是结合共同序列搜索和表达数据的方法,着眼于以下事实:在由同一基因直接控制的基因的DNA序列的上游区域中存在共同的调节序列。另一种是使用两个物种中相互进化保守的信息同时估算两个不同物种的遗传网络的方法。两种方法都使用贝叶斯网络作为基因网络的模型,并基于图结构的后验最大化来估计网络。当时的特点是,序列信息和进化信息被用来构造网络的先验概率。通过仿真并应用于实际数据,证实了所开发方法的有效性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号