首页> 中国专利> 相互作用预测装置、相互作用预测方法和程序

相互作用预测装置、相互作用预测方法和程序

摘要

本发明取得化合物结构信息,取得与化合物相互作用的候选蛋白质的候选蛋白质结构信息,使用对接模拟方法来计算候选蛋白质与化合物的结合强度,进行结合强度的综合评价,由此确定出作为预测的结合强度的预测结合强度,确定出作为被预测为与化合物相互作用的候选蛋白质的预测蛋白质,使用结合强度模拟方法来计算相互作用强度,进行相互作用强度的综合评价,由此,确定出作为预测的相互作用强度的预测相互作用强度。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2016-04-27

    授权

    授权

  • 2015-03-11

    实质审查的生效 IPC(主分类):C12M1/34 申请日:20130613

    实质审查的生效

  • 2015-02-11

    公开

    公开

说明书

技术领域

本发明涉及相互作用预测装置、相互作用预测方法和程序。

背景技术

以往,公开了进行生物体分子的结合预测的技术。

在非专利文献1和2所述的配体对接系统中,公开有将灵活的对接算法应用于药 品设计的技术,在该对接算法中,通过在受体部位内使各个配体导致的全部刚体片段 (fragment)对接,由此伴随有刚体片段的原子位置的精细的采样和能够旋转的结合 的二面角的连续的微调。

现有技术文献

非专利文献

非专利文献1:Zsoldos Z,Reid D,Simon A,Sadjad BS,Johnson AP.eHiTS: an innovative approach to the docking and scoring function problems.Curr Protein Pept  Sci.2006 Oct;7(5):421-35.

非专利文献2:Zsoldos Z,Reid D,Simon A,Sadjad SB,Johnson AP.eHiTS: a new fast,exhaustive flexible ligand docking system.J Mol Graph Model.2007 Jul;26 (1):198-212.Epub 2006 Jun 17.

发明内容

发明要解决的问题

但是,在非专利文献1和2所述的现有的配体对接系统中,具有如下问题:虽然 确定新药开发的候选化合物主要发生相互作用的目标分子,但大多数情况下,仅识别 出候选化合物发生相互作用的多个生物体内分子中的一个或极少数为目标分子。因 此,在现有的配体对接系统中,具有如下问题:在候选化合物仅与在某种意义而言随 意地确定出的目标分子发生相互作用的前提下,进行药物开发处理,药物开发企业等 的研究者等用户设想的候选化合物的效果与实际的效果存在偏差。即,通常,候选化 合物不是仅与单个生物体内分子发生相互作用,而是以各种强度与多个生物体内分子 相互作用,这些综合的效果成为实际的候选化合物的效果。

本发明是鉴于上述点问题而完成的,目的在于提供一种相互作用预测装置、相互 作用预测方法和程序,它们能够预测化合物等化学物质与生物体内的哪个蛋白质发生 相互作用,并预测这些相互作用对生物体带来怎样的影响。

用于解决问题的手段

为了达成这样的目的,本发明的相互作用预测装置至少具有存储部和控制部,其 特征在于,所述存储部具有:化合物结构信息存储单元,其存储与化合物的结构相关 的化合物结构信息;以及蛋白质结构信息存储单元,其存储与蛋白质的结构相关的蛋 白质结构信息,所述控制部具有:化合物结构信息取得单元,其从所述化合物结构信 息存储单元取得所述化合物的所述化合物结构信息,或者,使用结构预测方法进行预 测来取得所述化合物结构信息存储单元中未存储的所述化合物结构信息;蛋白质结构 信息取得单元,其从所述蛋白质结构信息存储单元取得作为候选蛋白质的所述蛋白质 结构信息的候选蛋白质结构信息,或者,使用所述结构预测方法进行预测来取得所述 蛋白质结构信息存储单元中未存储的所述候选蛋白质结构信息,其中,所述候选蛋白 质是作为与所述化合物相互作用的候选的所述蛋白质;预测蛋白质确定单元,其根据 由所述化合物结构信息取得单元取得的所述化合物结构信息和由所述蛋白质结构信 息取得单元取得的所述候选蛋白质结构信息,使用对接模拟方法来计算所述候选蛋白 质与所述化合物的结合强度,使用学习方法和/或荟萃(Meta)估计方法来进行该结 合强度的综合评价,由此,确定出作为最终被预测出的所述结合强度的预测结合强度, 确定出作为被预测为与所述化合物相互作用的所述候选蛋白质的预测蛋白质;以及相 互作用强度确定单元,其根据由所述化合物结构信息取得单元取得的所述化合物结构 信息和由所述预测蛋白质确定单元确定出的所述预测蛋白质的所述蛋白质结构信息, 使用结合强度模拟方法来计算相互作用强度,使用所述学习方法和/或所述荟萃估计 方法来进行该相互作用强度的所述综合评价,由此,确定出作为最终被预测出的所述 相互作用强度的预测相互作用强度。

此外,本发明的相互作用预测装置的特征在于,在上述记载的相互作用预测装置 中,所述蛋白质结构信息存储单元将和该蛋白质的结构相关的所述蛋白质结构信息与 和如下的网络信息对应起来进行存储,其中,所述网络信息与细胞内或生物体内的网 络相关,包含与所述蛋白质在该网络上的位置相关的位置信息,所述控制部还具有影 响预测单元,该影响预测单元根据由所述相互作用强度确定单元确定出的所述预测相 互作用强度和所述蛋白质结构信息存储单元中存储的所述网络信息,预测所述化合物 对所述预测蛋白质的影响。

此外,本发明的相互作用预测装置的特征在于,在上述记载的相互作用预测装置 中,所述存储部还具有分子间相互作用信息存储单元,该分子间相互作用信息存储单 元存储与细胞内或生物体内的分子间相互作用相关的分子间相互作用信息,所述预测 蛋白质确定单元和/或所述相互作用强度确定单元还使用所述分子间相互作用信息存 储单元中存储的所述分子间相互作用信息来进行所述综合评价。

此外,本发明的相互作用预测装置的特征在于,在上述记载的相互作用预测装置 中,所述存储部还具有蛋白质结构相似性信息存储单元,该蛋白质结构相似性信息存 储单元存储与蛋白质的结构的相似性相关的蛋白质结构相似性信息,所述预测蛋白质 确定单元和/或所述相互作用强度确定单元还使用所述蛋白质结构相似性信息存储单 元中存储的所述蛋白质结构相似性信息来进行所述综合评价。

此外,本发明的相互作用预测装置的特征在于,在上述记载的相互作用预测装置 中,所述蛋白质结构信息取得单元使用所述结构预测方法来预测多个所述蛋白质结构 信息,使用所述学习方法和/或所述荟萃估计方法来进行该蛋白质结构信息的所述综 合评价,由此进行预测来取得所述候选蛋白质结构信息。

此外,本发明的相互作用预测装置的特征在于,在上述记载的相互作用预测装置 中,所述存储部还具有基因信息存储单元,该基因信息存储单元存储与个体的基因相 关的基因信息,所述蛋白质结构信息取得单元根据所述基因信息存储单元中存储的所 述基因信息,使用所述结构预测方法进行预测来取得所述候选蛋白质结构信息。

此外,本发明的相互作用预测方法,在至少具有存储部和控制部的相互作用预测 装置中执行该相互作用预测方法,其特征在于,所述存储部具有:化合物结构信息存 储单元,其存储与化合物的结构相关的化合物结构信息;以及蛋白质结构信息存储单 元,其存储与蛋白质的结构相关的蛋白质结构信息,该方法包括在所述控制部中执行 的如下步骤:化合物结构信息取得步骤,从所述化合物结构信息存储单元取得所述化 合物的所述化合物结构信息,或者,使用结构预测方法进行预测来取得所述化合物结 构信息存储单元中未存储的所述化合物结构信息;蛋白质结构信息取得步骤,从所述 蛋白质结构信息存储单元取得作为候选蛋白质的所述蛋白质结构信息的候选蛋白质 结构信息,或者,使用所述结构预测方法、以预测方式取得所述蛋白质结构信息存储 单元中未存储的所述候选蛋白质结构信息,其中,所述候选蛋白质是作为与所述化合 物相互作用的候选的所述蛋白质;预测蛋白质确定步骤,根据在所述化合物结构信息 取得步骤中取得的所述化合物结构信息和在所述蛋白质结构信息取得步骤中取得的 所述候选蛋白质结构信息,使用对接模拟方法来计算所述候选蛋白质与所述化合物的 结合强度,使用学习方法和/或荟萃估计方法来进行该结合强度的综合评价,由此, 确定出作为最终被预测出的所述结合强度的预测结合强度,确定出作为被预测为与所 述化合物相互作用的所述候选蛋白质的预测蛋白质;相互作用强度确定步骤,根据在 所述化合物结构信息取得步骤中取得的所述化合物结构信息和在所述预测蛋白质确 定步骤中确定出的所述预测蛋白质的所述蛋白质结构信息,使用结合强度模拟方法来 计算相互作用强度,使用所述学习方法和/或所述荟萃估计方法来进行该相互作用强 度的所述综合评价,由此,确定出作为最终被预测出的所述相互作用强度的预测相互 作用强度。

此外,本发明的程序是在至少具有存储部和控制部的相互作用预测装置中执行的 程序,其特征在于,所述存储部具有:化合物结构信息存储单元,其存储与化合物的 结构相关的化合物结构信息;以及蛋白质结构信息存储单元,其存储与蛋白质的结构 相关的蛋白质结构信息,式所述控制部执行如下步骤:化合物结构信息取得步骤,从 所述化合物结构信息存储单元取得所述化合物的所述化合物结构信息,或者,使用结 构预测方法进行预测来取得所述化合物结构信息存储单元中未存储的所述化合物结 构信息;蛋白质结构信息取得步骤,其从所述蛋白质结构信息存储单元取得作为候选 蛋白质的所述蛋白质结构信息的候选蛋白质结构信息,或者,使用所述结构预测方法 进行预测来取得所述蛋白质结构信息存储单元中未存储的所述候选蛋白质结构信息, 其中,所述候选蛋白质是作为与所述化合物相互作用的候选的所述蛋白质;预测蛋白 质确定步骤,根据在所述化合物结构信息取得步骤中取得的所述化合物结构信息和在 所述蛋白质结构信息取得步骤中取得的所述候选蛋白质结构信息,使用对接模拟方法 来计算所述候选蛋白质与所述化合物的结合强度,使用学习方法和/或荟萃估计方法 来进行该结合强度的综合评价,由此,确定出作为最终被预测出的所述结合强度的预 测结合强度,确定出作为被预测为与所述化合物相互作用的所述候选蛋白质的预测蛋 白质;以及相互作用强度确定步骤,根据在所述化合物结构信息取得步骤中取得的所 述化合物结构信息和在所述预测蛋白质确定步骤中确定出的所述预测蛋白质的所述 蛋白质结构信息,使用结合强度模拟方法来计算相互作用强度,使用所述学习方法和 /或所述荟萃估计方法来进行该相互作用强度的所述综合评价,由此,确定出作为最 终被预测出的上述相互作用强度的预测相互作用强度。

发明效果

根据本发明,取得化合物的化合物结构信息,或者,使用结构预测方法进行预测 来取得未存储的化合物结构信息,取得作为候选蛋白质的蛋白质结构信息的候选蛋白 质结构信息,其中,所述候选蛋白质是作为与化合物发生相互作用的候选的蛋白质, 或者,使用结构预测方法进行预测来取得未存储的候选蛋白质结构信息,根据取得的 化合物结构信息和取得的候选蛋白质结构信息,使用对接模拟方法来计算候选蛋白质 与化合物的结合强度,使用学习方法和/或荟萃估计方法来进行该结合强度的综合评 价,由此,确定出作为最终被预测出的结合强度的预测结合强度,确定出作为被预测 为与化合物相互作用的候选蛋白质的预测蛋白质,根据取得的化合物结构信息和确定 出的预测蛋白质的蛋白质结构信息,使用结合强度模拟方法来计算相互作用强度,使 用学习方法和/或荟萃估计方法来进行该相互作用强度的综合评价,由此确定出作为 最终被预测出的相互作用强度的预测相互作用强度,因此,起到在新药的开发等中, 能够有效地确定作为候选的化合物在生物体内发生相互作用的蛋白质等生物体分子 这样的效果。

此外,根据本发明,根据确定出的预测相互作用强度和存储的网络信息来预测化 合物对预测蛋白质的影响,因此,起到能够使化合物的效果的预测和副作用的预测的 精度大幅提高这样的效果。

此外,根据本发明,还使用存储的分子间相互作用信息来进行综合评价,因此, 能够利用已知的数据作为指标,从而起到能够进行更准确的综合评价这样的效果。

此外,根据本发明,还使用存储的蛋白质结构相似性信息来进行综合评价,因此, 能够利用与候选蛋白质相似的已知的蛋白质的数据作为指标,从而起到能够进行更准 确的综合评价这样的效果。

此外,根据本发明,使用结构预测方法来预测多个蛋白质结构信息,使用学习方 法和/或荟萃估计方法来进行该蛋白质结构信息的综合评价,由此,以预测方式取得 候选蛋白质结构信息,因此,起到能够进一步排除目标分子的随意性这样的效果。

此外,根据本发明,根据存储的基因信息,使用结构预测方法来预测候选蛋白质 结构信息,因此,起到如下效果:基于个体的基因的排列的差异,预测出蛋白质的结 构的差异,从而能够估计出与候选化合物的影响相关的个体差异。

附图说明

图1是示出本实施方式的基本原理的流程图。

图2是示出本实施方式的相互作用预测装置的结构的一例的框图。

图3是示出本实施方式的相互作用预测装置的处理的一例的流程图。

图4是示出本实施方式的预测结合强度确定处理的一例的图。

图5是示出本实施方式的预测结合强度确定处理的一例的图。

图6是示出本实施方式的预测相互作用强度确定处理的一例的图。

图7是示出本实施方式的预测相互作用强度确定处理的一例的图。

图8是示出本实施方式的相互作用强度预测处理的一例的图。

图9是示出本实施方式的影响预测处理的一例的图。

图10是示出本实施方式中的对化合物与生物体分子的结合强度进行计算预测而 得到的结果的图。

图11是示出本实施方式中的对化合物与生物体分子的结合强度进行计算预测而 得到的结果的图。

图12是示出本实施方式中的对化合物与生物体分子的结合强度进行计算预测而 得到的结果的图。

图13是示出本实施方式中的针对作为MEK抑制剂而进行疗效检验的化合物的 分析结果的图。

图14-1是基于以图13所示的分析结果为基础的相互作用强度而以颜色区分生物 体内分子的相互作用网络的图。

图14-2是基于以图13所示的分析结果为基础的相互作用强度而以颜色区分生物 体内分子的相互作用网络的图。

图15是示出本实施方式的计算预测的一例的图。

具体实施方式

以下,根据附图,对本发明的相互作用预测装置、相互作用预测方法和程序的实 施方式进行详细说明。此外,本发明不受限于该实施方式。

[本发明的实施方式的概要]

以下,参照图1,对本发明的实施方式的概要进行说明,然后,对本实施方式的 结构和处理等进行详细说明。图1是示出本实施方式的基本原理的流程图。本实施方 式大致具有如下基本特征。

即,如图1所示,本实施方式的相互作用预测装置的控制部从存储部取得用户期 望的化合物的化合物结构信息,或者,使用结构预测方法进行预测来取得存储部中未 存储的化合物结构信息(步骤SA-1)。

进而,相互作用预测装置的控制部从存储部取得作为候选蛋白质的蛋白质结构信 息的候选蛋白质结构信息,或者,使用结构预测方法进行预测来取得存储部中未存储 的候选蛋白质结构信息,其中,所述候选蛋白质是作为与化合物相互作用的候选的蛋 白质(步骤SA-2)。此处,控制部可以使用结构预测方法来预测多个蛋白质结构信息, 使用学习方法和/或荟萃估计方法来进行该蛋白质结构信息的综合评价,由此进行预 测来取得候选蛋白质结构信息。此外,控制部可以根据与存储部中存储的用户个体的 基因相关的基因信息,使用结构预测方法、以预测方式取得候选蛋白质结构信息。

进而,相互作用预测装置的控制部根据在步骤SA-1中取得的化合物结构信息和 在步骤SA-2中取得的候选蛋白质结构信息,使用对接模拟方法来计算候选蛋白质与 化合物的结合强度,使用学习方法和/或荟萃估计方法来进行该结合强度的综合评价, 由此,确定出作为最终被预测出的结合强度的预测结合强度,确定出作为被预测为与 该化合物相互作用的候选蛋白质的预测蛋白质(步骤SA-3)。此处,控制部还可以使 用存储部中存储的分子间相互作用信息来进行综合评价。此外,控制部还可以使用存 储部中存储的蛋白质结构相似性信息来进行综合评价。

进而,相互作用预测装置的控制部根据在步骤SA-1中取得的化合物结构信息和 在步骤SA-3中确定的预测蛋白质的蛋白质结构信息,使用结合强度模拟方法来计算 相互作用强度,使用学习方法和/或荟萃估计方法来进行该相互作用强度的综合评价, 由此,确定出作为最终被预测出的相互作用强度的预测相互作用强度(步骤SA-4), 结束处理。此处,控制部还可以使用存储部中存储的分子间相互作用信息来进行综合 评价。此外,控制部还可以使用存储部中存储的蛋白质结构相似性信息来进行综合评 价。

以上,结束了本实施方式的概要说明。

[相互作用预测装置100的结构]

接下来,参照图2,对本实施方式的相互作用预测装置100的结构的详细情况进 行如下说明。图2是示出本实施方式的相互作用预测装置100的结构的一例的框图, 仅概念性地示出了在该结构中与本发明相关的部分。此处,在本实施方式的相互作用 预测装置100中,设将各结构全部设置在一个壳体内而单独进行处理的装置(独立型) 为相互作用预测装置100而进行了说明,但不限于该实施例,也可以将各结构设置在 分离的壳体内,并经由网络300等连接,构成作为一个概念的装置(例如,云计算等)。

在图2中,外部系统200可以经由网络300与相互作用预测装置100相互连接, 并具有提供与蛋白质结构信息、化合物结构信息、基因信息、分子间相互作用信息和 /或蛋白质结构相似性信息等相关的外部数据库以及/或者执行用户界面等的网站的功 能等。

此处,外部系统200可以构成为WEB(互联网)服务器或ASP(Active Server Page, 动态服务器页面)服务器等。此外,外部系统200的硬件结构可与由通常销售的工作 站、个人计算机等的信息处理装置及其附属装置构成。此外,外部系统200的各功能 可以由外部系统200的硬件结构中的CPU、磁盘装置、存储装置、输入装置、输出 装置、通信控制装置等和控制它们的程序等实现。

此外,网络300具有使相互作用预测装置100与外部系统200相互连接的功能, 例如为互联网等。

此外,相互作用预测装置100大致具有控制部102、通信控制接口部104、输入/ 输出控制接口部108和存储部106。此处,控制部102是总体地控制相互作用预测装 置100整体的CPU等。此外,通信控制接口部104是连接到与通信线路等连接的路 由器等的通信装置(未图示)的接口,输入/输出控制接口部108是连接到显示部112 和输入部114的接口。此外,存储部106是保存各种数据库或表等的装置。这些相互 作用预测装置100的各部经由任意的通信路径以可通信的方式进行连接。此外,该相 互作用预测装置100经由路由器等的通信装置和专用线等的有线或无线的通信线路, 以可通信的方式与网络300连接。

存储部106中保存的各种数据库或表(化合物结构信息数据库106a、蛋白质结 构信息数据库106b、基因信息数据库106c、分子间相互作用信息数据库106d和蛋白 质结构相似性信息数据库106e)是固定磁盘装置等的存储单元。例如,在存储部106 中保存了在各种处理中使用的各种程序、表、文件、数据库和网页等。

在这些存储部106的各构成要素中,化合物结构信息数据库106a是存储与化合 物的结构相关的化合物结构信息的化合物结构信息存储单元。这些化合物结构信息可 以被预先存储在化合物结构信息数据库106a中,相互作用预测装置100的控制部102 定期地和/或根据控制部102的处理,经由网络300从外部系统200等下载最新的数 据,对化合物结构信息数据库106a中存储的化合物结构信息进行更新。

此外,蛋白质结构信息数据库106b是存储与蛋白质的结构相关的蛋白质结构信 息的蛋白质结构信息存储单元。此处,蛋白质结构信息数据库106b可以将与该蛋白 质的结构相关的蛋白质结构信息与如下的网络信息对应起来进行存储,其中,所述网 络信息蛋白质在细胞内或生物体内的网络相关,包含与该网络(例如,包含分子间相 互作用网络、信号传递网络、代谢网络或基因控制网络等)上的位置相关的位置信息。 这些蛋白质结构信息可以被预先存储在蛋白质结构信息数据库106b中,相互作用预 测装置100的控制部102定期地和/或根据控制部102的处理(例如,在控制部102 中,需要数据的契机等),经由网络300从外部系统200等下载最新的数据,对蛋白 质结构信息数据库106b中存储的蛋白质结构信息进行更新。

此外,基因信息数据库106c是存储与用户个体的基因相关的基因信息的基因信 息存储单元。此处,基因信息可以包含碱基排列、基因型(遺伝子型)、遗传型 (genotype)、表现型(Phenotype)和/或基因注释(Annotation)等相关的信息。这 些基因信息可以被预先存储在基因信息数据库106c,相互作用预测装置100的控制 部102定期地和/或根据控制部102的处理,经由网络300从外部系统200等下载最 新的数据,对基因信息数据库106c中存储的基因信息进行更新。

此外,分子间相互作用信息数据库106d是存储与细胞内或生物体内的分子间相 互作用相关的分子间相互作用信息的分子间相互作用信息存储单元。这些分子间相互 作用信息可以被预先存储在分子间相互作用信息数据库106d中,相互作用预测装置 100的控制部102定期地和/或根据控制部102的处理,经由网络300从外部系统200 等下载最新的数据,对分子间相互作用信息数据库106d中存储的分子间相互作用信 息进行更新。

此外,蛋白质结构相似性信息数据库106e是存储与蛋白质的结构的相似性相关 的蛋白质结构相似性信息的蛋白质结构相似性信息存储单元。此处,蛋白质结构相似 性信息可以包含与蛋白质结构相似性网络(PSIN)相关的信息。这些蛋白质结构相 似性信息可以被预先存储在蛋白质结构相似性信息数据库106e,相互作用预测装置 100的控制部102定期地和/或根据控制部102的处理,经由网络300从外部系统200 等下载最新的数据,对蛋白质结构相似性信息数据库106e中存储的蛋白质结构相似 性信息进行更新。

此外,在图2中,通信控制接口部104进行相互作用预测装置100与网络300(或 路由器等的通信装置)之间的通信控制。即,通信控制接口部104具有经由通信线路 与外部系统200和其它终端等进行数据通信的功能。

此外,在图2中,输入/输出控制接口部108进行显示部112和输入部114的控 制。

此处,作为显示部112,可以是显示应用程序等的显示画面的显示单元(例如, 由液晶或有机EL等构成的显示器、监视器和触摸板等)。此外,输入部114例如可 以是键输入部、触摸板、控制面板(例如触摸板和游戏控制面板(game pad)等)、 鼠标、键盘和传声器等。

此外,在图2中,控制部102具有用于保存OS(Operating System:操作系统) 等的控制程序、规定了各种处理步骤等的程序以及所需数据的内部存储器。进而,控 制部102按照这些程序等,进行用于执行各种处理的信息处理。在功能概念上,控制 部102具有化合物结构信息取得部102a、蛋白质结构信息取得部102b、预测蛋白质 确定部102c、相互作用强度确定部102d和影响预测部102e。

其中,化合物结构信息取得部102a是化合物结构信息取得单元,其从化合物结 构信息数据库106a取得化合物的化合物结构信息,或者,使用结构预测方法进行预 测来取得化合物结构信息数据库106a中未存储的化合物结构信息。

此外,蛋白质结构信息取得部102b是如下的蛋白质结构信息取得单元,其从蛋 白质结构信息数据库106b取得作为候选蛋白质的蛋白质结构信息的候选蛋白质结构 信息,或者,使用结构预测方法进行预测来取得蛋白质结构信息数据库106b中未存 储的候选蛋白质结构信息,其中,所述候选蛋白质是作为与化合物相互作用的候选的 蛋白质。此处,蛋白质结构信息取得部102b可以使用结构预测方法来预测多个蛋白 质结构信息,使用学习方法和/或荟萃估计方法来进行该蛋白质结构信息的综合评价, 由此,以预测方式取得候选蛋白质结构信息。此外,蛋白质结构信息取得部102b可 以根据基因信息数据库106c中存储的基因信息,使用结构预测方法进行预测来取得 候选蛋白质结构信息。

此外,预测蛋白质确定部102c是如下的预测蛋白质确定单元,其根据由化合物 结构信息取得部102a取得的化合物结构信息和由蛋白质结构信息取得部102b取得的 候选蛋白质结构信息,使用对接模拟方法来计算候选蛋白质与化合物的结合强度,使 用学习方法和/或荟萃估计方法来进行该结合强度的综合评价,由此,确定出作为最 终被预测出的结合强度的预测结合强度,确定出作为被预测为与化合物相互作用的候 选蛋白质的预测蛋白质。此处,预测蛋白质确定部102c还可以使用分子间相互作用 信息数据库106d中存储的分子间相互作用信息来进行综合评价。此外,预测蛋白质 确定部102c还可以使用蛋白质结构相似性信息数据库106e中存储的蛋白质结构相似 性信息来进行综合评价。

此外,相互作用强度确定部102d是如下的相互作用强度确定单元,其由根据化 合物结构信息取得部102a取得的化合物结构信息和由预测蛋白质确定部102c确定出 的预测蛋白质的蛋白质结构信息,使用结合强度模拟方法来计算相互作用强度,使用 学习方法和/或荟萃估计方法来进行该相互作用强度的综合评价,由此,确定出作为 最终被预测出的相互作用强度的预测相互作用强度。此处,相互作用强度确定部102d 还可以使用分子间相互作用信息数据库106d中存储的分子间相互作用信息来进行综 合评价。此外,相互作用强度确定部102d还可以使用蛋白质结构相似性信息数据库 106e中存储的蛋白质结构相似性信息来进行综合评价。

此外,影响预测部102e是如下的影响预测单元,其根据由相互作用强度确定部 102d确定出的预测相互作用强度和蛋白质结构信息数据库106b中存储的网络信息, 来预测化合物对预测蛋白质的影响。此处,影响可以是效应(例如,活性效应或抑制 效应等)。例如,化合物对蛋白质的影响可以是化合物导致的蛋白质的活性化或非活 性化等。

以上,结束了本实施方式的相互作用预测装置100的结构的一例的说明。

[相互作用预测装置100的处理]

接下来,以下,参照图3~图9,对这样构成的本实施方式的相互作用预测装置 100的处理的详细情况进行详细说明。图3是示出本实施方式的相互作用预测装置100 的处理的一例的流程图。

如图3所示,在用户进行新药的开发等时,化合物结构信息取得部102a从化合 物结构信息数据库106a取得与作为新药的候选的化合物的候选化合物的结构相关的 化合物结构信息(分子结构信息),或者,使用结构预测方法进行预测来取得化合物 结构信息数据库106a中未存储的化合物结构信息(步骤SB-1)。此处,化合物结构 信息可以预先或在执行处理时由用户经由输入部114输入,并保存在化合物结构信息 数据库106a中。

此处,作为结构预测方法,可以利用根据在结构预测中广泛使用的、结构已知的 蛋白质来估计结构未知的蛋白质的结构的、基于模板的方法(Template Based Modeling)和/或根据氨基酸的排列来估计结构未知的蛋白质的结构的无模板的方法 (Template Free Modeling)等。此处,作为基于模板的方法,可以是同源建模或基于 折叠识别的方法等的各种方法。此外,作为结构预测方法,可以是如下片段装配法: 根据结构未知的蛋白质的氨基酸排列的一部分与结构已知的蛋白质的氨基酸排列之 间的相似性探索来预测结构未知的蛋白质的一部分结构,组合多个预测,来预测结构 未知的蛋白质的结构。此外,作为结构预测方法,也可以是如下方法:使蛋白质的结 构预测游戏化(ゲーム化),取得(例如,经由网络300取得等)在外部系统200中 预测(例如,由多个第三者(外部用户)在外部系统200中进行预测等)的结构未知 的蛋白质的结构。此外,作为结构预测方法,可以在能够做到且合理的范围内,并行 地同时利用这些方法,根据它们的估计结果进行综合评价,来预测结构未知的蛋白质 的结构。

进而,蛋白质结构信息取得部102b从蛋白质结构信息数据库106b取得作为候选 蛋白质的蛋白质结构信息的候选蛋白质结构信息,或者,使用结构预测方法进行预测 来取得蛋白质结构信息数据库106b中未存储的候选蛋白质结构信息,其中,所述候 选蛋白质是作为与候选化合物相互作用的候选的蛋白质(步骤SB-2)。此处,蛋白质 结构信息取得部102b可以使用结构预测方法来预测多个蛋白质结构信息,使用学习 方法和/或荟萃估计方法来进行该蛋白质结构信息的综合评价,由此,进行预测来取 得候选蛋白质结构信息。此外,蛋白质结构信息取得部102b可以根据基因信息数据 库106c中存储的与用户个体的基因相关的基因信息(个体基因组信息),使用结构预 测方法,由此,进行预测来取得候选蛋白质结构信息。由此,个体间的基因排列的差 异给蛋白质的结构带来影响,使得与候选化合物的相互作用发生变化,其结果是,能 够预测出将候选化合物的影响产生变化的可能性考虑在内的候选蛋白质结构信息。此 处,基因信息可以预先或在执行处理时由用户经由输入部114输入,并保存在基因信 息数据库106c中。

此处,蛋白质结构信息取得部102b可以确定出用户期望(例如,与用户希望知 晓的生物学效应相关等)一个或多个网络,从存在于该网络上的一部分或全部的蛋白 质中确定出候选蛋白质。例如,蛋白质结构信息取得部102b可以针对细胞内或生物 体内的网络(例如,分子间相互作用网络、信号传递网络、代谢网络或基因控制网络 等)上存在的各个蛋白质,确定出其结构,从蛋白质结构信息数据库106b等取得候 选蛋白质结构信息。此处,在预测哪个蛋白质与某化合物相互作用时,考虑使用多个 蛋白质的列表来确定出候选蛋白质的方法,但如上述那样,通过确定出网络,能够避 免对于与所关注的生物学影响无关的蛋白质分配大量计算时间,并能够避免必要的蛋 白质从列表中遗漏。此外,与网络相关的信息可以预先或在执行处理时由用户经由输 入部114输入,并保存在蛋白质结构信息数据库106b中。

此外,在蛋白质结构信息数据库106b中不存在蛋白质结构数据的情况下,蛋白 质结构信息取得部102b可以通过各种计算方法、即基于分子动力学(Molecular  Dynamics)等的结构预测的方法、或者利用蛋白质的相似性网络(Protein Similarity  Network)的方法来预测候选蛋白质结构信息。此外,蛋白质结构信息取得部102b 可以导入根据多个不同的方式的估计来进行最终的估计的荟萃估计系统。此处,荟萃 估计系统可以使用结构已知的蛋白质的一维排列及其结构以及各估计方法的估计结 果,通过神经网络或支持向量机等的学习方法来预测作为最优的估计的结构未知的蛋 白质结构。此外,在该学习方法中,重要的是准确地预测蛋白质结构,尤其重要的是, 能够更准确地预测和与化合物相互作用相关的部位的结构,在学习时,可以进行该事 项的加权。此外,在蛋白质结构信息取得部102b中,在能够利用用户个体的基因信 息时,可以根据该基因信息来分析对各蛋白质进行编码的区域,根据给该蛋白质的结 构等带来变化的已知的信息来进行确定,在不存在已知的信息的情况下,可以使用上 述各种计算方法等来估计其影响(例如,给该蛋白质的结构等带来的变化等),考虑 该影响而预测候选蛋白质结构信息。

此处,在本实施方式的综合评价中,可以使用本系统中置入的多个结构预测方法 (估计方法),对事先知道多个结构的蛋白质进行蛋白质的结构的估计。进而,在该 综合评价中,可以使用神经网络或支持向量机等的学习方法来学习哪个估计方法对具 有怎样特征的蛋白质的结构的估计精度较高、或者针对怎样的蛋白质的部分结构的估 计精度高等信息。进而,在该综合评价中,在估计结构未知的蛋白质的结构时,可以 利用这些学习结果,对使用多个结构预测方法取得的多个估计结果进行确信度的加 权,由此进行预测来取得候选蛋白质结构信息。即,在本实施方式的综合评价中,能 够估计出各结构预测方法、怎样的事例、哪个方法的精度较高,或者,利用针对怎样 的部分精度较高等特征。此外,在本实施方式的综合评价中,在仅利用多数确定等的 情况下,会产生根据所使用的估计方法的选择方法而使结果受到影响的问题,因此, 对使用多个结构预测方法取得的多个估计结果应用规定的学习方法,来避免这样的偏 差。

进而,预测蛋白质确定部102c根据由化合物结构信息取得部102a取得的化合物 结构信息和由蛋白质结构信息取得部102b取得的候选蛋白质结构信息,使用对接模 拟方法来计算候选蛋白质与候选化合物的结合强度,使用学习方法和/或荟萃估计方 法来进行该结合强度的综合评价,由此,确定出作为最终被预测出的结合强度的预测 结合强度,并以用户能够经由输入部114进行选择的方式,使显示部112显示与候选 蛋白质和预测结合强度相关的结果信息(步骤SB-3)。此处,预测蛋白质确定部102c 还可以使用分子间相互作用信息数据库106d中存储的分子间相互作用信息来进行综 合评价。此处,分子间相互作用信息可以预先或在执行处理时由用户经由输入部114 输入,并保存在分子间相互作用信息数据库106d中。此外,预测蛋白质确定部102c 还可以使用蛋白质结构相似性信息数据库106e中存储的蛋白质结构相似性信息来进 行综合评价。此处,蛋白质结构相似性信息可以预先或在执行处理时由用户经由输入 部114输入,并保存在蛋白质结构相似性信息数据库106e中。

即,预测蛋白质确定部102c可以针对各个候选蛋白质,进行与一系列的候选化 合物的对接模拟,计算其结合强度。此处,关于对接模拟,可以利用多个对接模拟软 件,综合评价各个结果,而不是单独评价综合评价,由此确定出最终的预测结合强度。 此外,在预测蛋白质确定部102c中,由于在各个对接模拟软件中采用的方法论的差 异使得预测精度存在偏差,因此,可以评价各个软件的输出倾向(偏向),利用最优 的预测结果的组合。此时,预测蛋白质确定部102c可以利用神经网络或支持向量机 等各种学习方法。即,预测蛋白质确定部102c可以利用如下学习方式:准备多个以 实验方式而已知为正确值的组合,实施基于各个方式的模拟,对其结果与实际的实验 值进行核对。此时,预测蛋白质确定部102c可以将与化合物和蛋白质的结构相关的 信息和各模拟软件的估计结果等作为输入,并利用以实验方式实际求出的数值作为教 师数据(教师信号)。

此外,预测蛋白质确定部102c可以在荟萃估计系统中使用经过这些学习获得的 结果,进行针对不存在实测值的化合物和蛋白质的结合的估计。此外,关于该学习, 在预测蛋白质与化合物的信息或蛋白质彼此之间的相互作用的情况下,基于与其相关 的多个蛋白质的信息进行分组,基于各个组进行学习,由此,能够提高利用该结果的 荟萃推论系统带来的预测精度。此外,在存在结构相似且与候选化合物的相互作用为 已知的生物体内分子(蛋白质)的情况下,预测蛋白质确定部102c还可以使用该信 息来进行估计。在具有结构相似性的生物体内分子的探索中,有时也利用蛋白质相似 性网络(PSIN)等。此外,预测蛋白质确定部102c可以在显示部112中显示各个预 测模块的结果和荟萃估计系统的全部结果,由用户(利用者)选择利用哪个结果。

此处,参照图4和图5,对本实施方式的预测结合强度确定处理的一例进行说明。 图4和图5是示出本实施方式的预测结合强度确定处理的一例的图。

如图4所示,预测蛋白质确定部102c根据化合物结构信息和蛋白质结构信息(候 选蛋白质结构信息),使用基于对接模拟1、对接模拟2和对接模拟3的对接模拟方 法来计算候选蛋白质与候选化合物的结合强度的估计结果1、估计结果2和估计结果 3,使用基于以结合强度的实测值为教师数据的学习系统的学习方法,进行该估计结 果1、该估计结果2和该估计结果3的综合评价,由此确定出作为最终被预测出的结 合强度的预测值(预测结合强度)。

此外,如图5所示,预测蛋白质确定部102c根据化合物结构信息和蛋白质结构 信息(候选蛋白质结构信息),使用基于对接模拟1、对接模拟2和对接模拟3的对 接模拟方法来计算候选蛋白质与候选化合物的结合强度的估计结果1、估计结果2和 估计结果3,使用基于荟萃估计系统的荟萃估计方法来进行该估计结果1、该估计结 果2和该估计结果3的综合评价,由此,确定出作为最终被预测出的结合强度的预测 值(预测结合强度)。

返回到图3,在由用户经由输入部114选择了结果信息的情况下,预测蛋白质确 定部102c根据由用户选择的结果信息,确定出被预测为与候选化合物相互作用的候 选蛋白质来作为预测蛋白质(步骤SB-4)。

进而,相互作用强度确定部102d根据由化合物结构信息取得部102a取得的化合 物结构信息和由预测蛋白质确定部102c确定出的预测蛋白质的蛋白质结构信息,使 用结合强度模拟方法来计算相互作用强度,使用学习方法和/或荟萃估计方法来进行 该相互作用强度的综合评价,由此,确定出作为最终被预测出的相互作用强度的预测 相互作用强度(步骤SB-5)。此处,相互作用强度确定部102d还可以使用分子间相 互作用信息数据库106d中存储的分子间相互作用信息来进行综合评价。此外,相互 作用强度确定部102d还可以使用蛋白质结构相似性信息数据库106e中存储的蛋白质 结构相似性信息来进行综合评价。即,相互作用强度确定部102d可以针对被预测为 进行相互作用的各个化合物与蛋白质的组合进行相互作用强度预测。此外,相互作用 强度确定部102d可以利用基于多个估计方式的结果和实测值的学习方式。

此处,作为本实施方式的结合强度模拟方法(结合强度的估计方法),可以是使 用评分函数的估计方法。此处,作为评分函数(例如X-CSCORE等),可以是以化合 物与蛋白质之间的van der Waals相互作用、氢结合、结构的变形的效应和/或疎水性 效应等为变量的方程式,作为其结果而估计出结合强度。此处,这样的评分函数存在 多个,在各评分函数中,在怎样的组合的情况下能够以高精度进行估计是不同的。因 此,在本实施方式的结合强度模拟方法中,在只是利用多数确定等的方法中,存在根 据所利用的评分函数的选择方法而使结果受到影响的问题,因此,可以对利用多个评 分函数估计出的结合强度利用规定的学习方法,避免这样的偏差。

此处,参照图6和图7,对本实施方式的预测相互作用强度确定处理的一例进行 说明。图6和图7是示出本实施方式的预测相互作用强度确定处理的一例的图。

如图6所示,相互作用强度确定部102d根据化合物结构信息和蛋白质结构信息, 使用基于结合强度模拟1、结合强度模拟2和结合强度模拟3的结合强度模拟方法计 算出相互作用强度的估计结果1、估计结果2和估计结果3,使用基于以相互作用强 度的实测值为教师数据的学习系统的学习方法,进行该估计结果1、该估计结果2和 该估计结果3的综合评价,由此,确定出作为最终被预测出的相互作用强度的估计值 (预测相互作用强度)。

此外,如图7所示,相互作用强度确定部102d根据化合物结构信息和蛋白质结 构信息,使用基于结合强度模拟1、结合强度模拟2和结合强度模拟3的结合强度模 拟方法计算出相互作用强度的估计结果1、估计结果2和估计结果3,使用基于荟萃 估计系统的荟萃估计方法来进行该估计结果1、该估计结果2和该估计结果3的综合 评价,由此,确定出作为最终被预测出的相互作用强度的估计值(预测相互作用强度)。

此外,参照图8,对本实施方式的相互作用强度预测处理的一例进行说明。图8 是示出本实施方式的相互作用强度预测处理的一例的图。

如图8所示,在由用户经由输入部114输入了作为新药的候选的化合物的候选化 合物的候选化合物列表的情况下,化合物结构提示模块(化合物结构信息取得部102a) 从化合物数据库(化合物结构信息数据库106a)取得与候选化合物的结构相关的化 合物分子结构信息(化合物结构信息),或者使用化合物结构估计方法(结构预测方 法)进行预测来取得化合物数据库中未存储的化合物分子结构信息,并保存在化合物 分子结构存储装置(例如,RAM等的存储器装置等)中。

进而,生物体分子结构提示模块(蛋白质结构信息取得部102b)取得属于与用 户希望知晓的生物学效应相关的生物体分子相互作用网络的生物体分子列表,从分子 结构数据库(蛋白质结构信息数据库106b)取得作为候选蛋白质的蛋白质结构信息 的生物体分子结构信息(候选蛋白质结构信息),其中所述候选蛋白质是作为与候选 化合物相互作用的候选的包含在该生物体分子列表中的蛋白质,或者,在能够利用该 用户个体的个体基因信息时,根据个体基因信息取得基因型列表,考虑该基因型列表 中包含的基因的结构对蛋白质的结构等带来变化的影响等,使用分子结构估计计算方 法(结构预测方法)进行预测来取得蛋白质结构信息数据库106b中未存储的生物体 分子结构信息,并保存在生物体分子结构存储装置(例如,RAM等的存储器装置等) 中。

进而,相互作用强度预测模块(预测蛋白质确定部102c)根据化合物分子结构 存储装置中存储的化合物分子结构信息和生物体分子结构存储装置中存储的生物体 分子结构信息,使用对接模拟方法来计算候选蛋白质与化合物的结合强度,使用学习 方法和荟萃估计方法来进行该结合强度的综合评价,由此,确定出作为最终被预测出 的结合强度的预测结合强度,确定出作为被预测为与化合物相互作用的候选蛋白质的 预测蛋白质。

进而,相互作用强度预测模块(相互作用强度确定部102d)根据化合物分子结 构存储装置中存储的化合物分子结构信息和由相互作用强度预测模块确定出的预测 蛋白质的蛋白质结构信息,使用结合强度模拟方法来计算相互作用强度,使用荟萃估 计方法、基于蛋白质结构相似性信息数据库106e中存储的蛋白质结构相似性信息的 相似结构的估计以及以相互作用数据库(分子间相互作用信息数据库106d)中存储 的分子间相互作用信息为教师数据的学习方法来进行该相互作用强度的综合评价,由 此最终预测出相互作用强度(预测相互作用强度)。

返回到图3,影响预测部102e根据由相互作用强度确定部102d确定出的预测相 互作用强度和蛋白质结构信息数据库106b中存储的网络信息,预测候选化合物对预 测蛋白质的活性效应或抑制效应(步骤SB-6),结束处理。

此处,参照图9,对本实施方式的影响预测处理的一例进行说明。图9是示出本 实施方式的影响预测处理的一例的图。

如图9所示,活性化/非活性化预测模块(影响预测部102e)根据与由相互作用 强度确定部102d确定出的预测相互作用强度和蛋白质结构信息数据库106b中存储的 与该网络相关的如下的网络信息,使用对接模拟方法、基于蛋白质结构相似性信息数 据库106e中存储的蛋白质结构相似性信息的相似结构的估计以及以相互作用DB(分 子间相互作用信息数据库106d)中存储的分子间相互作用信息为教师数据的学习方 法来进行候选化合物对预测蛋白质的活性化或非活性化的预测,其中,所述网络信息 与生物体内的网络相关,包含与生物体分子(蛋白质)在该网络上的位置相关的位置 信息。此处,活性化/非活性化预测模块可以在网络模型上传输定性地变化的方向, 由此,可以提示出哪个蛋白质是否相对于参照基准而相对地朝活性方向或抑制方向变 化,并通过定量的分析而改变其结果。

即,活性化/非活性化预测模块根据候选化合物的相互作用部分,如果为抑制性, 则将记述的标记设为(-),如果为活性化性,则将记述的标记设为(+),并使其在网 络模型上传输。例如,在活性化/非活性化预测模块中,在抑制效应维持其传输目的 地的抑制性而进行传输的情况下,维持(-),在网络模型上,在各个蛋白质中附加(-) 的标记,在抑制性的传输变化为活性化性的情况下,将符号替换为(+),然后在各个 蛋白质中赋予(+)的符号。进而,活性化/非活性化预测模块在进行了该传输之后, 可以调查在表现出各个蛋白质的网络模型上的节点处标有怎样的符号,如果仅标有 (-),则预测为该蛋白质受到抑制,如果仅标有(+),则预测为被活性化。此处,如 图9所示,活性化/非活性化预测模块还可以向用户提示生物体分子相互作用网络信 息(例如,生物体分子相互作用网络图等),该生物体分子相互作用网络信息可视地 表现出生物体分子与化合物的相互作用强度。此外,如图9所示,活性化/非活性化 预测模块还可以向用户提示生物体分子相互作用网络信息,该生物体分子相互作用网 络信息可视地表现出生物体分子与化合物的相互作用强度和活性化/非活性化(例如, 生物体分子相互作用网络图等)(例如,在显示部112中显示)。

而且,在共存有预测蛋白质的活性化和非活性化的预测的情况下,模型参数估计 模块(影响预测部102e)需要进行该蛋白质是活性化还是非活性化的定量的分析, 因此,使用反映出所预测的候选化合物对预测蛋白质的效应(活性化或非活性化)的 计算模型组,进行生物体内的网络的动态分析,利用使用了另外的模块和/或已知的 实验数据的模拟和分析方法,取得候选化合物对生物体带来怎样的影响的预测,来作 为候选化合物影响评价结果。此处,模型参数估计模块对以作为这些计算的标准的蛋 白质为前提的模型、以编入有基于个体的基因信息的基因型导致的变化的蛋白质为前 提的模型和反映出多个个体的基因信息导致的蛋白质的差异的模型进行比较,由此, 取得个体之间关于候选化合物对预测蛋白质的效应的差异的预测,来作为个体基因组 影响评价结果。此外,本实施方式的方法通过定义作为对象的网络和其中包含的蛋白 质,还能够应用于候选化合物的毒性的预测。此外,在本实施方式的方法中,将候选 化合物的计算对象扩大到与当初设想的疾病相关的网络以外的网络,由此,能够应用 于确认该候选化合物对当初设想以外的疾病的效果。

此外,本方法也可以应用于蛋白质与蛋白质的相互作用的预测。此外,本方法也 可以应用于如下情况:出于从病变的恢复、提高生产性或提高压力耐性等目的,对植 物利用化学物质。

以上,结束了本实施方式的相互作用预测装置100的处理的一例的说明。

实施例

以下,参照图10~图15,对如下实施例进行说明:对一系列的候选化合物应用 本实施方式的相互作用预测方法,进行与一系列的生物体内分子(蛋白质)的结合强 度的预测等。

首先,图10~图12是使用本实施方式的对接模拟方法,对5种化合物(AMP、 ATP、Lapatinib、Sunitinib和Tiliroside)与3种生物体分子(mTOR、PDK1和PTEN) 的结合强度进行计算预测的结果。此处,如图10~图12所示,针对各生物体分子, 在由条示出的评分中,最左边示出各生物体分子与原生配体的结合值(结合强度), 从左边起,依次示出各生物体分子与AMP、ATP、Lapatinib、Sunitinib和Tiliroside 的结合强度。即,图10~图12是如下情况下的输出:例如由用户选择5种化合物, 指定对mTOR信号传递系统进行分析,不是对该传递系统的全部蛋白质进行分析, 而设定为仅特别地显示针对其中的mTOR、PDK1和PTEN的预测。此外,可以基于 与该原生配体的相对值,设定各生物体分子与各化合物的结合强度的基准,也可以根 据另外定义的函数,将与该原生配体的相对的差异设为相对结合强度。

具体而言,图10示出了,在本实施方式中,在利用eHITS这样的对接模拟的情 况下的eHITS的估计结果、即5种化合物与3种生物体分子的结合强度的计算预测 结果。此外,图11示出了,在本实施方式中,在仅利用GOLD这样的对接模拟的情 况下的GOLD的估计结果。此外,图12示出了,在本实施方式中,在仅利用MOE 这样的对接模拟的情况下的MOE的估计结果。这样,在本实施方式中,可以具有如 下功能:不是向用户提示针对多个结果的综合评价结果和网络整体的包罗性分析,而 是根据用户的选择,着眼于特定的分子,提示基于特定的方法的结果。但是,如图 10~图12所示,多数情况下,仅靠单个方法(对接模拟)是不足的。即,如图10~ 图12所示,估计结果有时随每一方法而大幅不同。具体而言,在图10所示的基于 eHITS的估计结果中,示出了mTOR与Lapatinib的结合强度明显强于mTOR与 Sunitinib的结合强度,但在图12所示的MOE的估计结果中,示出了mTOR与Sunitinib 的结合强度一定程度地强于mTOR与Lapatinib的结合强度的结果。此外,在图11 所示的基于GOLD的估计结果中,并不进行mTOR与Lapatinib的结合强度以及mTOR 与Sunitinib的结合强度的估计自身。这样,在使用单个方法的估计中,有时会直接 面对各个估计方法的偏向或技术性界限,因此,在本实施方式中,可以使用学习方法 和/或荟萃估计方法来进行结合强度的综合评价,由此确定出最终被预测出的结合强 度。

此外,图13是针对如下化合物的本实施方式的分析结果,该化合物是将 AZD6244、CI-1040、PD0325901和TAK-733均作为MEK的抑制剂来进行疗效检验 的化合物。如图13所示,相对于MEK2,化合物均被认为具有较强的相互作用,但 根据本实施方式的相互作用预测方法,预测为BRAF、IGF1R和Wee1等具有更强的 相互作用。

此外,图14是基于以图13所示的分析结果为基础的相互作用强度而以颜色区分 生物体内分子的相互作用网络的图。如图14所示,根据图13所示的分析结果,对被 预测为与基于以MEK为目标的假定而进行临床试验的化合物(AZD6244、CI-1040、 PD0325901和TAK-733)发生相互作用的蛋白质进行了着色。这样,这些化合物超过 用户(例如制药公司等)理解的范围,与广大的范围内的各种蛋白质相互作用。此外 推测出,其相互作用分布在与相同的生物学功能相关的信号传递系统网络上,培养细 胞和临床疗效检验的结果是由MEK蛋白质的抑制导致的是存在疑问的。此外可知, 如图14所示,通过本实施方式的相互作用预测方法的利用,如下考虑是是更妥当的: 该化合物不仅作为MEK蛋白质的抑制而显现出效应,还作为与BRAF、IGF1R,Wee1、 APC、EGFR、IGF-1和AKT1等进行相互作用的综合结果而显现出效应。

此外,在本实施方式中,在各个候选化合物与生物体内分子以预测的方式进行相 互作用的情况下,需要进行其是提高了还是降低了作为相互作用的对方的生物体分子 的活性度的判定。在该阶段中,采用了基于多个方法的选择或进行整合的判断的方法 论。此处,有时利用如下荟萃估计系统,其使用了已经在结合强度预测等中利用的多 个方法的结果。此外,在关于多个生物体内分子与化合物的相互作用的数据库中存在 作为对象的生物体内分子与候选化合物的组合的情况下,可以从该数据中得到活性化 和非活性化的信息。例如,在本实施方式中,在使已知的配体或化合物与作为目标的 蛋白质相互作用时,使该蛋白质活性化。此处,在作为对象的配体或化合物也以相同 的结合方式发生相互作用的情况下,可以估计为该化合物也使该蛋白质活性化。

此外,在使蛋白质活性化的分子与作为对象的配体或化合物竞争性地起作用的情 况下,可以估计为抑制。例如,A这样的药剂(化合物)与X这样的蛋白质在特定 的结合区域中结合,同样,在X的结合区域中同时结合的分子Y使蛋白质X活性化。 在该情况下,化合物A和分子Y竞争性地在X的同一结合区域(结合袋(binding  pocket))中发生相互作用。此处,药剂A有可能阻碍分子Y与蛋白质X的相互作用, 有可能发挥抑制性的功能。在该情况下,不仅是药剂A简单地与分子Y竞争性地和 蛋白质X的同一区域发生相互作用,而且药剂A成为抑制,因此,不知晓其是否会 进一步活性化。因此,在本实施方式中,在存在关于与蛋白质X的同一区域相互作 用的分子及其作用方向的数据库的情况下,可以参照它。

此外,关于主要蛋白质,关于哪个蛋白质与其它哪个蛋白质在哪个部位相互作用、 结果出现怎样的效应,在实验上大多是已知的。因此,在本实施方式中,可以通过使 用该知识的数据库,来估计候选化合物是使蛋白质的活性变得抑制还是活跃。此外, 在不存在关于蛋白质与其它哪个蛋白质在哪个部位相互作用、结果出现怎样的效应的 实验数据的情况下,如果存在结构相似的生物体内物质和候选化合物的组合,则可以 使用该信息来确定活性化/非活性化。因此,在本实施方式中,每当开发出更精密的 方法时,可以更新/新导入这些新方法。此处,结构的相似性可以是分子整体或分子 的一部分(片段)的相似性。此外,在本实施方式中,关于根据生物体内分子与候选 化合物发生相互作用的详细位置来计算是活性化还是非活性化的方法,可以导入其精 度足够的方法。在由这多个方法计算出的预测中,通过考量各个方法的特征的方法而 导出最终的结果。在该过程中,在本实施方式中,可以导入使用神经网络或统计式学 习方法等方法来获得最终的预测的方法。可以通过它们来计算各个候选化合物的综合 的影响。

此处,在存在用于使用各种方法来对于与作为对象的生命现象相关的生物体分子 相互作用网络进行动态模拟所需的参数是已确定的计算模型的情况下,关于这些参数 的确定,例如可以如下方式来得到:利用在对正常状态的细胞施加某些已知刺激的情 况下的蛋白质的磷氧化状态的时间顺序数据等,使用遗传算法、随机退火方法 (stochastic annealing method)和/或梯度下降法等方法进行计算,使得模型的举动与 实验数据一致。

此外,在本实施方式中,可以进行如下模拟计算:与没有对生物体内分子(蛋白 质)投放候选化合物的状态相比,在投放了各种候选化合物的情况下,会出现怎样的 变化。此处,作为本实施方式的一个方法,首先,可以计算没有投放候选化合物等的 状态下的举动,也可假定投放了一种候选化合物的状态。此处,可以设定如下方程式, 在该方程式中,针对被预测为与候选化合物发生相互作用的各个生物体内分子,考量 候选化合物的量等而改变KD、Kd和Ka等值。进而,能够在一系列的候选化合物中 进行相同的处理。在该阶段,在计算模型中,能够计算出,在向生物体内分子(蛋白 质)投放了一定量的候选化合物的情况下,与没有投放的情况相比,会引起怎样程度 的细胞内响应的差异。

例如,在设定一系列的微分方程式来作为细胞的信号传递系统的模型的情况下, 在该微分方程式中,作为式子而附加有候选化合物的影响,因此,通过求解该微分方 程式,可进行投放候选化合物的情况下的细胞的响应的计算预测。通过对一系列的候 选化合物进行该计算,能够预测出各个候选化合物在对象生物体系统中产生怎样的效 应。此处,图15是本实施方式的计算预测的一例(基于模拟计算的变化预测)。图 15是示出如下情况的曲线图:在哺乳动物细胞的信号传递系统中产生突然变异的情 况下,通过计算机来预测生物体内分子(雌激素受体)的活性度随时间而发生怎样的 变化,其中,实线表示变异型,虚线表示正常型。

[其它实施方式]

另外,到此为止,对本发明的实施方式进行了说明,但本发明可以在上述实施方 式以外,在权利要求书中记载的技术思想的范围内以各种不同的实施方式来实施。

例如,以相互作用预测装置100以独立式的方式进行处理的情况为一例进行了说 明,但相互作用预测装置100也可以根据来自客户端终端(与相互作用预测装置100 为另外的壳体)的要求而进行处理,并将其处理结果返回给该客户端终端。

此外,在实施方式中说明的各处理中,可以手动地进行作为自动进行的处理而说 明的处理的全部或一部分,或者,利用公知的方法,自动地进行作为手动进行的处理 而说明的处理的全部或一部分。

此外,关于在上述文献中或附图中示出的处理步骤、控制步骤、具体名称、包含 各处理的登记数据或检索条件等的参数在内的信息、画面示例、数据库结构,在没有 特别说明的情况下,可以任意变更。

此外,关于相互作用预测装置100,图示的各构成要素属于功能概念上的构成要 素,不是必须在物理上如图示那样构成。

例如,关于相互作用预测装置100的各装置具有的处理功能、尤其是在控制部 102中进行的各处理功能,其全部或任意一部分可以由CPU(Central Processing Unit: 中央处理器)和由该CPU解释执行的程序来实现,此外,可以实现为基于布线逻辑 的硬件。另外,程序包含后述的用于使计算机执行本发明的方法的程序化的命令,且 被记录在不是暂时性、而是计算机可读取的记录介质中,并根据需要由相互作用预测 装置100以机械方式读取。即,在ROM或HDD(Hard Disk Drive:硬盘驱动器)等 存储部106等中,记录有计算机程序,该计算机程序用于与OS(Operating System: 操作系统)协作地向CPU发出命令,进行各种处理。该计算机程序通过被载入到RAM 而被执行,与CPU协作而构成控制部。

此外,该计算机程序也可以存储在经由任意的网络300而与相互作用预测装置 100连接的应用程序服务器中,根据需要而下载其全部或一部分。

此外,可以将本发明的程序保存在计算机可读取的记录介质中,此外,也可以构 成为程序产品。此处,该“记录介质”包含存储卡、USB存储器、SD卡、软盘、光 磁性磁盘、ROM、EPROM、EEPROM、CD-ROM、MO、DVD和Blu-ray Disc等任 意的“可移动的物理介质”。

此外,“程序”是以任意言语或记述方法记述的数据处理方法,可以是源代码或 二进制代码等的形式。此外,“程序”不限于单个地构成,而包含分散构成为多个模 块或库的方式或者与以OS(Operating System:操作系统)为代表的其它程序协作地 完成其功能的方式。此外,在实施方式所示的各装置中,关于用于读取记录介质的具 体结构、读取步骤或读取后的安装步骤等,可以使用公知的结构或步骤。

存储部106中保存的各种数据库等(化合物结构信息数据库106a、蛋白质结构 信息数据库106b、基因信息数据库106c、分子间相互作用信息数据库106d和蛋白质 结构相似性信息数据库106e)是RAM、ROM等的存储器装置、硬盘等的固定磁盘 装置、软盘和光盘等的存储单元,保存在各种处理或网站提供中使用的各种程序、表、 数据库和网页用文件等。

此外,相互作用预测装置100可以构成为已知的桌面型或笔记本型个人计算机、 便携电话、智能手机、PHS和PDA等的便携终端装置和工作站等的信息处理装置, 此外,可以构成为向该信息处理装置连接任意的周边装置。此外,相互作用预测装置 100可以通过在该信息处理装置中安装实现本发明的方法的软件(包含程序、数据等) 来实现。

此外,装置的分散/整合的具体方式不限于图示的方式,而可以成为使其全部或 一部分根据各种附加等或者根据功能负荷,以任意的单位而在功能上或物理上进行分 散/整合。即,可以任意组合上述实施方式来实施,或者选择性地实施实施方式。

产业上的可利用性

如以上详细记述所说明的那样,根据本发明,能够提供能够预测化合物等化学物 质与生物体内哪个蛋白质发生相互作用,并预测这些相互作用对生物体带来怎样的影 响的相互作用预测装置、相互作用预测方法和程序,因此,尤其是在医疗、制药、药 物开发和生物学研究等的各种领域中极其有用。

标号说明

100  相互作用预测装置

102  控制部

102a 化合物结构信息取得部

102b 蛋白质结构信息取得部

102c 预测蛋白质确定部

102d 相互作用强度确定部

102e 影响预测部

104  通信控制接口部

106  存储部

106a 化合物结构信息数据库

106b 蛋白质结构信息数据库

106c 基因信息数据库

106d 分子间相互作用信息数据库

106e 蛋白质结构相似性信息数据库

108  输入/输出控制接口部

112  显示部

114  输入部

200  外部系统

300  网络

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号