CN101542284B - 用于估计结合亲和力的预测性得分函数 - Google Patents

用于估计结合亲和力的预测性得分函数 Download PDF

Info

Publication number
CN101542284B
CN101542284B CN2006800014436A CN200680001443A CN101542284B CN 101542284 B CN101542284 B CN 101542284B CN 2006800014436 A CN2006800014436 A CN 2006800014436A CN 200680001443 A CN200680001443 A CN 200680001443A CN 101542284 B CN101542284 B CN 101542284B
Authority
CN
China
Prior art keywords
atom
hydrogen bond
acceptor
hydrophobic
electric charge
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2006800014436A
Other languages
English (en)
Other versions
CN101542284A (zh
Inventor
R·A·福里斯纳
R·莫菲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Schroedinger Inc
Original Assignee
Schroedinger Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Schroedinger Inc filed Critical Schroedinger Inc
Publication of CN101542284A publication Critical patent/CN101542284A/zh
Application granted granted Critical
Publication of CN101542284B publication Critical patent/CN101542284B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/50Molecular design, e.g. of drugs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/30Drug targeting using structural data; Docking or binding prediction
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/30Detection of binding sites or motifs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B35/00ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/60In silico combinatorial chemistry
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/60In silico combinatorial chemistry
    • G16C20/64Screening of libraries
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B45/00ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks

Abstract

用于计算所提议的配体与指定受体之间相互作用的数值表示(VRI)的计算机执行的方法。通过因受体对一个或多个配体原子的疏水包围的存在而给予加分的方法,给在一个或多个配体原子和一个或多个受体原子之间的疏水相互作用评分。此外,通过为电荷-电荷氢键设定一个缺省值,并且当一个或多个专门的预定的电荷-电荷氢键标准被满足时,在所述缺省值以上给予加分,来给配体和受体之间的电荷-电荷氢键评分。使用各种电荷-电荷氢键标准。考虑了两性离子、电荷、溶剂化作用、几何形状和静电能。

Description

用于估计结合亲和力的预测性得分函数
相关申请信息
本申请要求2005年3月11日提交的美国临时申请序列号60/660822的优先权,其通过引用而被结合在本文中。
发明背景
本发明涉及用于估计结合亲和力的预测性得分函数。
大多数药物活性化合物从与目标受体的结合得到功效,所述目标受体通常为蛋白质(包括糖蛋白和脂蛋白在内的一个术语)。大约50年前,借助x-射线结晶学方法确定了蛋白质的第一个高分辨结构。可公开获得的蛋白质数据库(PDB)现包含超过10,000个这样的结构,且药物和生物技术公司具有超过一个数量级的有专利权的结构。这些结构中的许多结构同与它们结合的小分子共结晶。这些结构的检验和由此获得的知识的利用以设计新的、更有效的和更专一性的抑制剂,被称为结构基药物设计。
计算机建模有助于结构基药物设计。给定一个高分辨率的蛋白质结构,计算机软件被用于将小分子配体“停靠”(dock)到恰当的位置和使它在蛋白质活性位点的空腔内取向,并用于计算假设具有这一结构时配体的结合亲和力。执行这一任务的计算机软件程序被称为“停靠”程序。
停靠程序典型地进行两个不同的任务来给蛋白质-配体的结合建立模型。首先,预测蛋白质-配体络合物的结构。在高通过量的停靠中,受体(例如蛋白质)通常被假设是刚性的。当这一假设失败时,要求使用受体的不同结构作为起始点。构建替代的受体结构(其被改变以接受要求受体构造显著变化的配体(“诱导契合”))的问题是一个非常重要的问题。在这里,我们集中在其中配体停靠到刚性受体内得到与实验数据合理一致的结构的情况。当在停靠结构内,在停靠结构内的配体使得关键的氢键和与蛋白质的疏水接触同实验数据很好地一致时,就是这种情况。
停靠程序的第二个任务是计算蛋白质-配体的结合亲和力,作为停靠结构的输入值给出。用于计算所述结合亲和力的数学函数被称为“得分函数”。尽管数十年来的深入努力,但在许多情况下,目前可获得的得分函数在所需的精度和稳定性(robustness)方面仍然不令人满意。
发明概述
本发明有两个方面,这两个方面的特征都在于用于计算表示所提议的配体与所指定的受体之间相互作用的数值(valuerepresentative of interaction,VRI)的计算机执行的方法。
一般来说,在第一方面,通过因受体对一个或多个配体原子的疏水包围的存在而给予加分的方法,给在一个或多个配体原子和一个或多个受体原子之间的疏水相互作用评分,并且所述加分导致提高的配体/受体结合亲和力的VRI指示。
在本发明第一方面的优选实施方案中,VRI的计算包括代表自由能、焓或熵或其组合中的至少一个项。给疏水相互作用评分可以包括计算表面积得分组分(SASC),它作为在配体原子和受体原子之间的疏水-疏水接触的表面积的函数而变化,且相对于使用SASC而不使用加分获得的假设的VRI,对存在疏水包围的加分导致VRI的增加。评分还可以包括计算原子-原子对能量项,以至于相对于使用原子-原子对能量项的和而不使用加分获得的假设的VRI,对存在疏水包围的加分导致VRI的增加。给疏水相互作用评分可以进一步包括计算原子-原子对能量项,且相对于使用原子-原子对能量项的和加上SASC项而不使用加分获得的假设的VRI,对存在疏水包围的加分导致VRI的增加。
所述计算的VRI值可以以各种方式使用,例如通过计算机程序,用在模拟配体停靠到受体内以产生受体-配体络合物的结构的方法中,以便例如帮助给受体-配体络合物指定一种结构或者评估配体形成通过停靠程序产生的蛋白质-配体络合物结构的结合亲和力。
或者,可以在指定在预定的受体-配体结构,例如由停靠程序、由分子动力学模拟或者由使用连续溶剂化模型求最小值获得的预定受体-配体结构内的代表受体-配体相互作用的数值的方法中计算VRI值。
优选地,当得分指示存在疏水包围时,产生受体-配体络合物的结构特征的图形显示,所述结构特征因疏水包围而有助于提高VRI,并且对一个或多个配体原子的疏水包围有贡献的受体原子可以被图示地突出显示,提供了所述包围的物理图片。在所述图像中也可以突出显示在配体的疏水包围中涉及的受体表面。
本发明的第一方面可以被用于选择要实验测试的化合物。
本发明第一方面的优选实施方案可以以任何顺序(除了步骤g)最后进行以外)包括一个或多个下述步骤:a)计算代表疏水包围的项;b)计算代表静电回报(rewards)的项;c)计算因疏水区域内的氢(H)键提高VRI的项;d)计算代表H键对的项;e)计算代表π-阳离子和π堆积(stacking)的项;f)计算代表标准亲脂对的项;和g)由这些项之和计算得分。可以通过进行至少下述步骤来确定疏水包围的存在:a)确定在配体的疏水原子的指定截止(cut-off)距离内的亲脂受体原子的位置;b)确定在疏水配体原子周围的亲脂受体原子的空间和角度分布;c)基于在疏水配体原子周围的亲脂受体原子的空间和角度分布给予加分。可以通过进行至少下述步骤来确定疏水包围的存在和大小:a)将配体的亲脂原子分成通过共价键连接的原子组;和b)给每一个组分配一个疏水包围分数,并且如果所述组的大小低于预定的阈值,则将包围分数设定为0(例如,通过确定在所述组内的每一配体原子的疏水包围分数,然后将每一配体原子的数值加和以获得该组的分数);c)作为连接的各组的疏水包围分数的和,计算应给予疏水包围的总加分。可以通过进行至少下述步骤来确定在合适的连接的组内的配体原子的疏水包围分数值:a)计算配体原子和受体的亲脂原子之间的距离;b)利用数学式来估计原子包围的程度,其中所述数学式考虑了亲脂受体原子的角分散及它们与配体原子的距离。使用所述数学式时,在配体原子的指定截止距离内的受体原子的较大角分散将导致较高的包围分数,且使用所述数学式时,被亲脂受体原子以适当短的距离包围的配体原子将产生非零的包围分数。还有,通过包括下述步骤的方法确定在所述组内的各配体原子的疏水包围分数:a)指定锚定原子,它是最接近配体原子的亲脂受体原子;b)在配体原子和锚定原子之间构建参考向量;c)在配体原子和在指定的截止距离内的其余亲脂受体原子之间构建向量;d)计算在c)中定义的每一向量和参考向量之间形成的角度;和e)通过受体原子到配体原子的距离和通过在d)中限定的角度,利用其中贡献随距离减少和随角度增加而增加的函数,确定在c)中产生向量的亲脂受体原子对包围分数的贡献。每一亲脂受体原子对包围的贡献是角度得分和距离得分的乘积。如果角度小于预定的角度,则角度得分设定为0,所述预定的角度可以但不必须作为配体原子和锚定原子之间增加的距离的函数而变化。配体原子可以被指定为亲脂基团,其包括未受极性原子连接干扰的、省去与极性原子相连的碳原子的一组连接的碳原子。所述基团可以含有最小数目的原子(例如,至少3个原子)。可以设定这样的条件,即,接受非0包围分数的亲脂受体原子必须在一定距离内,该距离是常数(例如,约3埃±0.1埃)加上配体和受体的范德华半径之和的和。原子划分成配体原子的连接的组可能牵涉数学运算,所述数学运算是每一原子及其相邻原子的键合连接性(connectivity)和化学同一性的函数。
在一个优选的实施方案中,配体包括中性原子的组,并且该方法包括:通过应用距离和角度标准,鉴定在中性配体原子和受体之间的一个或多个氢键;确定与一个或多个氢键合基团相连的配体的原子;基于(a)是否存在牵涉在氢键内的配体原子和与氢键合基团相连的配体原子的疏水包围,和还基于(b)在(a)内鉴定的配体原子是否因为(i)配体原子是亲脂性的,或者(ii)在没有包围的情况下所述配体原子已产生满员的氢键而受益于包围,给氢键指定一个加分。检测配体与受体的单一氢键,和如果氢键及其环境满足下述条件中的一个或多个(最优选全部),则给予特殊的单一氢键加分:(a)配体的氢键供体或受体原子是:i)氮;ii)在环内;或者iii)(i)和(ii)二者;(b)配体原子形成一组氢键供体原子的一部分,并且所述组中的所有供体被氢键合到所述受体上;(c)所述受体是蛋白质,和参与氢键的受体原子是蛋白质主链的一部分;(d)在脱辅基蛋白质结构(即没有配体存在的受体结构)内的相关的受体(receptor)供体或者受体(acceptor)原子被很差地溶剂化(例如,使用方格(grid)基水添加程序来评估在受体的脱辅基蛋白质结构内的供体或受体原子的溶剂化);(e)计算氢键所涉及的配体重原子和与这一原子相连的任何碳原子的所述包围项内的角度因子的和,并要求该和超过规定的阈值(例如,通过制造配体的小的扰动,并评估所述扰动是否改进包围分数从而超过所述阈值)。例如,当以上所有的标准(a)-(e)被满足时,可以指定约-1.5±0.3kcal/mol的特殊的单一氢键加分。可以如上所述或者单独利用标准(e)。可以要求原子具有小于3个接触的水,以便有获得所述特殊的氢键加分的资格。给予一个特殊对氢键加分的其它可能的标准包括以下标准中的一个或多个:(a)当键合原子被一个以上的可旋转键隔开时,多个氢键的对没有获得所述特殊对氢键加分的资格,其中在这一计算中OH基作为不可旋转的形式来计算;和/或(b)下述类型的配体受体氢键对中的一个或多个没有获得所述特殊对氢键加分的资格:
  1)质量差的H键(<0.05HB对分数);
  2)涉及相同的中性蛋白质原子的对;
  3)牵涉在盐桥内的对,如果在任何一个配体原子处静电电势不低于截止值;
  4)盐桥对,如果任何一个受体原子牵涉在蛋白质-蛋白质盐桥内;
  5)来自NH_x x>=2基团的配体供体/供体对,其中N不是环的一部分且具有为0的形式电荷;
  6)具有处于未配位状态的大于8个第二壳层水的形式上荷电的蛋白质原子;
  7)其中蛋白质原子不在盐桥内的荷电的中性H键;
  8)在配体上的不同中性受体原子的对;
  9)没有资格单独地获得单一氢键加分的中性H键对,例如它们没有满足环原子和疏性(phobicity)环境检测;
  10)配体OH与受体H的键,如果所述受体原子的形式电荷为0。
(c)对于其中所述对的配体原子单独地具有为0的净形式电荷的配对来说,在对所述疏水相互作用评分为氢键对而优化的情况下,所述氢键因所述疏水包围而被给予加分。在进行上述步骤(c)的过程中,使用下述条件以确定氢键对是否具有高于截止分数的疏水包围分数,以接受氢键对加分:a)在所述对内的配体原子必须是同一环的一部分,或者对于非环配体原子来说,所述配体原子必须直接连接到同一环上;和b)检测氢键区域的疏水性,并且将包围项的角度因子相加,和利用氢键合的配体原子对和与参与氢键的配体原子直接相连的配体环原子,该和超过规定的截止值;和c)如果所述对的配体原子不是环原子但与环相连,则上述和包括与非环配体原子为直接相邻原子的环原子。通过首先寻找各对并从单一的H键回报列表中排除在所述对的列表中发现的任何已被给予回报的氢键,可避免对一个对和单一的特殊氢键的两次计算。附加的标准是:d)在所述对中的配体原子必须是同一环的一部分,或者对于非环配体原子来说,所述配体原子必须与同一环直接相连;和e)检测氢键区域的疏水性,并且对在氢键内牵涉的配体重原子和与参与氢键的配体原子直接相连的配体环原子,将所述包围项内的角度因子求和,其中要求该和超过规定的阈值;f)如果所述对中的配体原子不是环原子但与环相连,则所述和包括与所述非环配体原子为直接相邻原子的环原子;和g)给予所述氢键对的加分为约-3kcal/mol。
用于评价疏水包围的加分的大小的步骤是:确定单独的氢键、相关联的氢键对和三氢键组(triplets of hydrogen bonds)的存在,和给单独的氢键、氢键对和三氢键组分配不同的每键值。可以通过包括下述步骤的方法指定在配体和受体中的中性原子团之间的氢键的值:评估受体的溶剂化程度,并根据受体溶剂化的程度,给予中性-中性氢键回报。共享一个原子的两对氢键可以满足给予加分的标准,并且第二对的加分可以具体设定为例如约-2kcal/mol。可以按照下述方程式降低指定给所述氢键对的加分(下文称为“基础回报”):
·使用角度函数按比例降低所述基础回报:
S(θ)=(θ-θm)/(θ0m),如果θm<θ<θ0
其中θ0是在参数化中允许的最大角度和θm是在参数化中允许的最小角度,如果θ≥θ0,则S(θ)=1.0,和如果θ<θm,则S(θ)=0.0
·给所述对的每一键指定一个角度换算系数S1、S2;和
·按照公式Ehb_spec=S1*S2*Ebase,将所述对的每一键的角度换算系数的乘积(Ehb_spec)S1*S2应用到所述基础回报(Ebase)上。
例如,θ0可设定为135°±5°,和θm可设定为120°±5°。可以通过应用添加外在的水(explicit waters)用的方格基算法,并计算在所讨论的蛋白质基团周围的第一和第二壳内这种水的数目,来评价在中性-中性氢键内蛋白质的氢键合配偶体(partner)的溶剂化。
可以生成络合物的计算机生成的描绘,其中在图形显示中突出了因疏水包围而接受特殊加分的氢键。在计算机生成的图形显示中也可以突出因疏水包围而接受特殊加分的氢键的包围,例如,在图形显示中突出参与接受加分的氢键的疏水包围的受体原子。也可以通过受体的疏水表面的显示,突出参与接受加分的氢键的疏水包围的受体原子。也可以在图形显示中突出与因疏水包围而接受特殊加分的氢键相连的配体原子。
通过进行分子动力学模拟,并鉴定其中水分子具有不利的化学势的区域,可以检测能给合适的配体基团提供疏水包围的受体的区域。
通过将水分子置于受体周围并检测这些水分子的包围的环境,可以检测能给合适的配体基团提供疏水包围的受体的区域。
在本发明的第二方面,在配体和受体之间的电荷-电荷氢键通过下述步骤评分:为电荷-电荷氢键设定一个缺省值,并且当一个或多个专门的预定的电荷-电荷氢键标准被满足时,在所述缺省值以上给予加分。电荷-电荷氢键标准包括下列中的一个或多个:在确定是否给予加分中,在确定加分的数值中,或者这二者,确定配体是否具有净电荷或者是否是两性离子;如果配体是两性离子,确定带相反电荷的基团之间的距离;确定在氢键内牵涉的受体基团的溶剂化程度;确定电荷-电荷氢键的详细几何形状;和确定电荷-电荷氢键的静电能。例如,如果两性离子的正和负基团二者形成电荷-电荷氢键,并且如果这些基团之间的距离没有超过预定的距离,则所述两性离子可以被指定附加的电荷-电荷加分。当通过两性离子形成的电荷-电荷氢键与受体的静电相互作用增加时,加分可以增加。当静电相互作用的大小增加时,加分也可以增加(例如从3.0±0.5kcal/mol增加到4.7±0.5kcal/mol)。
可以评估受体溶剂化,并且如果受体溶剂化低于预定值,例如在电荷-电荷氢键内牵涉的荷电受体原子周围约9个第二壳层水(这通过方格基水添加规则确定)时,则可以指定电荷-电荷氢键回报。另外,如果受体和配体的静电能超过规定的阈值,则可以指定附加的电荷-电荷氢键回报。
优选地,本发明的第二方面包括确定在电荷-电荷氢键内带正电荷和带负电荷的基团的相互作用是双齿的还是单齿的,并且给双齿的键指定附加的电荷-电荷氢键回报。因此,确定所述结构是否涉及受体的多个带电荷的基团,并且如果所述结构涉及多个带电荷的基团,则指定一个特殊的加分。如果配体基团是羧酸根基团,则为其与多个带正电荷的受体基团的相互作用指定的加分可以是1.0±0.3kcal/mol。
通过以下步骤确定两性离子的电荷-电荷回报:确定在桥连受体和配体的带电原子的受体组分周围水的数目,并在其中电荷充分水合的情况下,省略或降低电荷-电荷回报;和将氢键分类为:a)单齿氢键;b)在配体基团内的双齿氢键;或者c)桥连一个配体基团和两个不同的蛋白质基团的双齿氢键,并基于该分类调节电荷-电荷回报,以承认单齿氢键具有比内部双齿氢键低的数值,而内部双齿氢键又具有比桥连双齿氢键低的数值。
优选地,该方法包括使用方格基水添加规则,以评估在不存在配体的情况下电荷-电荷氢键的受体配偶体的溶剂化作用。
还优选地,具有超过规定截止值的数值的、在静电环境内的荷电原子被给予特殊的加分,例如1.5kcal/mol±0.3kcal/mol。
在其它优选的实施方案中,VRI的一个组分代表电荷-电荷氢键或者相互作用,并且该组分被加和到其它得分组分上,以计算键合到受体上的配体的总自由能。
最后,可以在图形显示中突出显示接受特殊加分的电荷-电荷氢键。
在本发明的第二方面中,在评价氢键中,评价在配体原子上的电荷可能是重要的。对于任何给定的配体来说,基于分子建模计算所使用的力场,可以将“部分电荷”分派给每一原子。一种合适的力场是液态最优化电势(Optimized Potential for Liquid State,OPLS)。OPLS和其它力场通常具有用于将部分电荷分派给原子的清楚的算法。
所述部分电荷可以被表达为“键电荷增量”或“净电荷”。键电荷增量是沿一个特定的键展开的相等和相反的电荷。由相等和相反的电荷组成的键电荷增量在定义上是中性的。一旦定义了键电荷增量(在OPLS中,这些增量实际上被用于建立部分电荷),则它们可以被求和以给出在每一原子上的部分电荷,所述部分电荷是将获得的电荷,如果没有净电荷的话。净电荷是通过对键电荷增量求和而获得的电荷与实际的部分电荷之间的差。
中性-中性氢键是其中配偶体原子无一具有以上定义的任何净电荷的氢键。电荷-电荷氢键是其中牵涉在氢键内的配体和受体原子均具有净电荷(相反符号)的氢键。
可以实施本发明以实现下述优点中的一个或多个优点。
通过假设在蛋白质-配体络合物内的键合主要由发现水分子(它们不好地(badly)位于蛋白质内)并用配体以合适的方式取代它们来驱动,而提供得分函数的改进项。
这里所述的方法使得人们能够半定量地将候选配体键合到蛋白质受体的一个特定构象的能力分等。使用所述新的项,在计算得分函数的~120PDB络合物的结合亲和力中的均方根(RMS)误差为1.8kcal/mol,与此相对,其性能代表了文献中那些得分函数的性能的一种替代得分函数的均方根(RMS)误差为3.3kcal/mol。在绝对结合亲和力预测中接近2倍的这一改进等于定性地更好的给化合物排序的能力。
这里所述的方法使得人们能够对大的化合物库(数千到数百万个化合物)进行有效的筛选计算,并显著富集处于所述库的最高得分部分的活性化合物部分,从而使得这些化合物可以被选择用于实验评价,并避免较低得分的化合物(其不太可能是活性的)的实验评价。用所述新的得分函数获得的富集因子常常比不使用这里所述的方法获得的那些大~10倍。
这里所述的方法使得人们可以通过预测结合亲和力因用化学上可行的替代基团取代化合物中的一个官能团而丧失或者获得,来进行活性化合物的引导优化(lead optimization)。所得到的结合亲和力预测中改进的精度对引导优化努力来说是关键的。如果误差太大,则基于得分函数获得改进的分子的几率变得不足以大到使它在实际范围使用是有意义的。
这里所述的方法使得可以评估一个分子结合到两个不同的蛋白质目标上的选择性。可以将所述分子停靠到两个目标内,并且可以比较所述得分,以估计所述配体是否优先结合到一个目标或另一目标上。
这里所述的方法使得可以通过提供图形用户界面(GUI),来使配体的关键特征和蛋白质活性位点及它们的相互作用可视化。可以使用颜色、纹理、分子表面和在GUI内可获得的其它特征突出疏水包围的区域和特殊的中性-中性和荷电-荷电氢键。这些区域和结构特征(它们导致提高的结合亲和力)的可视化有助于设计新的、在提高结合亲和力以及在保留结合亲和力同时优化分子的其它特征方面改进的化合物。
这里所述的方法使得能实现单一的、条理清晰的方法,其中将取样算法和得分函数一起优化。
本发明的一个实施方式提供了所有上述优点。
从以下说明和权利要求书,本发明的其它特征和优点是显而易见的。
附图简述
图1是简图。
图2是与两种不同的疏水环境相互作用的配体基团的图。
图3是流程图。
图4图解说明了结合到p38 MAP激酶(pdb 1kv2)的DFG-out构象的Boehringer活性配体BIRB796。
图5描述了结合到p38 MAP激酶的SB220025。
图6图解说明了通过在主链的特殊疏水包围的H键对(XP回报3kc/m)和用稠合环填充所述疏水腔(pocket)(回报4.5kc/m)结合的CDK-2(pdb 1aq1)的星形孢菌素抑制剂。
图7图解说明了交叉停靠在pdb入口1aq1内的CDK-2抑制剂cgp6047。
图8图解说明了在生物素(pdb 1stp)内的链霉抗生物素蛋白。在这一络合物内的两个特殊氢键和氢键合区域的疏水包围被显示。
图9图解说明了与抑制剂通过与主链的特殊疏水包围的H键(1.5kc/m回报)和配体芳环的疏水填充(packing)(4.5kc/m回报)结合的HIV-RT腔(pdb 1rt1)。
图10图解说明了通过盐桥结合到隐藏的ASP_189的凝血酶抑制剂(pdb 1ett)。
图11图解说明了键合到神经氨酸酶(neuramididase)蛋白质(pdb1bji)上的配体。
在各附图中,相同的参考数字和符号表示相同的元素。
详细说明
如图1所示,一种示例性分子相互作用几何形状的简图包括第一分子体20和第二分子体22。在一些情况下,所述第一分子体20可以是药物候选分子(即,配体),和所述第二分子体22可以是蛋白质。所述第一分子体20包括原子24、28、30和32,各自具有正、正、正和负的静电荷(或部分电荷)。所述第二分子体22包括原子34、36和38,各自具有正、负和负的静电荷(或部分电荷)。实体20被认为停靠到实体22。利用得分函数可以计算蛋白质22与配体20的结合亲和力,作为输入值假设在图1所示的停靠结构。如果给定了络合物的足够精确的结构,得分函数提供了一种用于计算在蛋白质受体内的配体的结合亲和力的方法。所计算的亲和力也可用于将配体排序。
高精度得分函数的有效使用通常要求提高的取样方法学,或者所得到的停靠结构不能避开大的去溶剂化损失,或者不能确定被鉴定为对提高的键合亲和力有贡献的特定结构特征(motifs)的位置。在这里,为了有效地利用所述得分函数,我们假定生成了这一质量(quality)的结构。
我们的得分函数半定量地将候选配体键合到蛋白质受体的一种特定构象的能力分等。因显著的空间冲突而不适合所述受体的配体不能被预期可以实现好的分数,即使它们有效地键合到同一受体的替代构象。
受体“构象”和“配合(fit)”的定义包括试探的成分。停靠所使用的势能函数必须允许由配体诱导的真实构象与被停靠的刚性受体有一定程度的偏离;否则,模型将不能用于实际的筛选。用于产生蛋白质-配体络合物的结构的停靠算法要求依比例缩放(scaling)蛋白质和/或配体原子的范德华半径,建立适度的“诱导配合”的效应。存在许多情况,其中合理程度的依比例缩放不能使配体正确地停靠(例如,如果侧链呈旋转异构体的状态,所述旋转异构体的状态完全不同于原来的蛋白质-配体络合物的状态并阻止配体原子在结合腔内占据它们的优选的位置)。总是存在在不确定区的情况,但在实践中我们已发现,可以将大部分交叉停靠的情况指定为“配合”或者“不配合”。
这里的描述集中在其中配体大致适合受体的络合物,这通过与原来的络合物(或者根据相关配体的天然络合物类推获得的络合物)相比产生关键的氢键合和疏水接触并实现合理的均方根距离(RMSD)的能力来判断。
蛋白质-配体键合亲和力的可能贡献因素(contributor)包括下述5个贡献因素:
第一,代表水被配体从蛋白质活性位点的“疏水区域”替代的项是一个可能的贡献因素。释放这些水到溶液内可以导致总自由能的降低。在这样的区域内的水不可能产生在溶液内可以获得的满员的氢键。还可以有熵的考虑。如果水的迁移被限制在蛋白质腔内,则释放到溶剂内将导致熵增益。由于一个配体释放许多水分子,这一项将有利地对自由能做出贡献。
第二,代表在配体和蛋白质之间氢键合的项是一个可能的贡献因素。如果由配体和蛋白质形成的氢键在某种方式上优于在每一部分和水之间形成的那些氢键,则导致自由能增益。这种取代可能是有利的的一个原因是形成额外的氢键,如果键合到蛋白质或配体上的水否则将较差地取位。这一项与代表水被配体从蛋白质活性位点的“疏水区域”替代的项有一些重叠。然而,至少在我们在这里考虑的类型的经验得分函数中,氢键合相互作用必须被具体处理。
第三,代表去溶剂化作用的项可能是可能的贡献因素。通过将在配体或者蛋白质中的、以前暴露于水的基团与它们不可能与之氢键合的基团相邻地布置,可以使在配体或者蛋白质中的、以前暴露于水的基团去溶剂化。与以上所述的两个项相反,这一作用只能起到降低结合亲和力的作用。
第四,代表因为在键合后限制柔性蛋白质或配体基团的运动导致的熵效应的项可能是一个可能的贡献因素。与去溶剂化项的情况一样,这样的效应将只能起到降低结合亲和力的作用。
第五,需要专门的项来描述配体与金属离子的相互作用。如果金属原子存在于蛋白质内,则在得分函数中可以将这一项加到其它项上。在这里,我们不考虑金属原子。本发明的实施方案可应用到含金属的蛋白质,但必须如上所述由用于金属的专门的项来补充最终的、完整的得分函数。
以前人们已经提出了许多经验得分函数。尽管它们在细节上彼此不同,但这些现有的得分函数彼此具有类似性。我们用作实例来与我们的得分函数进行比较的一个这样的现有得分函数是ChemScore。ChemScore得分函数包括亲脂原子、氢键供体和受体以及氢键受体和金属之间的相互作用,和基于配体的受限制的可旋转键的数目的额外贡献。当使用ChemScore时,就氢键能量优化牵涉在氢键合内的氢的位置(对蛋白质和配体供体二者都做这种优化)。
如下所述,ChemScore处理以上列出的四个项(不包括所述专用于金属原子的项)中的每一个项。
ChemScore包含下述形式的疏水原子-原子对能量Eph项:
E ph = Σ ij f ( rij )
其中“i”和“j”指(亲脂)碳原子,和“f(rij)”是原子间距离“rij”的线性函数。对于小于原子范德华(Vdw)半径加0.5埃的和的rij来说,“f”为1.0。对于更大的距离,f线性地变化,在超过3埃时变为0。
这一Eph项直观推断地(heuristically)代表从疏水区域取代水,它最容易通过亲脂配体原子实现。在亲脂配体和蛋白质原子之间的许多紧密接触表明,很差地溶剂化的水成功地被配体的亲脂原子取代,所述配体的亲脂原子本身以前暴露于水。所得到的亲脂原子的隔离(segregatition)和伴随的水从活性位点释放到本体中将通过疏水效应降低自由能,所述疏水效应大致地由以上的得分函数记录。涉及蛋白质和配体的疏水表面之间的接触的项尽管在细节上不同,基本上试图通过非常类似类型的近似来度量同样的自由能变化。
ChemScore基于几何形状标准评价蛋白质-配体氢键质量,但没有区分不同类型的氢键或者不同的蛋白质环境。
ChemScore没有处理去溶剂化效应。
ChemScore使用简单的可旋转键项,来处理构象熵对配体的影响。
我们的得分函数始于在以上讨论的ChemScore中所使用的项,但它们的详细的参数化是我们的得分函数所专有的。我们的得分函数定性地修正疏水项和氢键合项。我们还开发了去溶剂化项。必须包括去溶剂化项,以计算总的结合亲和力。
我们的得分函数包括疏水相互作用的改进的模型,我们将其称为“疏水包围”。我们从其开始的、如ChemScore中所示的“标准”原子-原子对函数EPH基于相邻的亲脂蛋白质原子的距离分布给亲脂配体原子指定了分数。这显然抓住(capture)了配体结合的疏水组分的物理过程的主要组分。从附近有许多亲脂蛋白质原子的区域置换水比从有较少这种原子的区域置换水在自由能方面很可能更有价值。作为一个实例,显然,如果配体被放置在活性位点腔内,则与在蛋白质的表面上相反,配体的亲脂原子很可能将接受更好的分数。如果它们位于蛋白质的“疏水腔”内,则分数应当好于在主要被极性或者荷电基团围绕的位置。然而,仅依赖于距离分布的得分函数对蛋白质原子相对于所讨论的配体亲脂原子的局部几何形状的细节不敏感。
作为一个实例,考虑图2中所示的两个模型分布。在一种情况(A)下,配体原子50被放置在疏水“墙”处。亲脂蛋白质原子52仅在所述疏水原子的一“侧”上。在第二种情况(B)下,亲脂配体原子54被放置到一个紧密的腔内,亲脂蛋白质原子56在所述配体原子56的两(或三)“侧”上。通过调节相关蛋白质原子的距离参数和数目,可以构建对结构A和B的任何原子-原子对项(不管系数)产生相同分数的两个模型。问题是在所规定的条件下,在结构A和B中,原子对结合自由能的贡献是否应当相同。
答案主要取决于通过在蛋白质腔内的给定位置处置换水分子所获得的自由能,这取决于在该位置处水如何能成功地满足其氢键合要求。在其中单一水分子被置于仅能容纳一个水的蛋白质腔内且在所有侧面上被不能产生氢键的亲脂原子包围的极端情况下,通过疏水配体基团的取代而转移到本体中的自由能显然是有利的,并且水分子将占据这一空腔而不是留下空间(尽管统计学项有利于占据)不是显然的。这是非常罕见的情况,所述情况尤其与键合大的配体不相关,而图2中的实例是相当常见的。
我们已进行了大量的计算实验,所述计算实验涉及设计用来区分不同几何形状的蛋白质环境的疏水得分项的修改(在我们的得分函数中)。这些实验成功的一个标准是任何提出的疏水得分项适合宽范围的实验结合自由能数据并对大量研究产生好的预见性的能力。下面在以下段落中描述我们的结果。
必须成组地而不是单独地考虑配体亲脂原子。主要当在蛋白质腔内的水分子位于延伸数个原子的尺寸的疏水微环境内时,其自由能在正常值以外受到负面影响。如果存在单独的孤立的疏水接触,则水通过避免这些接触并使用相邻的水作为配偶体,通常无论如何能够产生满员的氢键。我们设定相连的亲脂配体原子的最小的组大小为3。
当一组亲脂配体原子在两侧(呈180度角)由亲脂蛋白质原子围绕时,我们的方法假设这类结构有助于结合自由能超出在原子-原子对项中所编码(encode)的结合自由能。我们将这一情况称为配体的“疏水包围”。所述原子-原子对项被配合到大的不均匀的数据组中,且由在“平均”环境(即不是在位于蛋白质的特定构型的疏水区域内的基团)中的单独的亲脂配体原子支配。我们的得分函数项被设计用来捕捉偏离这一平均值的有利的偏差,其代表了特定的分子识别形式(motif)。也就是说,将合适的疏水配体基团置于所述指定的蛋白质区域内导致效力(potency)的显著增加,超出这一基团的平均值,所述基团的类型通常是药物化学优化程序的目标。
如图3中所示,疏水填充评分方法100包括将亲脂原子分成(102)连接的基团。
对于在一个连接的基团内的每一原子,方法100列举了(104)在各种距离处的亲脂蛋白质原子。方法100选择(106)最接近的亲脂蛋白质原子,并在它和配体原子之间画出(108)一个向量。这被称为“锚定”原子。
取在所述列表上的所有其它原子,每次一个,并且对于每一原子,方法100画出(110)朝向所述配体原子的向量,并使用简单的点积算法计算(112)在朝向配体和锚定原子的向量之间的角度。为了在锚定原子的“另一侧”上被考虑,向量之间的角度必须超过某一数值(所述数值取决于距离-越是远离,则角度必须越接近180度)。如果角度为0度,则向量是平行的,并且该原子是在“同侧”上的。如果角度为90度,则向量成直角,并且该原子与所述锚“成直角”。如果角度为180度,则该原子正好在“另一侧”上,并且这是导致对于水来说特别差的环境的因素。这由在不同曲率的疏水表面上水的分子动力学模拟来支持,且还由通常意义的几何理论(geometrical arguments)来支持。
方法100基于总的亲脂接触点(具有距离截止值)的数目(称为接触分数)和取决于角度项的权重,给每一原子赋予一个分数。如果例如没有原子离所述锚定原子大于90度,则角度项为0,并且该原子对所述基团“特殊疏水”项的贡献为0。方法100将所述基团内所有原子的分数相加,且总和为该基团的分数。在附录I中提供了方法100的详细的数学说明。
如果所述分数大于4.5kcal/mol,则方法100在这一数值上给所述项定一个上限。这是在分析了许多不同的测试案例并将结果与实验数据进行比较的基础上的经验确定值。如果这种类型的一个区域非常大,导致大于4.5的分数,则可能存在水分子通过彼此相互作用进行补偿的一定能力-较小的区域在这样做时有更大的困难,给所述项定上限补偿了这一效应。
图4中显示了如果大的疏水基团(在两种情况下都为环)被置于其中亲脂蛋白质原子存在于腔两侧上的腔内,结合亲和力增加的一个特定的实验说明。这种非常紧密结合剂(binder)的萘基60,相对于仅仅苯基,显示出改进结合力达21倍。要求萘基60来完全占据图4中所示的疏性腔62。
如上所述,我们将亲脂蛋白质原子对配体的亲脂原子或者基团的包围称为“疏水包围”。疏水包围的合适处理是区分高效和低效结合形式和化合物的关键。如果人们希望开发具有预测能力的方法,用于识别疏水包围并给每一形式指定一个对结合亲和力的特殊贡献的数值标准的详细优化是重要的,并且我们已使用大的一组实验数据调节我们的得分函数的项。
以上描述了从蛋白质-配体络合物的预测结构开始检测疏水包围的一种特定方法。可以构建其它方法,以实现与计算包围对结合亲和力的贡献几乎相同的结果。
用于检测疏水包围的上述方法基于使用停靠的蛋白质-配体络合物作为包围计算的出发点。另一方法是以脱辅基蛋白质结构,即在不存在任何配体情况下的蛋白质开始,并使用外在的水分子作为溶剂进行蛋白质的模拟。人们可以检测在体系内是否有其中水分子因存在蛋白质提供的疏水包围而难以形成其满员氢键的任何位置,并标记这些区域为有利于被合适的配体基团占据。这一方法利用水分子在特定位置的氢键合特性以检测包围,这与从停靠的蛋白质-配体络合物推导这种特性相反。基于这样的模拟,人们可以构建得分函数的项,所述得分函数给合适的蛋白质区域的占据回报(例如,在方格基方案内)。
我们的得分函数包括代表蛋白质-配体氢键合的改进模型的项。在开发氢键合的改进的模型中,我们将氢键划分成三类:中性-中性;中性-荷电;和荷电-荷电。由于与荷电基团的宽范围的溶剂化能量(Born能)有关的问题,每一类型的氢键合的分析是不同的。起始步骤是给这三种不同类型的氢键的每一种指定不同的缺省值(假设最佳的几何特征)。我们指定的缺省值是:中性-中性:1kcal/mol;中性-荷电:0.5kcal/mol;和荷电-荷电:0.0kcal/mol。这些指定值基于经验观测数据(最适合宽范围的蛋白质数据库(PDB)络合物的报道的结合亲和力)和物理推理的组合。
完全给蛋白质-配体氢键回报的基本原理是难明的(subtle),因为任何这样的氢键是替代蛋白质和配体与水产生的氢键。在结合的络合物中与在溶液中相比,总氢键的净值平均保持相同。然而,水释放到本体内导致熵增加,并且在极性基团周围水的释放要求蛋白质-配体氢键。当两个基团都为中性的时,这一分析是最似乎可信的。在蛋白质与配体之间盐桥的形成牵涉与溶液内氢键合完全不同类型的氢键合。已经在蛋白质中研究了盐桥形成的热力学,且该热力学取决于许多因素,例如溶剂暴露的程度。我们指定的为0的缺省值是基于在PDB内存在在其中形成盐桥的、具有非常低的结合亲和力的许多蛋白质-配体络合物。要求盐桥的特殊特征,为的是这类结构在我们的得分函数内对结合亲和力有贡献。最后,所述荷电-中性缺省值代表在中性-中性和荷电-荷电值之间的插值,它看起来与经验数据一致。
随着几何形状偏离理想的氢键合几何形状(基于供体和受体原子之间的角度以及距离),氢键得分从其缺省值开始变小。在附录II中提供了详细说明。下面我们描述专门的结构,其中氢键被分配附加的结合亲和力增加(称为“回报”),所述附加的结合亲和力增加显著超过所述缺省值。对于中性-中性氢键或者荷电-荷电氢键来说,可以产生这些情况,但对于荷电-中性氢键来说,不会产生这些情况。由于无法鉴定可与实验数据产生更好的一致性的这种类型氢键的形式,从而驱使排除了荷电-中性氢键特殊回报。
我们现在描述特定类型的中性-中性氢键,所述中性-中性氢键基于理论和经验这两方面的考虑,已经被鉴定为对结合亲和力产生额外的贡献。这种“特殊的”氢键代表关键的分子识别形式,且在许多(如果不是大多数)药物靶中被发现。瞄准这样的形式是增加药物化合物的效力和专一性的中心策略。在开发经验得分函数中,开发能合适地给这种类型的结构指定结合亲和力(这与事后合理地解释在各个单独的靶中“重要的”氢键相反)是一个主要的目的,使得能够大大改进定性和定量预测能力。
关于重要的氢键的一个关键想法是定位在这样的蛋白质空腔内的位置,在所述蛋白质空腔中与极性基团形成氢键的水非常难以产生它们的正常的满员附加氢键。与蛋白质原子形成氢键对水分子施加了重要的几何限制。这是所述缺省氢键分数的基础。但是,当水分子的其余环境在产生附加氢键方面有疑问时,这样的限制更加成问题。
我们对疏水相互作用的分析表明,如果水分子在两侧上(与仅仅一侧相反)具有疏水蛋白质原子,并且如果几乎没有能重新调节自身以适应蛋白质-配体氢键的受限的几何形状的相邻水,则所述环境定性上更有挑战性。我们通过使用用于检测疏水包围的上述方法的一个变体来鉴定这一类型的几何形状。如果配体的供体或者受体原子通过与所关心的蛋白质基团产生单一目标氢键而实现其满员的氢键,使得满足附加氢键不成问题,则用配体取代这样的水是尤其有利的。
合适基团的一个实例是在芳环内的平面氮,所述平面氮例如键合到蛋白质N-H主链基团上。图5中显示了这类结构(观察到其对实验上实现高效力是根本的)的一个示例性实例;所描绘的体系是结合到p38 MAP激酶上的SB220025。已知Met 109氢键对效力来说是重要的,如在其它激酶内的类似氢键那样。以上所述的得分函数项使得可以自动地并且在实验测量前检测这样的氢键。同样重要的是,也可以自动拒绝假阳性,所述假阳性表面上具有所要求的结构形式的某些特征,但缺少关键的组分。假阳性的拒绝通过如下手段优化:运行得分函数的给定变体,鉴定具有在已知活性物内没有看到的位置中的特殊氢键的高得分的数据库配体,检验所得的结构,并改变参数以排除所讨论的特定试验例的回报。
用于检测在疏水环境内的单一氢键的方法200包括下述步骤。供体或者受体原子必须在环内,氮例外,氮被允许是非环原子。如果配体原子是供体基团,则该基团的所有其它供体(例如,NH2的两个氢)必须H键合到蛋白质上。只有主链蛋白质原子可以参与这类特殊的H键。在脱辅基蛋白质结构(即不存在配体的结构)内相关蛋白质供体或受体原子必须具有少于3个第一壳层溶剂化水。使用添加水到蛋白质结构或者蛋白质一配体络合物的方格基程序(水添加规则(code)),来确定在第一壳层内水的数目。如果这些标准被满足,则通过在配体H键合的重原子和与这一配体原子相连的碳原子上求和,对疏水填充分数的角度因子求和。在这一求和中所使用的专门的疏水填充项仅含有在方法100中所述的疏水填充分数的角度权重而不含有接触权重。如果所述绝对疏性的填充和高于截止值,则H键被认为处于疏水限制的环境内,且-1.5kcal/m的特殊的H键回报被施加到这一H键上。在一些情况下,发现配体的小的扰动可以使所述专门的疏水填充项移动到所述截止值以上。因此,如果所述项最初低于截止值,则产生约0.3埃的配体的小的刚性体扰动。在每一扰动的几何形状下,重新计算该项,且如果在某些几何形状下该项超过截止值,则施加回报。这有助于避免在使用截止值中固有的不连续性。
方法200鉴定了其中单一氢键应当被给予“特殊”回报的结构。当在蛋白质和配体之间有多个相关联的氢键时,出现第二种情况。水分子的组织以在活性位点的限制的几何形状内有效地溶剂化这类结构,可能甚至比上述情况更成问题。只有当在这种溶剂化中牵涉的水处于疏水基团在两侧的、复杂的(challenging)疏水环境内时,才发生这种情况。如果要拒绝假阳性,则所述特殊的氢键的识别与疏水包围形式的结合是关键的。在停靠中,相关联的氢键通常与例如高溶剂暴露的主链对形成,但没有来自实验数据的证据证明在任何已知的药物化学系列中这种结构对提高的效力有贡献。在附录II中描述了关于给具有2和3个相关氢键的体系指定特殊回报的细节。
关于呈供体/受体、供体/供体或者受体/受体原子对(称为“配体原子对”,其由不超过1个可旋转键(在这一计算中OH基作为不可旋转的基团计算)隔开)形式的配体,定义了多个氢键。对可以考虑的对的类型有一些限制,如下表中所示。
  1)忽略质量差的H键(<0.05HB对分数)
  2)不包括牵涉同一中性蛋白质原子的对
  3)如果在任何一个配体原子处的静电势不低于截止值,则忽略牵涉在盐桥内的对
  4)如果任何一个蛋白质原子被牵涉在蛋白质-蛋白质盐桥内,则忽略盐桥对
  5)忽略来自于NH_x x>=2基团(N不在环上且形式电荷为0)的配体供体/供体对
  6)忽略具有超过8个处于未配位状态的第二壳层水的形式上荷电的蛋白质原子
  7)忽略荷电-中性H键,除非该蛋白质原子处于盐桥内
  8)忽略在配体上的不同中性受体原子的对
  9)中性H键对必须满足环原子和疏性环境检测条件
  10)如果蛋白质原子的形式电荷为0,则忽略配体OH与蛋白质H的键
如果所述对的配体原子单独地具有为0的净形式电荷,则它们必须满足下述疏水性检验条件和标准,以实现特殊的H键回报。首先,配体原子必须是同一环的一部分,或者只有在直接与同一环相连时可以是非环原子。假设所述对满足这些限制,则以类似于单一H键的方式检测H键区域的疏水性。使用H键合的配体重原子的对和与该配体对原子直接相连的环原子,对上述疏水填充分数求和。如果所述对的配体原子不是环原子而是与环相连,则所述和包括与所述非环配体原子直接相邻的环原子。如果所述的绝对疏性和高于截止值,则所述H键合的对被给予3kcal/m的特殊回报。通过首先寻找配对,并从单一H键回报列表中排除在对列表中发现的任何已给予回报的H键,来避免成对的和单一的特殊H键的重复计算。
所述特殊的H键回报随着H键的质量成比例地线性降低。在所述成对H键分数的意义上,使用供体/受体距离和由供体重原子-H向量和H-受体向量形成的角度来度量H键质量。对于在环内的配体受体原子来说,检测受体孤电子对向量与供体重原子-H向量对准的程度。在附录2中提供了关于在我们目前的实施方式中在数学上如何实现这一点的详细说明。
我们已鉴定了大量的蛋白质-配体络合物,其中存在满足上述标准(包括必不可少的疏水包围)的含有两个或三个相关氢键的形式。以下显示了许多实例。图6中所显示的第一个实例描述了结合到CDK2上的星形胞菌素。在许多其它激酶中也发现了这类相关的对。一些CDK2活性物,例如cgp60474产生三个相关的氢键;在图7中显示了这一结构。
图8显示了第二个实例,其中链霉抗生物素蛋白结合到生物素上。此处,在疏水包围的区域内出现三个相关的氢键。直到目前,没有经验得分函数解释了在生物素内链霉抗生物素蛋白的特别大的结合亲和力。一旦认识到所述三个被包围的氢键合形式并给予合适的分数,则利用停靠结构,所计算的结合亲和力和实验的结合亲和力间的偏差仅为1.5kcal/mol。
图9中显示的第三个不同的实例是结合到醛糖还原酶的lef3结构的非达司他(fiderestat)抑制剂,它还显示了三个相关的氢键。需要与这一氢键有关的大的附加分数来解释为何这一化合物从在lef3天然络合物的高度疏水腔内实现大的疏水分数(在实际的筛选实验中)的大量配体中脱颖而出(在实验中低的纳摩尔结合亲和力)。
疏水包围与1-3个恰当地定位的氢键的结合是在我们的各种药物学有关的靶的研究中我们已鉴定出的每一“特殊”中性-中性氢键的特征。然而,为了排除假阳性,要求另外的特征。特别地,如果在蛋白质内的氢键配偶体高度暴露于溶剂,那么更容易形成能溶剂化所讨论的基团的结构,尽管仍允许所牵涉的水形成合适数量的附加氢键。因此,我们要求牵涉在所述特殊氢键内的蛋白质基团在第一或第二壳层内具有有限数目的水。使用上面所讨论的水添加方法确定这样的水的数目。
通过基于含有大量每一类型结构的实例的大型实验数据库进行优化,来确定与所述特殊氢键有关的回报的大小。在下表中给出了数值。
Figure G06801443620070615D000231
我们已鉴定了表明电荷-电荷氢键的加强的下述特征:
(1)包围盐桥的蛋白质组分的水的数目。充分暴露于溶剂的荷电基团不可能参与加强的电荷-电荷氢键合。替代溶剂的成本太大。
(2)由荷电的配体基团产生的电荷-电荷氢键的数目。我们已观察到,形成了三种不同类型的盐桥结构:
(a)在配体基团和一个蛋白质基团之间的单齿结构(单一氢键)。
(b)在配体基团和一个蛋白质基团之间的双齿结构(两个氢键)。在图10中显示了在带正电的胺基和在相关的专一性腔内的隐藏的羧酸根之间的凝血酶内双齿盐桥的一个实例。
(c)一个配体基团与两个不同的蛋白质基团之间的氢键。这要求有两个紧密相邻的类似荷电的蛋白质基团。经常出现这种类型的结构,其据推测将在蛋白质内产生应变能。它似乎是通过渐进的压力形成的一类特殊的分子识别形式。
图11图示说明了一个实例,该实例显示了键合到神经氨酸酶受体的项N9流感病毒变体(pdb码1bji)的配体Gr217029。在这一例中,在羧酸根氧之间的距离仅为4.5埃。
经验数据和物理化学推理均表明,以上(c)类氢键提供比(b)类氢键更大的稳定化能量,而(b)类氢键又提供比(a)类氢键更大的稳定化能量。除非适当地满足条件(1),否则从自由能的观点来看,这三种结构的任何一种都不可能是有利的。正是受限制的水对蛋白质基团的接近和在配体和蛋白质基团之间的特别强的静电相互作用的组合产生了分子识别形式。
(3)对于两性离子来说,将电荷-电荷氢键的缺省值设定为0的主要原因是,在形成盐桥过程中,蛋白质和配体二者必须放弃对Born能的远距离贡献(即超出第一壳层)。当形成盐桥时,完全可能满足第一壳层的满员氢键,但用蛋白质或者键合水取代本体水,显然会降低对离子的可能的介电应答。对于单价离子来说,库仑场下降约1/r,结果远距离效应(至少向外到达第二壳层)对总的溶剂化自由能做出很大贡献。然而,对于两性离子来说,来自正电荷和负电荷的场在远距离(多远取决于两个荷电基团的分离)处在一定程度上抵消,产生双极性场,对于所述双极性场来说,第二(和更高)壳层对溶剂化自由能的贡献显著下降。因此,通过两性离子形成两个盐桥应该比键合单一离子更有利,特别是在所述两个带电的部分在空间上靠近时。在图11中显示了按照这一方式键合的两性离子的一个实例。
(4)我们区分了其中配体带正电和蛋白质带负电的情况,和其中配体带负电和蛋白质带正电的情况。
(5)在配体处静电场的强度。对于盐桥来说,为了接受提高的结合亲和力,配体电荷放置的位置必须是静电有利的。我们将在配体位点处筛选出的静电场求和,并基于在我们的一组试验案例上的经验优化设定给予回报的截止值。这些截止值有助于降低接受特殊的电荷-电荷回报的假阳性数量。
下表列举了针对标准(基于以上讨论的5类)的各种特殊的电荷-电荷回报和指定给所述回报的数值。基于与我们的整个一组试验的适配性来优化后者。
Figure G06801443620070615D000251
下表显示了一系列Glur2受体的得分函数实际分数,与实验结合能相比较。
Figure G06801443620070615D000252
Glu2受体与神经氨酸酶一起是静电相互作用对其尤其重要的一种体系,并因此提供对用于这些相互作用类型的训练组(training set)的重要贡献。
已经经验观察到,较大的配体往往被大多数得分算法所喜欢。我们基于这些观察结果实施了两种类型的项:
(1)基于其质量给较小的配体指定一个回报。我们使用的该项是线性的且覆盖在300-450范围内的质量。低于300时,所有配体接受最大回报(1kcal/mol);高于450时,所有配体接受为0的回报。
(2)识别芳香堆积和π-阳离子相互作用的项,多年来所述芳香堆积和π-阳离子相互作用已被猜测在具有这些形式之一或两者的特定络合物的蛋白质-配体结合亲和力中起到重要作用。我们在我们的数据组中包括了这一范畴的数个体系(例如,fxa,乙酰胆碱酯酶),并开发了每一类相互作用的几何描述,所述几何描述被优化以包括活性化合物并排除假阳性。在所述富集和结合亲和力研究过程中,给各种相互作用指定了值。
另外两个得分项来自于蛋白质的疏性/极性表面“位点图”。第一个吸引人的“极性疏性”项给予所述活性位点图的疏性区域内的极性原子回报。在这一方法中,疏性区域确定为来自蛋白质的、具有有利的vdW相互作用和低电场的、在方格上的点。极性原子是非碳、非受体、非供体原子。这一吸引人的项典型地为约0.5kcal/m,所以不对平均值做出显著贡献。排斥性位点图“疏性排斥”分数对在具有高电场的蛋白质区域内发现的疏性配体原子进行惩罚。在这一方法中,猜测这些区域被水占据。这一项平均也贡献0.3kcal/m的水平,且常常小于极性疏性项。
以下方程式结合了用于计算我们的得分函数的组分(其有利于结合)的所有项。我们已基于实验结合亲和力和晶体结构优化了这些项。
Ebind=Epho_pack+Eelectro+EHB_spec+EHB_pr+Epho_pr+EPI
其中Epho_pack是疏性填充/包围项;Eelectro含有任何一种静电回报;EHB_spec包含在疏性区域内的H键的回报;EHB_pr是标准的H键对项;EPI包含π-阳离子和π堆积项;和最后,Epho_pr是标准的亲脂对项。如上面所指出的,这一项必须补充以去溶剂化和熵项,以计算下面报告的结合亲和力的最终分数。我们的方法的功效是基于使用停靠姿势(pose)计算在PDB内的一组蛋白质-配体络合物的结合亲和力(因此显示,采用与实验结构相对比的停靠姿势可以获得结合亲和力预测的好的结果)。下表列出了来自这里讨论的各种络合物的结合亲和力的、我们的得分函数关于结构RMSD的结果,其中“XP分数”是指从我们的得分函数获得的结果,和“SP分数”代表用于比较的、使用一种较早的得分函数的分数。在可以获得的情况下,实验结合亲和力被包括在该表中。
PDB条目    XP分数    ΔG_exp    XP RMS    SP分数    ΔG_exp    SP RMS
1aaq       -11.1     -10.8      12.1*     -12       -10.8      1.6
1abe       -8.9      -9.2       0.3       -11.5     -9.2       0.4
1abf       -6.1      -7.2       0.1       -11.8     -7.2       0.1
1acj       -9.8      -10        2.8       -7.6      -10        4.6
1acm       -13.7     --         0.4       -15.4     --         0.3
1aco       -4.2      --         0.3       -9.7      --         1
1add       -11.1     -9.2       0.5       -9.3      -9.2       0.6
1adf       -9.1      -6.2       4.5       -13.7     -6.2       2.9
1aha       -8.6      --         0.2       -7.9      --         0.1
1ake       -22       --         1.3       -10.3     --         2.8
1apb       -7.8      -7.9       0.1       -11.6     -7.9       0.1
1apt       -12.3     -12.8      0.9       -11       -12.8      0.6
1apu       -9.8      -10.5      1.3       -8.8      -10.5      1
1apv       -11.7     -11.3      0.7       -9.8      -11.3      0.4
1apw       -11.2     -10.9      1         -9.6      -10.9      0.3
1atl       -10.6     --         0.9       -8.2      --         2.4
1avd       -17.2     --         0.6       -10.2     --         0.5
1azm       -5.1      --         1.9       -6.3      --         1.5
1b6j       -12.1     --         2.8       -16       --         3.1
1b6k       -14.6     --         1.3       -13.9     --         0.7
PDB条目    XP分数    ΔG_exp   XP RMS    SP分数    ΔG_exp    SP RMS
1b6l       -10.5     --        1.1       -11.2     --         0.6
1b6m       -14       --        0.2       -12.7     --         3.2
1baf       -4.2      --        1.2       -9.3      --         1
1bap       -8.9      -9.4      0.3       -11.6     -9.4       0.4
1bbp       -15.2     --        5.1       -13       --         5.1
1bkm       -11.1     --        3.6       -15.4     --         2
1bma       -6.2      --        0.6       -7.9      --         2.1
1bra       -5.4      -2.5      2.3       -7.2      -2.5       0.3
1byb       -14.6     --        0.5       -16.4     --         0.5
1c1b       -15.5     --        0.9       -9.6      --         0.5
1c3i       -12.7     --        0.6       -11.7     --         0.4
1c5p       -5.5      --        0.5       -7.3      --         0.2
1c83       -8.5      --        0.3       -10       --         0.1
1c84       -10.9     --        0.3       -9.6      --         0.3
1c86       -11.2     --        0.2       -11.3     --         0.2
1c87       -10.5     --        0.4       -11.7     --         0.3
1c88       -10.7     --        0.2       -12.2     --         0.2
1c8k       -7.3      --        3.6       -7.5      --         5.5
1cbs       -7.5      --        0.5       -6.6      --         0.4
1cbx       -9.8      -8.6      0.3       -13.4    -8.6        0.5
1cde       -15.1     --        2.3       -10.6    --          2.1
1cdg       -5.6      --        6.9       -5.7     --          6.5
1cil       -5.6      --        3.7       -6.8     --          3.9
1cnx       -6.2      --        6.7       -9.2     --          6.6
1com       -9.2      --        3.7       -8.6     --          3.7
1coy       -8.8      --        0.4       -8.7     --          0.3
1ctr       -7.8      -6.8      1         -6.4     -6.8        2.4
1ctt       -6.3      -6.2      0.6       -6.5     -6.2        5
1d3d       -15.7     --        2.1       -10.7    --          2.6
1d3p       -13.2     --        1.8       -10.8    --          2.1
1d7x       -7.2      --        0.5       -9.7     --          0.4
1d8f       -7.7      --        9.3       -9       --          4.8
1dbb       -13.2     -12.3     0.3       -9.4     -12.3       0.4
1dbj       -13.2     -10.4     0.3       -8.6     -10.4       0.3
1dbk       -12.7     -11       0.9       -8.1     -11         0.4
1dbm       -12.6     -12.9     0.5       -9.1     -12.9       2
1dd6       -14       --        8.1       -11      --          8.1
1dds       -9.8      -11.3     3.6       -8.1     -11.3       2.4
1dhf       -9.5      -10.1     5.8       -9.3     -10.1       5.6
1did       -4.7      --        3.7       -6.9     --          4.1
1die       -5.9      -2.9      0.4       -7.7     -2.9        0.8
1dih       -9.5      -7.8      2.4       -15.8    -7.8        4
1dm2       -12.2     --        0.7       -9.5     --          0.7
1dog       -7        -5.5      3.7       -10.3    -5.5        3.7
1dr1       -4.7      -5.57     0.3       -7.8     -5.57       1.5
1dwb       -5.6      -4        0.6       -6.7     -4          0.3
1dwc       -10       -10.3     2.1       -10.5    -10.3       0.8
1dwd       -13.7     -11.4     1.4       -11.5    -11.4       1.4
1e5i       -9.9      --        0.3       -10.8    --          0.2
1eap       -12.1     --        0.8       -10.2    --          2.4
1ebg       -13       -14.8     0.4       -20      -14.8       0.3
1ecv       -8.2      --        0.2       -9.8     --          0.2
1eed       -10.2     -6.7      11.6      -10.7    -6.7        10.8
1ejn       -9.3      --        0.4       -9.4     --          0.3
1ela       -8.1      -8.7      2         -5.7     -8.7        10
1elb       -2.2      --        4.1       -7.6     --          5.2
1elc       -7.3      -9.8      7.5       -6.3     -9.8        7.8
1eld       -8.5      --        0.8       -4.7     --          6.7
1ele       -8.1      --        0.4       -6.8     --          0.3
1epb       -9.7      --        2.6       -6.5     --          2.3
1eta       -3.8      --        1.2       -4.1     --          1.7
1etr       -11.5     -10.1     0.7       -9.5     -10.1       0.7
1ets       -13       -11.6     1.3       -11.8    -11.6       1.4
1ett       -12.7     -8.4      0.6       -9.5     -8.4        0.5
1ezq       -16.2     --        1         -12.9    --          0.2
1f0r       -11       --        2.4       -9.3     --          0.8
1f0s       -11.1     --        1.7       -8.5     --          0.3
1f0t       -10.4     --        1.6       -10      --          0.3
PDB条目    XP分数    ΔG_exp    XP RMS    SP分数    ΔG_exp    SP RMS
1f0u       -8.6      --         0.6       -11.2     --         1.6
1fen       -10.8     --         1.2       -6.5      --         0.4
1fh8       -9.4      --         0.2       -12.5     --         0.2
1fh9       -7.8      --         0.8       -8.4      --         6.5
1fhd       -9        --         5.4       -11.3     --         0.4
1fjs       -7.9      --         2         -12.6     --         2.4
1fkg       -10.4     --         1.4       -8.2      --         1.6
1fki       -10.7     --         1.3       -7.6      --         1.3
1fq5       -17.8     --         1.9       -15.9     --         2.4
1fvt       -12.1     --         0.9       -8.7      --         0.9
1nco       -8        --         0.6       -11.6     --         0.4
1nis       -4.9      --         0.3       -11.4     --         0.5
1nnb       -5.4      -7.2       1.4       -9.3      -7.2       0.3
1nsc       -5.8      -4.1       0.7       -12       -4.1       0.2
1nsd       -7.2      -7.2       1.1       -10       -7.2       0.3
1odw       -11       --         3.9       -8.7      --         1.5
1okl       -7.8      --         0.5       -5.9      --         2.7
1pbd       -11.3     --         0.3       -9.4      --         0.3
1pgp       -8.3      -7.8       2.3       -10.3     -7.8       2.2
1pha       -12.5     --         0.7       -8.6      --         0.5
1phd       -7.6      --         0.8       -6.2      --         0.3
1phf       -7.9      -6         1.8       -5.3      -6         1.1
1phg       -11.2     -11.8      1.7       -7.7      -11.8      1.2
1poc       -10.7     --         2.5       -12.4     --         1.5
1ppc       -9.1      -8.8       1.5       -10.3     -8.8       1.1
1pph       -8.6      -8.5       0.9       -9.9      -8.5       0.6
1ppi       -15.9     --         1         -13.9     --         7.6
1ppk       -8.5      -10.4      0.6       -11.2     -10.4      0.3
1ppl       -9.7      -11.5      0.9       -12.2     -11.5      2.6
1ppm       -9.3      -7.9       0.5       -12.9     -7.9       0.6
1pro       -15.6     -15.4      1.4       -12.5     -15.4      1.9
1pso       -12.2     -14.1      2.6       -9.8      -14.1      5.7
1sbg       -11.1     -10.6      0.9       -10.8     -10.6      0.4
1slt       -5.2      --         0.7       -9.1      --         0.6
1snc       -9.8      -6.7       2.5       -11.2     -6.7       1.2
1sre       -4.3      -5.4       0.3       -9.6      -5.4       0.3
1srj       -4.8      --         0.4       -9.1      --         0.4
1stp       -18.5     -18.3      0.5       -11.2     -18.3      0.6
1tdb       -8.1      --         7.4       -6.9      --         7.5
1thy       -5.2      --         2.3       -7.4      --         2.5
1tka       -11.2     --         1.7       -15.2     --         2.3
1tlp       -11.5     -10.3      10.4      -13.3     -10.3      7.3
1tmn       -10.2     -10        2.9       -12.7     -10        2.8
1tng       -6.5      -4         0.2       -7.3      -4         0.2
1tnh       -5.4      -4.6       0.6       -7.6      -4.6       0.3
1tni       -3.6      -2.3       2         -5.9      -2.3       2
1tnj       -4.1      -2.7       0.5       -6.5      -2.7       0.4
1tnk       -3.7      -2         1.1       -6.2      -2         1
1tnl       -4.1      -2.6       0.4       -6.2      -2.6       0.2
1tph       -5.2      --         0.2       -8.2      --         0.2
1tpp       -7        --         0.3       -7.7      --         1.1
1trk       -14.6     --         0.9       -14.4     --         2.1
1tyl       -5.1      --         5.2       -5.3      --         1.1
1ukz       -13.5     --         0.5       -12.6     --         0.4
1ulb       -6.4      -7.2       0.3       -9        -7.2       0.4
1wap       -8.1      --         0.2       -9.9      --         0.2
1xid       -6.3      --         4         -6.4      --         4.3
1xie       -5.3      --         2.6       -6.7      --         3.9
2ack       -7.6      --         1.1       -5.8      --         0.9
2ada       -8.8      --         0.4       -10.4     --         0.5
2ak3       -9.7      -5.3       0.8       -8.5      -5.3       0.6
2cgr       -11       -9.9       0.6       -11.3     -9.9       0.5
2cht       -9.9      --         0.4       -10.8     --         0.5
2cmd       -8.6      --         0.8       -10       --         0.5
2cpp       -8.5      -8.3       0.2       -5.8      -8.3       3
2ctc       -7.3      -5.3       1.5       -10.7     -5.3       1.6
2dbl       -12.2     -11.8      2         -8.9      -11.8      0.8
2gbp       -10.5     -10.4      0.2       -12.9     -10.4      0.1
PDB条目    XP分数    ΔG_exp    XP RMS    SP分数    ΔG_exp    SP RMS
2ifb       -6.1      -7.4       2.3       -3.5      -7.4       1.9
2lgs       -5.4      --         1         -7.1      --         5.9
2mcp       -4        -7.1       1.5       -5.4      -7.1       1.3
2phh       -10.1     -6.4       0.4       -8.6      -6.4       0.4
2pk4       -6.4      -4.32      0.8       -6.2      -4.32      0.9
2plv       -11.9     --         1.6       -8.2      --         1.2
2r04       -7.4      -6.22      1.1       -7.4      -6.22      0.7
2r07       -8.7      --         1.5       -7.4      --         0.7
2sim       -7.6      --         0.9       -10.6     --         0.8
2tmn       -11       -6.7       0.6       -12.1     -6.7       0.6
2tpi       -8.7      -5.9       0.4       -8.1      -5.9       1.2
2upj       -11.2     -14.2      3.1       -11.3     -14.2      2.7
2xis       -6        -7.9       2.3       -8.1      -7.9       2.4
2yhx       -4.3      --         1.9       -9.6      --         2.2
3cla       -6.5      -4.94      8.5       -4.8      -4.94      6.1
3dfr       -13.8     -14        0.7       -13       -14        0.8
3hvt       -8.8      --         0.7       -8.1      --         0.8
3mth       -5.4      --         1.2       -4.6      --         5.6
3ptb       -6.1      -6.5       0.3       -7.4      -6.5       0.2
3tpi       -7.3      -5.9       0.6       -9.4      -5.9       0.5
4aah       -11.3     --         0.3       -13.3     --         0.3
4cts       -7.7      --         0.2       -8.6      --         0.2
4dfr       -12.7     -13.2      1.1       -12.1     -13.2      1
4fab       -16.4     -14.4      4.5       -8.8      -14.4      0.8
4fbp       -11.7     --         2         -13.9     --         0.5
4fxn       -11.2     --         0.7       -16.6     --         1.2
4hmg       -6.7      -3.5       0.7       -7        -3.5       0.7
4phv       -14.2     -12.5      0.8       -10.2     -12.5      5.5
4tim       -0.8      -2.16      0.8       -11.3     -2.16      1.3
4tln       -5.7      -5.1       1.7       -9.8      -5.1       2.5
4tmn       -12.2     -13.9      1.1       -14.4     -13.9      1.2
4tpi       -6.7      -4         0.7       -8.3      -4         0.6
4ts1       -8.6      -7.6       0.9       -7.5      -7.6       0.8
5abp       -8.1      -9         0.1       -12.1     -9         0.2
5cpp       -8.2      -8         0.1       -5.9      -8         2.7
5cts       -0.2      --         0.2       -8.1      --         0.3
5p2p       -9.6      --         1.9       -9.2      --         10.4
5tim       -1.5      -3.1       0.9       -7        -3.1       0.7
5tln       -11.6     -8.7       2.4       -12.1     -8.7       1.8
5tmn       -10.9     -11        2.6       -13.3     -11        2.8
6abp       -8.9      -9.1       0.3       -11.3     -9.1       0.4
6cpa       -11.4     -15.7      4.8       -14.9     -15.7      4.2
6rnt       -5.5      --         0.6       -8.2      --         0.6
6tim       -5.5      -3.21      0.6       -8.8      -3.21      0.4
6tmn       -11.1     -6.9       2.4       -13.6     -6.9       2.3
7abp       -6.2      -8.1       0.2       -11.7     -8.1       0.2
7cpa       -15.9     -19.1      3.9       -15.2     -19.1      4.1
7cpp       -6.3      -5.2       2         -4.6      -5.2       3.2
7tim       -5.4      --         0.2       -11       --         0.2
8abp       -7.9      -10        0.2       -12.4     -10        0.2
8atc       -11.1     --         0.3       -11.6     --         1.4
8gch       -7.1      --         0.5       -9.6      --         0.3
9abp       -8        -10.9      0.1       -12.7     -10.9      0.2
9hvp       -10.8     -11.4      1.4       -13.7     -11.4      1.6
1g45       -8.2      --         7.9       -6.8      --         4.2
1g46       -8.2      --         8.1       -6.9      --         4.5
1g48       -6.9      --         2         -7.1      --         3.8
1g4j       -6.9      --         5.3       -8        --         3.5
1g4o       -7.9      --         7.9       -6.6      --         4.3
1g52       -8.6      --         8         -6.7      --         4.3
1g53       -8.2      --         7.9       -6.4      --         4.5
1g54       -6.5      --         6         -7.1      --         5.1
1ghb       -6.8      --         0.3       -8.3      --         0.3
1glp       -4.2      --         0.8       -10.8     --         0.3
1glq       -8.2      --         1.2       -11.7     --         0.3
1gsp       -7.5      --         1         -9.1      --         2.8
1hbv       -10.2     -8.7       10.5*     -9.9      -8.7       3.2
1hdc       -9.9      --         0.7       -7.8      --         0.5
PDB条目    XP分数    ΔG_exp    XP RMS    SP分数    ΔG_exp    SP RMS
1hdy       -3.7      --         3.5       -4        --         1.7
1hef       -10.1     -12.1      6.1       -11.4     -12.1      6.8
1hfc       -9.2      --         2.4       -10.3     --         2.3
1hgg       -6.8      --         1.5       -8.7      --         1.4
1hgh       -6.2      --         0.6       -5.7      --         2.3
1hgi       -6.4      --         0.6       -7.7      --         0.2
1hgj       -4.8      --         0.3       -6.4      --         0.4
1hih       -12.5     -11.3      1.4       -11.4     -11.3      1.2
1hps       -12       -12.6      12.1*     -12.8     -12.6      12.1
1hpv       -9.8      -12.6      0.9       -10.3     -12.6      0.9
1hpx       -12.1     -11.2      2.1       -12.1     -11.2      3.5
1hri       -11.3     --         10.5*     -6        --         3.9
1hsg       -14.3     -12.8      3.8       -13.7     -12.8      0.4
1hsl       -9.8      -7.3       1.3       -9.8      -7.3       1.3
1hte       -10.1     -8.6       7.3*      -8.7      -8.6       1.2
1htf       -11.2     -11.1      3.3       -10.1     -11.1      2.2
1hti       -4.3      --         4.4       -6        --         1.7
1hvr       -13.4     -13        1.6       -5.2      -13        3.9
1hyt       -8.8      --         2.6       -10.5     --         0.9
1icn       -7.4      --         9.3       -1        --         8.9
1ida       -9.9      --         2         -12.6     --         12.1
1igj       -6.8      --         0.7       -7.5      --         0.5
1imb       -6.8      --         1.8       -11       --         1.6
1ivb       -6.2      --         0.5       -6.8      --         0.5
1ivc       -5.1      --         1.8       -6.4      --         1.9
1ivd       -3.5      --         0.8       -6.8      --         0.7
1ive       -6.1      --         4.8       -6.4      --         5
1ivf       -8.2      --         0.7       -8.3      --         1.3
1lah       -5.9      --         0.2       -10.7     --         0.1
1lcp       -8.3      --         1.8       -8.9      --         1
1ldm       -7.4      -7.4       1.3       -6.4      -7.4       1.3
1lic       -4.8      --         4.8       -2.8      --         2.4
1lmo       -6.8      --         7.1       -8        --         0.9
1lna       -6.4      --         1.3       -8.2      --         0.7
1lst       -6.3      --         0.7       -8.6      --         0.3
1mbi       -3.9      -2.6       1.9       -3.5      -2.6       1.6
1mcr       -10.1     --         6         -7.6      --         1.7
1mdr       -8.5      --         1.7       -9.2      --         0.5
1mfe       -8.8      -7.2       6.2*      -8.4      -7.2       1.8
1mld       -8.5      --         0.3       -10.2     --         0.2
1mmq       -9.7      --         0.6       -11.4     --         0.3
1mnc       -9.8      -12.3      0.3       -11.4     -12.3      0.4
1mrg       -6.2      --         0.2       -7.5      --         0.1
1mrk       -13.3     --         1.2       -10       --         1.2
1mup       -5.2      --         4.9       -4.9      --         4.1
利用我们的得分函数从实验结合亲和力计算的XP分数的平均RMSD为1.8kcal/mol,这代表了与对于相同数据组的3.3kcal/mol的SP得分RMSD相比大约两倍的改进。我们注意到,以上讨论的RMSD计算引入了受体应变能的估计,这将导致从上表对于数个情况计算的误差小的改良。使用我们的得分函数时误差大于3kcal/mol的情况非常少,这暗示本发明的得分函数具有优异的能力来将弱(毫摩尔)、中(微摩尔)和强(纳摩尔)结合剂彼此区分(这是实际筛选中的一个主要任务),这种能力仅勉强存在于现有的得分函数中。为了在这一水平以上改进精确性,我们相信必须引入受体柔性,并且必须结合关于蛋白质-配体相互作用的附加水平的细节。
我们的方法的效力还基于将一组已知的、对于一种特定的受体来说活性的化合物停靠到该受体内,和另外停靠1000个随机选择的药物类分子的数据库作为对比组。与数据库配体相比,我们通过我们的新的得分函数(以下定义)计算活性化合物的“富集”,并将结果与数个较早的、不那么有效的得分函数相比较。
我们的测试组仅包括配合到所研究受体的特定变体的配体。选择受体的形式,所述受体是相对“开放的”,以使匹配的配体数量最大化。我们报道了我们从我们研究的起始数据组保留的配合配体的分数。主要基于堵塞进入一个腔的通路的空间冲突放弃配体。保留实现合理的结合模型(通过与实验结构的直接比较或者通过与已知结构的类比来评估)的任何配体,而不管它被给予的分数。
在计算富集分数中,仅使用实验结合亲和力好于10μM的配体。计算结合强度不如该配体的一些配体的结合亲和力,作为对我们的得分函数区分弱和强结合配体的能力的检查。选择10μM的截止值,因为这是在高通过量的筛选实验中用于定义“活性”化合物的典型数值。预期有能力达到这一范围活性的随机数据库配体的百分数(假设结合亲和力的完美的计算和实验评估)典型地在0.1-1.0%的量级(尽管这些数目可以明显更高或更低,取决于受体)或者在1000个随机选择的化合物的数据库中约为1-10个化合物。因此,预期在随机数据库中的真阳性将引入相对小的噪音到我们的富集数据中。下表举例说明了具有10μM或更好的结合亲和力的总活性物,与配合并停靠在每次筛选所选择的受体内的物质总和相比较。
Figure G06801443620070615D000331
当相对于随机数据库的大小在测试组内使用大量的配体时,富集的标准定义遇到问题。我们使用与在测试组内活性物数量无关的定义,因为它仅由得分好于每一活性物的随机数据库配体的数目来确定(因此,省去了作为要素的将活性物相对于彼此分等)。
下表列出了对于三种不同的得分函数;新的得分函数(它包含通过以上所述的我们的方法实现的项);和两个老的得分函数(已知它们可与文献中的其它方法竞争),等级高于我们研究的受体的已知活性化合物组的数据库配体的平均数目。活性物具有至少10μM的活性。通过确定等级高于每一活性物的数据库配体的数目,然后将这些数值加和在一起并除以活性物的数目,来计算必要的平均值。因此,下表中记录的0的数值代表完美的分数,其中所有的活性物等级高于所有的数据库配体。可以看出,对于许多受体(如果不是大多数受体的话)来说,通过这一测量,目前的得分函数定性地通常好于所述老的得分函数10倍或10倍以上。
Figure G06801443620070615D000341
可以按照许多方式使用上述方法。在一个特别的实例中,正如所述的,所述方法可以被用于计算各个项对结合亲和力的贡献的数值。在另一个特别的实例中,可以在图形使用者界面(GUI)内直观地显示对每一项的关键贡献因素。这样的项的可视化可用于新分子的设计,所述新分子将更好地利用蛋白质活性位点腔的关键特征(例如如前所述水被疏水包围的位点)。可视化也可以被用于确定对于实现与蛋白质的紧密结合来说不重要的活性化合物的区域。然后,可以由药物化学家改性这样的区域,以得到对于体内药物有效性来说必须的分子的其它性能,例如通过消化系统的更好的吸收,毒性的避免,增加的溶解度,和不利的新陈代谢反应的缓和。
可以通过鉴定被包围的配体内的疏水原子的组,鉴定通过所述算法检测到参与所述包围的蛋白质原子或者残基,并使用相关配体和蛋白质原子的显示的形状、颜色和纹理以突出这些区域,来使疏水包围可视化。
这一可视化能够使药物化学家理解配体的哪些部分必须保持疏水(即不应当被改性以引入亲水基团)和蛋白质的哪些残基/原子导致产生所述包围。还可以使用来自多个配体的数据,以产生能导致有利的包围项的蛋白质区域的完整图。然后人们可以设计新的配体,该新的配体尽可能多地利用这些区域和最大程度地利用每一区域。
可以通过突出形成所讨论的氢键的蛋白质和配体供体和受体基团以及对所要求的氢键的疏水包围有贡献的蛋白质基团,来将得到回报的特殊中性-中性氢键可视化。这种可视化将指明在配体上的关键基团,这些基团应当仅被能实现相同的特殊回报的其它基团替代。
可以通过突出形成所讨论的氢键的蛋白质和配体供体和受体基团,来将特殊的荷电-荷电氢键可视化。
对于中性-中性氢键和荷电-荷电氢键来说,存在给予所述回报的标准,所述标准涉及评估蛋白质内相关基团的溶剂化度。这可以通过显示围绕所述相关基团的外在的水来可视化。
可视化可能是有用的,即使不计算对结合亲和力的数值贡献。可视化对新化合物的设计可以做出特殊的贡献,并导致其中活性化合物被改性以改进宽范围的性能同时保留效力的优化方法。
可以在数字电子电路中(或者在计算机硬件、固件、软件中)或者在它们的组合中实施本发明的实施方案。可以作为计算机程序产品,即明白地体现在信息载体内(例如在可机读存储装置内或者在传播的信号内)以供数据处理装置(例如可编程的处理器、计算机或者多个计算机)执行或者用于控制数据处理装置(例如可编程的处理器、计算机或者多台计算机)的操作的计算机程序,来实施本发明的实施方案。计算机程序可以被写成任何形式的程序设计语言,包括汇编语言或者解释语言,并且它可以以任何形式展开,包括作为单独的程序或者作为程序块、组件、子程序或适合用于计算环境的其它单元。计算机程序可以被展开,以在一台计算机上或者在在一个位置或者分布在多个位置并通过通讯网络互连的多台计算机上执行。
可以由一个或多个执行计算机程序的可编程处理器进行本发明实施方案的方法步骤,以通过操作输入数据和产生输出值来发挥本发明的功能。也可以由特殊目的的逻辑电路(例如FPGA(现场可编程门阵列)或ASIC(特定用途集成电路))进行方法步骤,并且可以以它们来实现本发明的装置。
作为实例,适合执行计算机程序的处理器包括通用的和专门目的的微处理器,以及任何种类数字计算机的任何一种或多种处理器。一般地,处理器将接受来自只读存储器或随机存取存储器或二者的指令和数据。计算机的基本元件是执行指令的处理器和用于储存指令和数据的一个或多个存储器器件。一般地,计算机还包括用于存储数据的一个或多个大容量存储装置(例如磁盘、磁光盘或光盘),或者在操作上与之相连,以接受来自它的数据或者转移数据到其上或者这两者。适合体现计算机程序指令和数据的信息载体包括所有形式的非挥发性存储器,包括例如半导体存储器器件(例如EPROM、EEPROM和闪存器件);磁盘(例如内部硬盘或可移动盘;磁光盘;和CD ROM和DVD-ROM盘)。所述处理器和存储器可以补充以特殊目的的逻辑电路或者结合到特殊目的的逻辑电路内。
可以在包括后端组件(例如作为数据服务器)或者包括中间设备组件(例如应用服务器)或者包括前端组件(例如具有图形使用者界面或者网页浏览器的客户计算机,通过所述网页浏览器,使用者可以与本发明的装置相互作用)或者这样的后端组件、中间设备组件或前端组件的任何组合的计算系统内实施本发明。所述系统的组件可以通过数字数据通讯的任何形式或者介质(例如通讯网络)互连。通讯网络的实例包括局域网(“LAN”)和广域网(“WAN”)(例如Internet)。
所述计算系统可以包括客户和服务器。客户和服务器通常彼此远离,并且典型地通过通讯网络相互作用。客户与服务器的关系依靠在各自计算机上运行且彼此具有客户-服务器关系的计算机程序产生。
应该理解,前述说明意图举例说明而不是限制本发明的范围,本发明的范围由所附的权利要求书的范围来定义。其它实施方案在下述权利要求的范围内。
                       附录I
                    疏水填充得分
1)指定配体疏水基团:
将配体原子指定为Ng个“疏性基团”,各具有一组原子{j}。每个疏性基团由未受极性原子连接干扰的一组相连的碳原子定义。与极性原子相连的碳原子不包括在所述基团内。大小为1的基团对得分没有贡献。
从这一点开始,对每一基团进行打分,净分数为每一基团的分数之和。以下(步骤2-6)描述了对任何特定基团的打分。
2)计算与疏性蛋白质原子的接触:
对于在所述疏性基团内的每一配体原子j,计算与在3.0埃加配体(vdw_j)和蛋白质原子(vdw_k)的vdw半径之和(对于典型的配体和蛋白质原子来说,总和为约6埃)的距离内的疏性蛋白质原子的总接触数目cont(j)。对于与原子对(j,k)相对应的每一接触对cjk来说,储存在接触的配体和蛋白质原子之间的接触距离r_(j,cjk)和向量v(j,cjk)=rk-ri。如上所述,r_jk<=3.0+vdw_i+vdw_j。在这一方法中,记录具有最小接触距离r_jk的接触对jk_min。标记所述最小接触对的向量v0。这一向量被称为“参考向量”。
3)计算与参考向量的角度
对于在所述基团内的每个配体原子j和所有其接触点cjk=(1,cont(j)),计算在向量v(j,cjk)和参考向量v0之间的角度ang(j,cjk)。
4)计算径向接触分数
对于一个基团的给定的原子j来说,径向接触分数Sj(r)是在0和1之间的线性斜坡函数,它如下所述由配体产生的总接触cont(j)推导得到:
如果cont(j)<=20,则Sj(r)=0.0
如果cont(j)>=32,则Sj(r)=1.0                         (A1)
如果20<cont(j)<32,则Sj(r)=(cont(j)-20.0)/12.0
5)计算角度分数
对于所述基团的给定原子j和原子产生的每一接触cjk(cjk=1,cont(j)),计算角度分数Sjk(a)。为了计算这一分数,首先需要通过实际距离的简单整数舍位,将接触距离r_(j,cjk)分类(bin)成整数值m=1-6。然后角度分数是角度ang(j,cjk)的线性斜坡函数,边界由接触分类m确定:
如果ang(j,cjk)<amin(m),则Sjk(a)=0.0
如果ang(j,cjk)>amax(m),则Sjk(a)=1.0                (A2)
Sjk(a)=wt(m)*(ang(j,cjk)-amin(m))/(amax(m)-amin(m))
其中amax(m)和amin(m)是如下的依分类m而定的最大和最小角度(单位为度):
m=1-3:amin=120,amax=140
m=4    amin=120,amax=140
m=5    amin=140,amax=180
m=6    amin=150,amax=180
和wt(m)是每一角度范围的权重因子:
m=1-4:wt=1.0
m=5    wt=0.7
m=6    wt=0.6
然后计算原子j的总角度分数Sj(a),为所有Sjk(a)的简单和;
Sj(a)=∑k=1,cont(j)Sjk(a)                   (A4)
6)计算总的基团分数,总的填充分数
第i个基团的总的基团填充分数Sg(i)简单地为角度分数Sj(a)与接触分数Sj(r)的积的和;
Sg(i)=∑jSj(r)*Sj(a)                         (A5)
总的疏水填充分数Epho_pack是基团分数之和的负数;
Epho_pack=-∑i=1,Ng Sg(i)                   (A6)
                      附录II
          特殊H键回报的比例缩放(scaling)
以下描述了由于几何形状与理想几何形状不同,特殊H键分数(EHB_spec)的比例缩放。
典型的H键位于氢“供体”(例如NH键)和“氢受体”(羰基的O原子)之间。H键的质量由N-H键向量和H-O向量之间的角度θ偏离同线性(180度的角度是同线的)的程度来度量。另外,H和O原子之间的距离ROH理想地在约1.8埃的范围内。典型的H键得分函数使用参数θ和ROH的线性函数,以指定H键质量Ehb为:
Ehb=A*S(r)*S(θ)       (A9)
其中A是常数,和S(r)度量偏离所述“最佳”距离r0的偏差;
如果ROH≤r0,则S(r)=1.0
如果r0<ROH<rm,则S(r)=(ROH-r0)/(rm-r0)             (A10)
如果ROH≥rm,则S(r)=0.0
rm是最大可允许的H键距离。角度函数具有类似的形式:
如果θ≥θ_o,则S(θ)=1.0
如果θm<θ<θ0,则S(θ)=(θ-θm)/(θ0m)         (A11)
如果θ<θm,则S(θ)=0.0
其中θ0是在参数化中允许的最大角度,和θm是在参数化中允许的最小角度。
为了一个H键有资格成为特殊H键对之一,在Glide中的参数化中,它必须具有高于-0.05的Ehb值。一旦所述特殊的H键还被宣布为满足在C部分中所述的所有标准,则指定-3或-2的基础回报Ebase(一对为-3,并且第二对为-2,如果共享相同原子的两对存在的话)。然后,利用方程式(A11)形式的角度函数,按比例减少这一基础回报,其中θ0为135°和θm为120°。给所述对的每一键指定角度换算系数S1,S2。所述对的每一键的角度换算系数的乘积S1*S2是应用于所述基础回报的净换算系数,
Ehb_spec=S1*S2*Ebase        (A12)
如果配体原子形式上带电,则不采用换算系数。
第二类H键牵涉具有H原子的在环内的受体原子(典型地,N原子)。在这一情况下,当供体轴平行于环供体孤对电子方向时,H键的质量最佳。孤对电子方向近似为连接原子R1与A,和R2与A的向量之和,其中R1和R2是与环受体原子A相连的环原子。计算在孤对电子向量和N-H供体轴之间的角度θ。计算方程式(A11)形式的换算系数S1p,其中θ0为130°和θm为100°。在这些情况下,换算系数S1或S2乘以S1p,即两个角度函数确定所述对的给定H键的标度。

Claims (60)

1.一种用于计算表示所提议的配体与指定受体之间相互作用的数值VRI的计算机执行的方法,所述方法包括给在一个或多个配体原子和一个或多个受体原子之间的疏水相互作用计算机评分,所述计算机评分包括至少下述步骤:
a)将配体的亲脂原子分成含有至少3个原子的、通过共价键连接的原子组;
b)通过确定在所述组内的每一配体原子的疏水包围分数,然后将每一配体原子的数值加和以获得该组的分数,来给每一个组赋予一个疏水包围分数,并且如果所述组的大小低于预定的阈值,则将包围分数设定为0,其中所述疏水包围是指亲脂蛋白质原子对配体的亲脂原子或基团的包围;
c)作为各连接的组的疏水包围分数的和,计算应给予疏水包围的总加分。
2.权利要求1的方法,其中VRI的计算包括代表下述中至少一种的至少一个项:自由能、焓和熵。
3.权利要求1的方法,其中给疏水相互作用评分包括计算表面积得分组分SASC,它作为在配体原子和受体原子之间的疏水-疏水接触的表面积的函数而变化,且相对于使用SASC而不使用加分获得的假设的VRI,因存在疏水包围得到的加分导致VRI的增加。
4.权利要求1的方法,其中给疏水相互作用评分包括计算原子-原子对能量项,并且相对于使用原子-原子对能量项的和而不使用加分获得的假设的VRI,因存在疏水包围得到的加分导致VRI的增加。
5.权利要求3的方法,其中给疏水相互作用评分进一步包括计算原子-原子对能量项,且相对于使用原子-原子对能量项的和加上SASC项而不使用加分获得的假设的VRI,因存在疏水包围得到的加分导致VRI的增加。
6.权利要求1-5中任何一项的方法,其中通过计算机程序使用所述VRI值,并且所述方法被用于模拟为产生受体-配体络合物的结构而进行的配体向受体内的停靠。
7.权利要求6的方法,其中所述方法被用于辅助给受体-配体络合物指定一种结构。
8.权利要求6的方法,其中所述VRI被用于评估配体形成通过停靠程序产生的蛋白质-配体络合物结构的结合亲和力。
9.权利要求1-4中任何一项的方法,其中计算所述VRI值包括赋予代表在预定的受体-配体结构内的受体-配体相互作用的数值。
10.权利要求9的方法,其中所述预定的受体-配体结构由停靠程序、由分子动力学模拟或者由使用连续溶剂化模型求最小值获得。
11.权利要求1-4中任何一项的方法,该方法进一步包括,产生受体-配体络合物的结构特征的图形显示,所述结构特征因疏水包围而有助于提高VRI。
12.权利要求11的方法,该方法进一步包括产生所述络合物的计算机生成的图形显示,其中对一个或多个配体原子的疏水包围有贡献的受体原子被图形突出显示,提供了所述包围的物理图片。
13.权利要求11的方法,其中在显示中突出显示牵涉在配体的疏水包围中的受体表面。
14.权利要求1-4中任何一项的方法,其中所述方法被用于选择要实验测试的化合物。
15.权利要求1的方法,其中该方法在满足步骤(g)最后进行的前提下以任意顺序包括下述步骤中的一个或多个:
a)计算代表疏水包围加分的项;
b)计算代表静电回报的项;
c)计算因疏水区域内的氢键提高VRI的项;
d)计算代表H键对的项;
e)计算代表π-阳离子和π堆积的项;
f)计算代表标准亲脂对的项;和
g)由这些项之和计算得分。
16.权利要求1的方法,其中通过进行至少下述步骤来确定疏水包围的存在:
a)确定在配体的疏水原子的指定截止距离内的亲脂受体原子的位置;
b)确定在疏水配体原子周围的亲脂受体原子的空间和角度分布;
c)基于在疏水配体原子周围的亲脂受体原子的空间和角度分布给予加分。
16.权利要求1的方法,其中在步骤(a)中,所述连接的配体原子组包括未受极性原子连接干扰的、省去与极性原子相连的碳原子的一组连接的碳原子。
17.权利要求1的方法,其中在步骤(a)中,所述连接的配体原子组包括未受极性原子连接干扰的、省去与极性原子相连的碳原子的一组连接的碳原子。
18.权利要求1的方法,其中所述配体包括中性配体原子的组,并且该方法包括:
a)通过应用距离和角度标准,鉴定在中性配体原子和受体之间的一个或多个氢键;
b)确定与一个或多个氢键合基团相连的配体的原子;
c)基于(a)是否存在牵涉在氢键内的配体原子和与氢键合基团相连的配体原子的疏水包围,和还基于(b)在(a)内鉴定的配体原子是否因为(i)配体原子是亲脂性的,或者(ii)在没有包围的情况下所述配体原子已产生满员的氢键而受益于包围,给氢键指定一个加分。
19.权利要求18的方法,其中检测配体与受体的单一氢键,并且如果该氢键及其环境满足下述条件中的一个或多个,则给予特殊的单一氢键加分:
(a)配体的氢键供体或受体原子是:i)氮;ii)在环内;或者iii)(i)和(ii)二者;
(b)配体原子形成一组氢键供体原子的一部分,并且所述组中的所有供体被氢键合到所述受体上;
(c)所述受体是蛋白质,和参与氢键的受体原子是蛋白质主链的一部分;
(d)在脱辅基蛋白质结构内的相关的受体供体或者受体原子被很差地溶剂化;
(e)计算氢键所涉及的配体重原子和与这一原子相连的任何碳原子的所述包围项内的角度因子的和,并要求该和超过规定的阈值。
20.权利要求19的方法,其中只有在其中所述的条件(a)-(e)都被满足时,才给予单一氢键加分。
21.权利要求18的方法,其还包括检测配体与受体的单一氢键,并且如果该氢键及其环境满足下述条件,则给予特殊的单一氢键加分:计算氢键所涉及的配体重原子和与这一原子相连的任何碳原子的所述包围项内的角度因子的和,并要求该和超过规定的阈值。
22.权利要求19的方法,其中步骤(d)包括使用方格基水添加程序,以评估在受体的脱辅基蛋白质结构内的供体或受体原子的溶剂化。
23.权利要求22的方法,其中为了有资格获得所述特殊的氢键加分,要求原子具有少于3个接触水。
24.权利要求19的方法,其中部分(e)包括制造配体的小的扰动,并评估该扰动是否改进包围分数以超过所述阈值。
25.权利要求19的方法,其中当所有的标准(a)-(e)被满足时,指定约为-1.5±0.3kcal/mol的特殊的单一氢键加分。
26.权利要求18的方法,该方法包括指明配体-受体氢键对,并使用以下标准中的一个或多个来给予一个特殊对氢键加分:
(a)当键合原子被超过一个可旋转键隔开时,多个氢键的对没有获得所述特殊对氢键加分的资格,其中在这一计算中OH基作为不可旋转的形式来计算;
(b)下述类型的配体受体氢键对中的一个或多个没有获得所述特殊对氢键加分的资格:
1)质量差的H键,即<0.05HB对分数;
2)涉及相同的中性蛋白质原子的对;
3)牵涉在盐桥内的对,如果在任何一个配体原子处静电电势不低于截止值;
4)盐桥对,如果任何一个受体原子牵涉在蛋白质-蛋白质盐桥内;
5)来自NH_x x>=2基团的配体供体/供体对,其中N不是环的一部分且具有零形式电荷;
6)具有处于未配位状态的大于8个第二壳层水的形式上荷电的蛋白质原子;
7)其中蛋白质原子不在盐桥内的荷电的中性H键;
8)在配体上的不同中性受体原子的对;
9)没有资格单独地获得单一氢键加分的中性H键对;和
10)配体OH与受体H的键,如果所述受体原子的形式电荷为零,
(c)对于其中所述对的配体原子单独地具有零净形式电荷的配对来说,在对所述疏水相互作用评分为氢键对而优化的情况下,所述氢键因所述疏水包围而被给予加分。
27.权利要求26的方法,其中在进行权利要求31的步骤(c)中使用下述条件,以确定氢键对是否具有高于截止分数的疏水包围分数,以接受氢键对加分:
a)在所述对内的配体原子必须是同一环的一部分,或者对于非环配体原子来说,所述配体原子必须直接连接到同一环上;和
b)检测氢键区域的疏水性,并且将包围项的角度因子相加,和利用氢键合的配体原子对和与参与氢键的配体原子直接相连的配体环原子,该和超过所述规定的截止值;和
c)如果所述对的配体原子不是环原子但与环相连,所述和包括与所述非环配体原子为直接相邻原子的环原子。
28.权利要求26的方法,其中通过首先寻找各对并从单一的H键回报列表中排除在所述对列表中发现的任何已被给予回报的氢键,来避免对一个对和单一的特殊氢键的两次计算。
29.权利要求26的方法,其中所列出的标准a)、b)和c)中的每一个都被应用,并且另外下述标准中的每一个都被应用:
d)在所述对中的配体原子必须是同一环的一部分,或者对于非环配体原子来说,所述配体原子必须与同一环直接相连;
e)检测氢键区域的疏水性,并且如权利要求27的部分(e)所述,使用氢键合配体原子对和与参与氢键的配体原子直接相连的配体环原子,将所述包围项的角度因子相加;
f)如果所述对的配体原子不是环原子但与环相连,则所述和包括与所述非环配体原子为直接相邻原子的环原子;和
g)给予所述氢键对的加分为-3kcal/mol。
30.权利要求18的方法,其中通过至少下述步骤评价疏水包围的加分的大小:
确定单独的氢键、相关联的氢键对和三氢键组的存在,和
给单独的氢键、氢键对和三氢键组分配不同的每键值。
31.权利要求18的方法,该方法通过包括下述步骤的方法指定在配体和受体的中性原子团之间的氢键的值:
评估受体的溶剂化程度,和
根据受体溶剂化的程度,给予中性-中性氢键回报。
32.权利要求18的方法,其中两对氢键满足给予加分的标准,和这两对共享一个原子。
33.权利要求32的方法,其中给第二对的加分为-2kcal/mol。
34.权利要求26的方法,其中按照下述方程式降低指定给所述氢键对的加分,即基础回报:
·使用角度函数按比例降低所述基础回报:
S(θ)=(θ-θm)/(θ0m),如果θm<θ<θ0
其中θ0是在参数化中允许的最大角度和θm是在参数化中允许的最小、角度,如果θ≥θ0,则S(θ)=1.0,和如果θ<θm,则S(θ)=0.0
·给所述对的每一键指定一个角度换算系数S1、S2;和
·按照公式Ehb_spec=S1*S2*Ebase,将所述对的每一键的角度换算系数的乘积S1*S2应用到所述基础回报Ebase上。
35.权利要求34的方法,其中θ0为135°±5°,和θm为120°±5°。
36.权利要求31的方法,其中通过应用添加外在的水用的方格基算法,并计算在所讨论的蛋白质基团周围的第一和第二壳内这种水的数目,来评价在中性-中性氢键内蛋白质的氢键合配偶体的溶剂化。
37.权利要求18的方法,进一步包括生成络合物的计算机生成的描绘,其中在图形显示中突出因疏水包围而接受特殊加分的氢键。
38.权利要求18的方法,其中在计算机生成的图形显示中突出因疏水包围而接受特殊加分的氢键的包围。
39.权利要求38的方法,其中在图形显示中突出参与接受加分的氢键的疏水包围的受体原子。
40.权利要求38的方法,其中通过受体的疏水表面的显示,突出参与接受加分的氢键的疏水包围的受体原子。
41.权利要求18的方法,进一步包括产生络合物的计算机生成的描绘,其中在图形显示中突出与因疏水包围而接受特殊加分的氢键相连的配体原子。
42.权利要求1或权利要求18的方法,其中通过进行分子动力学模拟,并鉴定其中水分子具有不利的化学势的区域,检测能给合适的配体基团提供疏水包围的受体的区域。
43.权利要求1或权利要求18的方法,其中通过将水分子置于受体周围并检测这些水分子的包围的环境,检测能给合适的配体基团提供疏水包围的受体的区域。
44.用于建立表示配体/受体相互作用的组分的数值VRI的方法,该方法包括通过下述步骤给配体和受体之间的电荷-电荷氢键评分:
为电荷-电荷氢键设定一个缺省值,和
当一个或多个专门的预定的电荷-电荷氢键标准被满足时,在所述缺省值以上给予加分。
45.权利要求44的方法,其中所述电荷-电荷氢键标准包括下列中的一个或多个:
在确定是否给予加分中,在确定加分的数值中,或者这二者,确定配体是否具有净电荷或者是否是两性离子;
如果所述配体是两性离子,确定带相反电荷的基团之间的距离;
确定牵涉在氢键内的受体基团的溶剂化程度;
确定电荷-电荷氢键的详细几何形状;和
确定电荷-电荷氢键的静电能。
46.权利要求45的方法,其中如果两性离子的正和负基团二者形成电荷-电荷氢键,并且如果所述基团之间的距离没有超过预定的距离,则所述两性离子被指定附加的电荷-电荷加分。
47.权利要求46的方法,其中当通过两性离子形成的电荷-电荷氢键与受体的静电相互作用增加时,所述加分增加。
48.权利要求47的方法,其中当所述静电相互作用的大小增加时,所述加分从3.0±0.5kcal/mol增加到4.7±0.5kcal/mol。
49.权利要求45的方法,其中评估受体溶剂化作用,并且如果受体溶剂化作用低于预定的值,则指定一个电荷-电荷氢键回报。
50.权利要求49的方法,其中所述预定的值是在电荷-电荷氢键内牵涉的荷电受体原子周围的约9个第二壳层水,通过方格基水添加规则确定。
51.权利要求44的方法,其中评估受体溶剂化作用,并且如果受体和配体的静电能超过规定的阈值,则指定附加的电荷-电荷氢键回报。
52.权利要求44的方法,该方法包括确定在所述电荷-电荷氢键内带正电荷和带负电荷的基团的相互作用是双齿的还是单齿的,并且给双齿的键指定附加的电荷-电荷氢键回报。
53.权利要求44或52的方法,该方法包括确定所述结构是否涉及受体的多个带电荷的基团,并且如果所述结构涉及多个带电荷的基团,则指定一个特殊的加分。
54.权利要求53的方法,其中所述配体基团是羧酸根基团,并且为其与多个带正电荷的受体基团的相互作用指定的加分是1.0±0.3kcal/mol。
55.权利要求46的方法,其中通过以下步骤确定所述两性离子的电荷-电荷回报:
确定在桥连受体和配体的带电原子的受体组分周围水的数目,并在其中电荷充分水合的情况下,省略或降低电荷-电荷回报;和
将氢键分类为:a)单齿氢键;b)在配体基团内的双齿氢键;或者c)桥连一个配体基团和两个不同的蛋白质基团的双齿氢键,并基于该分类调节电荷-电荷回报。
56.权利要求49的方法,其中该方法包括使用方格基水添加规则,以评估在不存在配体的情况下所述电荷-电荷氢键的受体配偶体的溶剂化作用。
57.权利要求44的方法,其中具有超过规定截止值的数值的、在静电环境内的荷电原子被给予特殊加分。
58.权利要求57的方法,其中所述特殊加分的数值为1.5±0.3kcal/mol。
59.权利要求44的方法,其中VRI的一个组分代表电荷-电荷氢键或者相互作用,并且该组分被加和到其它得分组分上,以计算键合到受体上的配体的总自由能。
60.权利要求44的方法,其中在图形显示中突出接受所述特殊加分的电荷-电荷氢键。
CN2006800014436A 2005-03-11 2006-03-10 用于估计结合亲和力的预测性得分函数 Active CN101542284B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US66082205P 2005-03-11 2005-03-11
US60/660,822 2005-03-11
PCT/US2006/008663 WO2006099178A2 (en) 2005-03-11 2006-03-10 Predictive scoring function for estimating binding affinity

Publications (2)

Publication Number Publication Date
CN101542284A CN101542284A (zh) 2009-09-23
CN101542284B true CN101542284B (zh) 2013-05-01

Family

ID=36992285

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006800014436A Active CN101542284B (zh) 2005-03-11 2006-03-10 用于估计结合亲和力的预测性得分函数

Country Status (8)

Country Link
US (1) US8145430B2 (zh)
EP (1) EP1856244B1 (zh)
JP (1) JP4719223B2 (zh)
CN (1) CN101542284B (zh)
DK (1) DK1856244T3 (zh)
ES (1) ES2432753T3 (zh)
PL (1) PL1856244T3 (zh)
WO (1) WO2006099178A2 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107209813A (zh) * 2014-11-25 2017-09-26 国家信息及自动化研究院 用于分子结构的输入集合的相互作用参数

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006110064A2 (en) * 2006-01-20 2006-10-19 Dmitry Gennadievich Tovbin Method for selecting potential medicinal compounds
WO2008127136A1 (en) * 2007-04-12 2008-10-23 Dmitry Gennadievich Tovbin Method of determination of protein ligand binding and of the most probable ligand pose in protein binding site
US7873902B2 (en) * 2007-04-19 2011-01-18 Microsoft Corporation Transformation of versions of reports
US8160820B2 (en) 2007-05-14 2012-04-17 Shrodinger, LLC Binding affinity scoring function including factor for environs of ring or bulky rigid group
US7756674B2 (en) * 2007-08-03 2010-07-13 The Trustees Of Columbia University In The City Of New York Methods of calculating differences of binding affinities between congeneric pairs of ligands by way of a displaced solvent functional
US8510058B2 (en) 2011-04-04 2013-08-13 Schrodinger, Llc Binding affinity scoring function penalizing compounds which make unfavorable hydrophobic contacts with localized water molecules in the receptor active site
US20120252687A1 (en) * 2011-04-04 2012-10-04 Friesner Richard A Scoring Function Penalizing Compounds Which Desolvate Charged Protein Side Chains Structure
US9858395B2 (en) 2011-05-23 2018-01-02 Schrodinger, Llc Binding affinity scoring with penalty for breaking conjugation between aromatic ligand groups
GB201310544D0 (en) 2013-06-13 2013-07-31 Ucb Pharma Sa Obtaining an improved therapeutic ligand
JP6311320B2 (ja) * 2014-01-15 2018-04-18 富士通株式会社 結合構造の算出方法、及び算出装置、プログラム、並びに記録媒体
JP6671348B2 (ja) * 2014-05-05 2020-03-25 アトムワイズ,インコーポレイテッド 結合親和性予測システム及び方法
US9373059B1 (en) 2014-05-05 2016-06-21 Atomwise Inc. Systems and methods for applying a convolutional network to spatial data
WO2017075559A1 (en) 2015-10-30 2017-05-04 E. I. Du Pont De Nemours And Company Dihydroorotate dehydrogenase inhibitor compositions effective as herbicides
WO2017221250A1 (en) 2016-06-23 2017-12-28 Yeda Research And Development Co. Ltd. System and method for use in analysis of chiral molecules
CN107423570B (zh) * 2017-08-02 2021-01-08 南昌立德生物技术有限公司 快速准确计算蛋白酶与药物分子之间亲和自由能的算法
CN111696619B (zh) * 2019-03-13 2023-06-20 赣南师范大学 一种预测反应环境对反应活化能影响程度的方法
CN114512180B (zh) * 2022-02-15 2023-07-21 哈尔滨工业大学 基于蛋白质表面低熵水合层识别的蛋白质-蛋白质对接方法及装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3669704B2 (ja) 1994-10-31 2005-07-13 昭子 板井 三次元構造データベースから新規リガンド化合物を検索する方法
US6741937B2 (en) 2000-05-08 2004-05-25 Accelrys Inc. Methods and systems for estimating binding affinity
US6671628B2 (en) 2002-03-04 2003-12-30 Chemnavigator, Inc. Methods for identifying a molecule that may bind to a target molecule
JP2003263465A (ja) 2002-03-07 2003-09-19 Enkaku Iryo Kenkyusho:Kk 蛋白質結合性ペプチドの設計・選出方法
WO2003087310A2 (en) 2002-04-04 2003-10-23 California Institute Of Technology Directed protein docking algorithm
US7826979B2 (en) 2003-02-14 2010-11-02 Vertex Pharmaceuticals Incorporated Method of modeling complex formation between a query ligan and a target molecule
US7904283B2 (en) * 2003-05-13 2011-03-08 The Penn State Research Foundation Quantum mechanics based method for scoring protein-ligand interactions
US20070134662A1 (en) 2003-07-03 2007-06-14 Juswinder Singh Structural interaction fingerprint
JP4314128B2 (ja) 2004-02-24 2009-08-12 株式会社インシリコサイエンス タンパク質立体構造と誘導適合を利用したリガンド探索方法
JP2005293296A (ja) 2004-03-31 2005-10-20 Shionogi & Co Ltd 糖−タンパク質相互作用の評価方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107209813A (zh) * 2014-11-25 2017-09-26 国家信息及自动化研究院 用于分子结构的输入集合的相互作用参数
CN107209813B (zh) * 2014-11-25 2020-12-22 国家信息及自动化研究院 用于分子结构的输入集合的相互作用参数

Also Published As

Publication number Publication date
WO2006099178A3 (en) 2009-06-04
CN101542284A (zh) 2009-09-23
ES2432753T3 (es) 2013-12-05
WO2006099178A2 (en) 2006-09-21
US20070061118A1 (en) 2007-03-15
JP4719223B2 (ja) 2011-07-06
US8145430B2 (en) 2012-03-27
EP1856244A2 (en) 2007-11-21
DK1856244T3 (da) 2013-11-04
JP2008518369A (ja) 2008-05-29
PL1856244T3 (pl) 2014-03-31
EP1856244A4 (en) 2012-01-11
EP1856244B1 (en) 2013-09-25

Similar Documents

Publication Publication Date Title
CN101542284B (zh) 用于估计结合亲和力的预测性得分函数
Durrant et al. NNScore: a neural-network-based scoring function for the characterization of protein− ligand complexes
Cross et al. FLAP: GRID molecular interaction fields in virtual screening. validation using the DUD data set
Mekenyan et al. A systematic approach to simulating metabolism in computational toxicology. I. The TIMES heuristic modelling framework
Kramer et al. Evaluation of the FLEXX incremental construction algorithm for protein–ligand docking
Turner et al. Rapid quantification of molecular diversity for selective database acquisition
Teramoto et al. Supervised consensus scoring for docking and virtual screening
Li et al. A model for risk-based screening and prioritization of human exposure to chemicals from near-field sources
Bertolazzi et al. On the functional and structural characterization of hubs in protein–protein interaction networks
Prastacos An integrated land-use—Transportation model for the San Francisco region: 1. Design and mathematical structure
Chan et al. Chemical fragments that hydrogen bond to Asp, Glu, Arg, and His side chains in protein binding sites
Graham et al. An evaluation of the occupational health hazards of peptide couplers
Işık et al. Overview of the SAMPL6 p K a challenge: evaluating small molecule microscopic and macroscopic p K a predictions
Baber et al. GARD: a generally applicable replacement for RMSD
Vaidya et al. Quantitative structure-activity relationships: a novel approach of drug design and discovery
Carta et al. Unbiasing scoring functions: a new normalization and rescoring strategy
Peñarubia et al. Probabilistic seismic hazard analysis model for the Philippines
Dutta et al. Metal-binding sites are designed to achieve optimal mechanical and signaling properties
Carbery et al. Fragment libraries designed to be functionally diverse recover protein binding information more efficiently than standard structurally diverse libraries
Englebienne et al. Docking ligands into flexible and solvated macromolecules. 5. Force-field-based prediction of binding affinities of ligands to proteins
Wang et al. A generalizable machine learning potential of Ag–Au nanoalloys and its application to surface reconstruction, segregation and diffusion
Crisman et al. “Virtual fragment linking”: an approach to identify potent binders from low affinity fragment hits
Wilson et al. Electron density geometry and the quantum theory of atoms in molecules
Ke et al. 3D-QSAR and molecular fragment replacement study on diaminopyrimidine and pyrrolotriazine ALK inhibitors
Blachowski et al. Spatial and multicriteria analysis of dimension stones and crushed rocks quarrying in the context of sustainable regional development: case study of Lower Silesia (Poland)

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant