FEP是什么?对小分子的药物设计有什么帮助?FEP适合fast-follow/first-in-class的项目么?
在回答这些问题以前,我们先来纠正一个很多人会犯的一个错误:
CADD(计算机辅助药物设计)里的分子对接(docking)是药物设计人员最常使用的功能。据我所知,有不少人会将计算结果的打分值(Scoring)作为分子好坏的标准。
下图来源于薛定谔公司Dr. Jenny Chambers的《Introduction to Structure-Based Drug Design》。图里说的很清楚,对接的打分结果和活性(IC50,Kd,EC50)无关,也不能用来对分子的好坏进行排序,仅能作为富集分子的工具。
Docking因为其打分函数不准确以及采样不足限制了这种方法的精度。有其他的CADD工具可以实现么?可以比较准确的预测化合物的活性(结合自由能)?比如基于分子动力学的MM/PB(GB)SA?
浙江大学药学院的侯廷军教授在这一领域研究多年,在最新的Review中(Chem. Rev. 2019, 119, 16, 9478–9508),侯教授认为MM/PB(GB)SA在小分子药物研发中的作用主要有两类:①基于对接的虚拟筛选后的再评估②精确分析小分子-蛋白质的相互作用。
关于MM/PB(GB)SA的预测精度,文章中是这么说的:
"However, they cannot serve as a basis for developing more accurate methods and predict true drug candidates in drug design without experimental verification because of their relatively limited accuracy (compared with FEP and TI)."
这也和其他业内专家的观点一致,“对于MM/PB(GB)SA的预测能力是不做预期的”
那FEP和TI又是什么呢?
FEP:Free energy perturbation(自由能微扰)
TI:Thermodynamic integration(热力学积分)
FEP、TI以及MM/PB(GB)SA都是常用的自由能计算方法,关于FEP/TI【自由能专题1:原理与方法】文章中是这样介绍的:
自由能微扰法:Free Energy Perturbation (FEP) 和热力学积分法:Thermodynamic Integration (TI)。这类方法从原理上来讲比较严格,计算结果也较为准确,但需要长时间的数据采集,对计算体系有严格的限制,只能适合较为简单,而且这类方法一般只能计算两个配体之间相对结合自由能,因此在以往的药物设计中的应用受到了很大的限制,但是得益于近些年计算机性能的迅猛发展,由于这类方法计算的准确度高,已成为药物设计中的研究自由能的主流方法。
而两者又有一定的差别:TI 是对FEP的模拟数据的另一种分析方法,分子动力学模拟的轨迹和能量数据,经过FEP或TI分析,计算出过程的自由能变。而 TI 的缺陷在于,其原理上难以分析通过REST2等增强采样方法获得的数据,因此限制了在结合模式复杂、口袋柔性大的复合物等场景的应用。TI暂且不表。
FEP的理论基础最早可以回溯到1930年代的Peierls的工作(Eur. Phys. J. A 1933, 80, 763?791),1954年,美国马里兰大学的理论物理学家和化学家Robert Zwanzig推导出了FEP的主方程:
自由能微扰(FEP)方法直到1980年代才引起计算机辅助药物设计(CADD)领域的关注:1986年,休斯顿大学的J. Andrew McCammon发表了题为“Dynamics and Design of Enzymes and Inhibitors”的文章(J. Am. Chem. Soc. 1986, 108, 13, 3830–3832),这代表着FEP方法在CADD领域首次应用。1989年,加州大学旧金山分校的Peter Kollman教授首次进行了FEP的前瞻性研究,对三肽类嗜热菌蛋白酶抑制剂的活性进行了预测(J. Am. Chem. Soc. 1989, 111, 15, 5649–5658)。
解释下:关于FEP的回顾性研究(Retrospective study)和前瞻性研究(Prospective study)区别:回顾性研究是先有实验数据,后再进行FEP计算,是一种验证性的工作;前瞻性研究是先有FEP计算,后再进行实验验证,是一种预测性的工作。
随后,FEP方法在学术界得到了进一步的应用,比如耶鲁大学William L. Jorgensen教授在20世纪初开始,发表了多篇运用FEP方法辅助Xa因子抑制剂/非核苷类HIV-1逆转录酶抑制剂研发的文章。
不过,受制于力场的准确性、采样算法的效率以及算力,一直没有在制药工业界获得广泛的运用。随着力场、采样算法、算力等方面的发展,薛定谔公司在2014年发布了商业化FEP计算工具FEP+。
随后薛定谔公司在2015年的JACS上发表了关于FEP计算预测亲和力的重磅文章(J. Am. Chem. Soc. 2015, 137, 2695?2703),他们针对8个靶点/199个小分子配体的亲和力进行了预测,并且和实验值进行比较,达到了非常高的相关性。下图的虚线代表 1.0 kcal/mol的误差,折算下来是5-10倍的IC50活性差距:这意味着FEP最终实现了药物设计人员梦寐以求的、化学精度的预测。
同时,文章中也对比了对接打分(Glide SP)和MM-GBSA预测的相关性,结果显而易见。
再解释下:或许很多人会疑惑结合自由能和活性(Ki,Kd,IC50)到底啥关系?【CADD | 自由能微扰简介】这篇文章给出了详细的解释,由于公式太过复杂,仅截取部分内容,有兴趣的阅读全文哈。
关于自由能提升(kcal/mol)和活性改善相关性的详细计算过程见图,来源,B站:
随着薛定谔上述文章的发表,可被工业界应用的FEP技术引起了各大制药公司的兴趣,2016年的5月和8月,各大制药公司进行了多次的FEP研讨会,并将讨论的内容和结论发表在期刊上(J Comput Aided Mol Des,2016, 30, 1139–1141)。
上述的制药公司包括:默克/辉瑞/安进/拜耳/强生/诺华/BMS/GSK/福泰
各大BigPharma不仅仅是感兴趣,发现真的好用,可以加速研发之后,也逐渐将FEP作为重要的新药研发工具,并发表了多篇有影响力的期刊文章。
比如,辉瑞的科学家利用FEP技术对17个不同五并六元杂环骨架的SYK抑制剂进行预测,并通过实验得到验证,得到了细胞活性提高10倍的化合物(ChemMedChem 2016, 11, 217 – 233)。
罗氏的科学家在JMC上发表了一篇很有意思的文章(J. Med. Chem. 2017, 60, 6, 2485–2497)。为了探索组织蛋白酶L的S2口袋,依据不同的伯胺共构建了3325个分子的化合物库。利用四种方法进行筛选,分别是①FEP计算(FEP+),②药物化学家基于之前SAR进行的挑选(MC,Med Chem),③专家通过结合模式以及相互作用的分析,进行人工挑选(MM,SBDD),④基于MAB力场优化的对接来预测的分子结合模式,再经过人工挑选(DOMF,Docking)。
经过实验测试之后的结果,下图更直观。和reference化合物相比,FEP筛选出来的化合物实验结果更好,10个化合物有8个超过reference,远远超过其他三种方法。
强生的科学家在进行PDE2A抑制剂开发的hit-to-lead阶段,利用FEP预测了265个设计的分子,并最终合成了100个化合物,经过生物测试评估,得到了高活性、高选择性、高BBB渗透、in vivo验证的先导化合物46(J. Med. Chem. 2020, 63, 21, 12887–12910)。
文章中,也对比了FEP和docking的效果,直接搬运下:
"FEP correctly identified 90% (9 out of 10) of the 10 most active amongst its best ranked 10, compared to 20% (2 out of 10) from docking."
阿斯利康的科学家在EED抑制剂的后期优化阶段,利用FEP对苯并二氢呋喃环上7位的R取代基(下图)进行了预测,并通过实验验证,得到了理化性质/细胞活性提高的化合物(Bioorg. Med. Chem. Lett. 39 (2021) 127904)。
默克的科学家最近发表了非常重要的利用FEP加速研发的回顾性文章(J. Chem. Inf. Model. 2020, 60, 11, 5457–5474)。详细的介绍参见【自由能方法及应用(二)结合自由能计算在默克药物研发实践中的大规模前瞻性评估】。这里直接搬运一下部分内容:
“从2016年到2019年,作者前瞻性地将FEP+应用于12个靶点和23个化合物系列,进行了超过35,000个独立扰动计算。最终,作者获得了6,000多个化学实体的有效预测,合成和测试了400多个预测得到的新颖分子,产生了大量的前瞻性数据,提供了该方法在典型小分子药物发现的实际流程中准确性的详细评估。”
拜耳在2014年底就在内部的研发中部署了FEP+,截止2016年的数据,已有80%的项目、多达16个靶点使用了FEP,40%的化学家会经常使用FEP计算(2016 Workshop on Free Energy Methods in Drug Design)。
葛兰素史克的科学家同样在2016年的workshop上披露了内部使用FEP的情况。超过800个化合物进行了FEP计算,下图左则是8个项目251个化合物实验值/预测值拟合的情况,可以看到大部分化合物的预测还是相当准确的(2016 Workshop on Free Energy Methods in Drug Design)。
优时比(UCB BioPharma)的Zara Sands博士在European Alchemical Free Energy Workshop 2019会议上介绍了优时比内部使用FEP的经验和具体案例。
各大BigPharma已经广泛的、深入的使用FEP功能,FEP计算也已成为药物研发必备工具之一了;那众多的Biotech公司呢?
薛定谔就不用说了吧,作为最早推出商用化FEP工具“FEP+”的Biotech,不仅发表了大量的高水平的FEP文章,加速了自由能计算领域的发展;并且在新药项目中,早已把FEP+运用的炉火纯青,并且陆续开发了诸如protein FEP,AL-FEP等研发利器。
很多Biotech公司(Nimbus、Agios、硕迪生物 etc)或者BigPharma(礼来、赛诺菲)和薛定谔合作的项目中,也借助了薛定谔的FEP+等计算工具。
RAPT Therapeutics的科学家在FEP的帮助下,得到了高体外/体内活性的USP7抑制剂(J. Med. Chem. 2020, 63, 5398?5420)。
Blueprint Medicines的Aysegul Ozen博士在Free Energy Workshop 2020上介绍使用FEP和protein FEP加速激酶抑制剂研发的具体案例,建议去Youtube上找来看看,非常棒的分享(Youtube搜索Aysegul Ozen)。
此外,Aysegul Ozen还介绍了他们验证和部署FEP的情况,目前已经在内部5个项目中成功应用了FEP。
Silicon Therapeutics在STING抑制剂研发过程中,从近2万个分子中,经过相对自由能计算(FEP)预测,最终挑选了200个分子进行合成,并最终获得了临床候选分子SNX281(Youtube,Physics-Driven Discovery of SNX281);SNX281正在进行和K药联用的抗肿瘤一期临床研究。
Relay therapeutics则把自由能计算(FEP)作为Dynamo?平台中Physics-based simulations的重要组成模块。
那FEP到底能做什么?
自由能微扰(Free Energy Perturbation,FEP)计算可用来预测同系物的相对结合自由能变化。在FEP计算中,分子通过非物理(“炼金术”)途径逐渐转变为结构上密切相关的类似物。通过对这些互相转化的终态之间的自由能差(ΔΔG)的计算评估,可以获得与实验值相比约1kcal/mol的预测精度。下图即为相对自由能计算的热力学循环图,也是FEP计算重要的基本原理。
FEP的典型应用场景有哪些?这里借用下薛定谔公司的Presentation。
简单说,就两类:①提升化合物的活性;②保持化合物活性的基础上优化其他成药性质。
所以,回到文章开始的问题,fast-follow/first-in-class的项目是非常适合用FEP的。
FEP算的到底准不准呢?
虽然已经有众多公司在使用FEP加速新药研发了,但是我想很多人看到这里最大的疑问还是FEP算的准不准?
首先,FEP已是业界公认的精度最高的计算结合自由能的方法,换句话说,就是目前预测活性最准的方法了,已经有非常多的研究文献确证了这一点。
其次,FEP计算的精度受多种因素影响。
例如:强生的科学家在用FEP指导优化BACE1抑制剂的过程中,发现FEP预测的准确度和MD的模拟时长(1ns~20ns;2ns~40ns)密切相关(J. Chem. Theory Comput. 2017, 13, 1439?1453 / J. Chem. Inf. Model. 2016, 56, 9, 1856–1871)。
例如:强生的科学家们在开发脂肪酸酰胺水解酶(FAAH)抑制剂的过程中,发现了一个有趣的现象(J. Chem. Theory Comput. 2018, 14, 5815?5822)。抑制剂左右两边片段(下图虚线方框)用FEP预测的准确性是不一样的,左边共32个化合物,相关系数0.79;右边共16个化合物,相关系数只有0.02。
例如:强生(对,还是强生)的科学家在优化PDE2抑制剂的过程中,发现苯环/吡啶环上的取代基大小会影响蛋白质中Leu770的朝向和水分子的有无(下图),而晶体复合物中的这种细微差别对FEP计算的预测准确性有非常大的影响(Sci Rep. 2018 20;8(1):4883.)。
例如:力场的影响(Free Energy Workshop 2016):
例如:复合物的影响(Alchemical Free Energy Workshop 2019):
更多的影响因素讨论,建议精读上文提到的默克的科学家发表的利用FEP加速研发的回顾性文章(J. Chem. Inf. Model. 2020, 60, 11, 5457–5474)。
借业内专家的观点总结一下,影响FEP计算精度的因素有很多,主要可以分为2个方面的因素:
①算法和程序方面的因素:力场参数的准确性,采样算法的效率,perturbation scale的设计,?些极端情况下的特殊算法稳定性,模拟时长等。
②使用者经验方面的因素:复合物初始结构的准确性,Ligands变化的幅度,Ligands Alignment和Atom Mapping的合理性检查,Perturbed Network的设计等。
关于算的准不准,再放张默克的图吧(Workshop on Free Energy 2018)。图片里的曲线是Gartner技术成熟度曲线,也可以说是关于认知的达克效应曲线。默克使用FEP两年之后的summary可以这样解读:
Technology Trigger - 技术启蒙 -- 原来FEP代表的是这个意思,可以这样用~
Peak of Inflated Expectations - 期望膨胀之巅 --牛X,最准的计算方法
Trough of Disillusionment - 质疑、绝望之谷 -- 在我的项目上预测的根本不准啊,是不是骗人的啊~
Slope of Enlightenment - 开悟之坡 -- 原来应该这样用,要这样设置;果然,算的很准~
Plateau of productivity - 加速研发 -- 所有合适的项目分子合成前,先用FEP算一把;开搞~
总之,FEP是个非常好的工具,但是也需要学习、实践如何去用好它,发挥它的最大价值。
看到这里,也许你想试试FEP,那如何开始FEP计算呢?
(这里指前瞻性计算,理想情况下最好先做下回顾性计算)
简单的说,你需要准备
1. 含有小分子的某靶点共晶复合物(最好有,或经过专家复核的高精度对接结果)。
2. 基于共晶复合物中小分子而设计的、结构类似的新分子
然后就需要一款可以进行FEP计算的专业软件了,比如,商业化的软件:薛定谔的FEP+、Cresset的Flare V3;或者开源软件,比如分子动力学模拟软件Gromacs。
再或者, 你也许可以考虑下深势科技的Uni-FEP
Uni-FEP能够能够兼顾CADD专家及药物化学的先导化合物优化需求,提供:
1. 一站式自动化的蛋白准备、配体准备、计算力场参数、分配电荷、弛豫与平衡体系的全自动工作流的端对端服务,最小化用户工作;
2. 更精确且适配的分子力场
3. 多种配体对齐方式
4. 自动生成微扰图,且微扰图可自定义修改;
5. REST2增强采样,提高精度与效率;
6. 基于 MBAR 统计方法计算相对结合自由能
7. 计算结果的多种可视化、交互式分析
8. 可扩展的计算资源
9. 相比FEP+,更高的性价比;
10. 与Hermite其他功能组成完整的从靶点结构到苗头化合物筛选,再到先导化合物优化的整体解决方案;
11. 完善的售后服务及专家交流群
简而言之,Uni-FEP作为为国内最早公开发布测试的FEP计算模块(可能也是国内既“看”的到,也用的到、屈指可数的FEP产品),深势科技团队在算法设计、动力学引擎等方面储备大量的研发经验,尤其在前面提到的影响FEP计算精度的力场和采样方面形成了比较显著的技术壁垒,同时深势科技的产品团队对计算流程中大量的指令操作充分优化,开发了易用简洁的可视化界面,使其真正具备了“工业级”的工具能力。
国内已经有多家企业开始使用Uni-FEP:翰森、恩华、泓博、加科思,更多的合作企业即将披露~