复杂疾病是无数种影响的综合结果,因为基因多效性意味着任何蛋白可能在身体的不同部位发挥作用。像Pharnext这样的初创公司假设药物也可以具有多效性,它们可以与多种蛋白互动,在体内可以产生多种作用。想要发现能够解决复杂疾病的药物组合,我们必须把机器学习从海量数据中发现规律的重要能力,与疾病发生的结构化机制有机地结合在一起。
而这需要计算机科学家和生物学家之间合作关系的进化。新一代的机器学习手段能够吸收非常多的数据,并且发现超越相关性的洞见。然而,驾驭这些“深度学习”神经网络,让它们能够产生预测能力,仍然需要构筑一些精密的算法系统。
GNS Healthcare公司的创始人兼首席执行官Colin Hill先生就是构筑这些算法系统的工程师之一。他在麻省剑桥创建的公司已经花了18年的时间开发一种称为REFS的计算机系统。GNS公司已经从安进(Amgen)公司的风投部和新基公司,以及其它投资人那里募集了3800万美元,致力于构建和调试疾病的计算机模型。在最近发表的一系列研究中,GNS详细描述了REFS系统模拟像帕金森病这样的复杂疾病时表现出的潜力。
帕金森病是一种非常复杂的神经退行性疾病,它的复杂性和导致疾病的多效性因子让已有疗法的疗效非常不一致。然而对于帕金森病来说,基因缺陷导致的一系列网络相互作用具有特定的特征,而且运动能力的破坏是疾病进展最可靠的指标。通过将帕金森病患者和健康对照组的遗传信息导入REFS系统,它可以帮助GNS生成超过100个计算机模型,预测导致运动功能恶化的机制。这些模型可以帮助发现原先未知的基因突变,它们可能加快疾病恶化速度。
这只是这一模型的第一步应用。使用这些发现,GNS能够让计算机模拟5000种不同的随机对照临床试验,每一个临床试验用来预测不同治疗方法会带来什么样的疾病进展。这种迅速的检测比用真正人类临床对照试验来获得同样的结果要迅速得多。GNS公司已经与其它医药企业达成合作,应用类似的手法来筛选治疗糖尿病、ALS、多发性骨髓瘤、和乳腺癌等疾病的潜在疗法。
“我们现在具有了在计算机上创建人类患者和疾病的替代模型的能力。我们可以使用它们来对每一个药物进行检测,并且预测哪些疗法会对什么样的患者有效。”Colin Hill先生说。
这种模拟已经不再只是发现相关性。它在回答因果性的问题。如果我们将药物甲给与了特定患者,而不是药物乙,会发生什么?能够模拟并且回答这种假想问题的能力是AI领域最近才出现的新进展。根据GNS公司的技术顾问,加州大学洛杉矶分校的计算机教授和AI资深研究人员Judea Pearl博士的描述,真正的智能需要从发现规律的层面上再进一步,能够基于这些规律进行分析,推断出假想情况下会发生什么。数据本身如果与机制相关的任何理念脱节,就不能提供任何真正的洞见。
2000到3的筛选过程,AI重新定义“药物发现”
再回到Pharnext公司的例子,Cohen博士对Pharnext公司的前景十分看好。同时他也很清楚地认识到AI技术的局限性。谷歌的人工智能AlphaZero在不需要借助任何人类棋谱的情况下,可以在围棋比赛中能够战胜世界的顶尖人类棋手。然而,Cohen博士指出,围棋的规则并不复杂,AlphaZero能够完全掌握这些规则。而在生物学领域,因为多效性的存在,我们还不了解,可能永远不能了解所有的规则。
然而,精心设计的AI系统能够让Pharnext根据已知的规则来构建模型并且依靠它们来做出选择。从10000个已知药物中,药物开发模型选出了2000种专利已经过期,并且已经上市的药物,这些药物已经被监管机构认为有效和安全。
▲PXT3003的筛选过程(图片来源:Pharnext公司官网)
为了开发治疗CMT的疗法,Pharnext公司先花了一年的时间构建这一疾病的网络模型。与GNS的帕金森病模型相似,这一网络模型能够显示基因突变如何通过各种级联反应,导致神经和肌肉障碍。基于这个模型,计算机算出57个候选药物,它们靶向级联反应中的不同节点。Pharnext公司然后在体外试验中对这些药物进行检测,筛选出22款药物进行动物试验,最终找出3种药物的组合进入临床试验。而最近积极的3期临床试验结果,证实了PXT3003这款组合疗法确实对级联反应的多个节点起到了作用。
Pharnext只用了3年时间进行PXT3003的临床前开发,没有AI模型的帮助,临床前检测需要的时间将长很多,Cohen博士说,2000个药物可以构成十亿种组合,如果在使用体外试验检测这些组合将会带来无数假阳性结果和失败。
Pharnext和GNS公司的进展表明AI技术正在不断成长,它也带动了药理学的成长。人工智能发展的一个重要分界点,是拥有推断因果性的能力,并且用它来探索假想问题的答案。这些公司的计算机模型正在沿着这一方向进发。
在新药研发成本动辄上亿美元的今天,AI驱动的“老药新用”可能帮助医药企业从已经花费上千亿美元研制的药物中挖掘更多的价值。“你不一定需要设计新药,”Cohen断言:“我的感觉是只需要50种药构成不同的组合,就可以治疗所有疾病。”这将意味着我们需要改变“药物发现”的定义。