Daniel Cohen博士是世界著名的遗传学家和现代遗传学的先驱。他在法国Généthon实验室的工作对人类基因组图谱的发布做出了杰出的贡献。随后,他将大数据和自动化引入基因组学的研究,他和他的团队第一次证明可以用超快速计算来加快DNA样本的分析。
然而,在基因组学出现25年后,它给世界带来的革命性医疗突破却不如很多人的预期。如今,Cohen博士是一家名为Pharnext的法国医药公司的首席执行官。在他看来,基因多效性(pleiotropy)是让药物研发人员在攻克世界上的顽疾时一筹莫展的原因之一。“身体中任何蛋白都有很多功能,”他说:“就好比你作为一个人在社会中有很多功能。”
Cohen博士不但意识到基因多效性的重要性,而且他认为借助人工智能(AI),Pharnext和其它医药公司在不久的将来,能够利用它来开发创新药物组合,治疗多种疾病。
老药新用,AI助力开发创新组合疗法治疗罕见病
在Pharnext公司,Cohen博士和他的团队使用AI赋予了“老药新用”新的定义。他们可以从已有药物中发现创新药物组合,让组合疗法产生单个成分无法达到的治疗效果。他们的长远目标是利用机器学习来精简药物开发的过程,更为有效地构建药物研发管线。
与Pharnext公司拥有相同理念的公司还包括像谷歌和IBM这样的科技巨头,以及像Insilico Medicine,Recursion Pharmaceuticals,和BenevolentAI这样的初创公司。它们都深入投资AI工具,使用它们来分析上百万药物样本和患者数据,从中发现具有重要意义的规律。
而Pharnext公司10多年来应用AI解决医学问题的努力达到了一个重要的里程碑。去年10月,Pharnext开发的组合疗法PXT3003,在治疗腓骨肌萎缩症1A亚型(Charcot-Marie-Tooth disease,CMT1A)的3期临床试验中获得了积极结果。CMT1A是一种神经退行性疾病,致病的主要原因是患者携带的PMP22基因拷贝扩增,导致PMP22蛋白水平上升。这会导致保护神经的髓鞘损伤,神经也会逐渐死亡,肌肉出现萎缩。
3期临床试验结果表明PXT3003不但能够稳定CMT患者的病情,而且能够帮助细胞再生。患者的两项残疾检测指标出现了统计显著改善,而其它现有疗法只能延缓患者衰退的速度。基于这些结果,FDA今年2月授予了这一疗法快速通道资格,这款创新组合疗法有望在2020年上市。值得一提的是,这款在研新药已经在中国获得了优先审评资格,有望加速进入中国,为CMT1A患者造福。
这不仅是治疗CMT方面迈出重要一步,而且人工智能缩短药物开发路径的能力具有深远的影响。临床前检测和临床试验通常需要8-10年的时间,从头开始开发一款创新药可能为这一过程再加上7年以上的时间。而PXT3003的开发过程与之相比简洁了许多,AI帮助Pharnext选择了三款已有药物构成了新的组合:巴氯芬(baclofen)是一款肌肉松弛剂;纳曲酮(naltrexone)用来治疗阿 片类药物依赖性;和山梨糖醇(sorbitol)通常用作泻药。因为这些药物已经被广泛使用,Pharnext公司可以跳过检验安全性的1期临床试验,并且消除了“从头开始”的药物开发阶段。
除了这一研发项目之外,Pharnext还将进行治疗阿兹海默病的2期临床试验和治疗肌萎缩性脊髓侧索硬化症(ALS)的2期临床试验,治疗这两种疾病的在研疗法也是利用AI从已有药物中构建的新组合疗法。如果这些试验获得成功,这种药物开发模式可能掀起“老药新用”的热潮。
基于网络理论,人工智能帮助解决生物学的复杂性
在现代遗传学研究的初期,几乎没有人预见到疾病生物学蕴含的巨大复杂性。在人类基因组图谱最初完成时,人们以为获得了人体如何工作的一本说明书。根据基因组图谱,我们就能够找到解释特定疾病的那个基因,并且帮助发现治愈疾病的疗法。
一定程度上说,这些研究确实为我们带来了无上的瑰宝。例如遗传学家Nancy Wexler博士通过研究委内瑞拉亨廷顿病患者的家族史,最终发现了在单个基因上的突变能够预测一个人会不会得上这一疾病。
然而,科学家们很快发现基因与疾病之间的联系并不总是那么简单,像癌症和阿兹海默病这样的复杂疾病并不是因为一个基因的突变而产生。如今,Cohen博士和其它有识之士认为“化繁为简”的科研方式与药物开发的效率下降之间有着重要的联系。这种效率下降导致一款新疗法获得FDA批准的成功率只有10%,而且药物开发成本迅速上升。
近年来,科学家们开始在网络理论的帮助下开始解决生物复杂性的问题。网络理论的著名科学家,东北大学(Northeastern University)的Albert-László Barabási博士认为,疾病就像一个坏信号通过网络从基因传播到蛋白,再传播到细胞和组织,直到所有对网络的扰乱最终表现为我们通常熟悉的疾病症状。
复杂疾病是无数种影响的综合结果,因为基因多效性意味着任何蛋白可能在身体的不同部位发挥作用。像Pharnext这样的初创公司假设药物也可以具有多效性,它们可以与多种蛋白互动,在体内可以产生多种作用。想要发现能够解决复杂疾病的药物组合,我们必须把机器学习从海量数据中发现规律的重要能力,与疾病发生的结构化机制有机地结合在一起。
而这需要计算机科学家和生物学家之间合作关系的进化。新一代的机器学习手段能够吸收非常多的数据,并且发现超越相关性的洞见。然而,驾驭这些“深度学习”神经网络,让它们能够产生预测能力,仍然需要构筑一些精密的算法系统。
GNS Healthcare公司的创始人兼首席执行官Colin Hill先生就是构筑这些算法系统的工程师之一。他在麻省剑桥创建的公司已经花了18年的时间开发一种称为REFS的计算机系统。GNS公司已经从安进(Amgen)公司的风投部和新基公司,以及其它投资人那里募集了3800万美元,致力于构建和调试疾病的计算机模型。在最近发表的一系列研究中,GNS详细描述了REFS系统模拟像帕金森病这样的复杂疾病时表现出的潜力。
帕金森病是一种非常复杂的神经退行性疾病,它的复杂性和导致疾病的多效性因子让已有疗法的疗效非常不一致。然而对于帕金森病来说,基因缺陷导致的一系列网络相互作用具有特定的特征,而且运动能力的破坏是疾病进展最可靠的指标。通过将帕金森病患者和健康对照组的遗传信息导入REFS系统,它可以帮助GNS生成超过100个计算机模型,预测导致运动功能恶化的机制。这些模型可以帮助发现原先未知的基因突变,它们可能加快疾病恶化速度。
这只是这一模型的第一步应用。使用这些发现,GNS能够让计算机模拟5000种不同的随机对照临床试验,每一个临床试验用来预测不同治疗方法会带来什么样的疾病进展。这种迅速的检测比用真正人类临床对照试验来获得同样的结果要迅速得多。GNS公司已经与其它医药企业达成合作,应用类似的手法来筛选治疗糖尿病、ALS、多发性骨髓瘤、和乳腺癌等疾病的潜在疗法。
“我们现在具有了在计算机上创建人类患者和疾病的替代模型的能力。我们可以使用它们来对每一个药物进行检测,并且预测哪些疗法会对什么样的患者有效。”Colin Hill先生说。
这种模拟已经不再只是发现相关性。它在回答因果性的问题。如果我们将药物甲给与了特定患者,而不是药物乙,会发生什么?能够模拟并且回答这种假想问题的能力是AI领域最近才出现的新进展。根据GNS公司的技术顾问,加州大学洛杉矶分校的计算机教授和AI资深研究人员Judea Pearl博士的描述,真正的智能需要从发现规律的层面上再进一步,能够基于这些规律进行分析,推断出假想情况下会发生什么。数据本身如果与机制相关的任何理念脱节,就不能提供任何真正的洞见。
2000到3的筛选过程,AI重新定义“药物发现”
再回到Pharnext公司的例子,Cohen博士对Pharnext公司的前景十分看好。同时他也很清楚地认识到AI技术的局限性。谷歌的人工智能AlphaZero在不需要借助任何人类棋谱的情况下,可以在围棋比赛中能够战胜世界的顶尖人类棋手。然而,Cohen博士指出,围棋的规则并不复杂,AlphaZero能够完全掌握这些规则。而在生物学领域,因为多效性的存在,我们还不了解,可能永远不能了解所有的规则。
然而,精心设计的AI系统能够让Pharnext根据已知的规则来构建模型并且依靠它们来做出选择。从10000个已知药物中,药物开发模型选出了2000种专利已经过期,并且已经上市的药物,这些药物已经被监管机构认为有效和安全。
为了开发治疗CMT的疗法,Pharnext公司先花了一年的时间构建这一疾病的网络模型。与GNS的帕金森病模型相似,这一网络模型能够显示基因突变如何通过各种级联反应,导致神经和肌肉障碍。基于这个模型,计算机算出57个候选药物,它们靶向级联反应中的不同节点。Pharnext公司然后在体外试验中对这些药物进行检测,筛选出22款药物进行动物试验,最终找出3种药物的组合进入临床试验。而最近积极的3期临床试验结果,证实了PXT3003这款组合疗法确实对级联反应的多个节点起到了作用。
Pharnext只用了3年时间进行PXT3003的临床前开发,没有AI模型的帮助,临床前检测需要的时间将长很多,Cohen博士说,2000个药物可以构成十亿种组合,如果在使用体外试验检测这些组合将会带来无数假阳性结果和失败。
Pharnext和GNS公司的进展表明AI技术正在不断成长,它也带动了药理学的成长。人工智能发展的一个重要分界点,是拥有推断因果性的能力,并且用它来探索假想问题的答案。这些公司的计算机模型正在沿着这一方向进发。
在新药研发成本动辄上亿美元的今天,AI驱动的“老药新用”可能帮助医药企业从已经花费上千亿美元研制的药物中挖掘更多的价值。“你不一定需要设计新药,”Cohen断言:“我的感觉是只需要50种药构成不同的组合,就可以治疗所有疾病。”这将意味着我们需要改变“药物发现”的定义。