从选择一个靶点,到形成潜在的新药候选分子,这个过程需要多长的时间?过去的回答可能是数月,乃至数年。但在今日,来自Insilico Medicine、药明康德、以及多伦多大学的科学家们在《自然》子刊Nature Biotechnology上给出了不同的答案。利用人工智能技术,他们将这一数字缩短到了短短21天!
这一技术有望为早期药物发现带来变革。众所周知,新药研发之路并非坦途。在高达近9成的失败率面前,每一款上市新药的背后,都是平均10多年的漫长道路,以及20多亿美元的高昂开支。其中,光是早期药物发现,就占去了将近一半的成本。
为了突破这一瓶颈,业内诸多创新者在近年来不断尝试各种技术,而人工智能就是他们的选择之一:通过快速寻找到具有成药潜力的分子,人工智能有望加速新药发现的进程,并减少所需的成本。但美好的愿景之下,我们也不得不承认,由人工智能进行设计,且能够在实验中证实自身潜力的分子,还非常少见。
这正是本篇论文的一大亮点所在。在研究中,科学家们首先将DDR1设为目标靶点。这是一种在上皮细胞中表达的酪氨酸激酶,参与到了组织纤维化(fibrosis)的进程之中。为了寻找到潜在的DDR1抑制剂,研究人员们开发了一种机器学习算法,用于设计新药分子。
▲本研究的算法示意图(图片来源:参考资料[1])
具体来看,这个算法的训练用到了多个不同的数据库。其中最大的一个数据库里包含海量的分子结构,其他的数据库则分别为已知的DDR1抑制剂及其3D结构、具有激酶抑制剂活性的常见分子(作为正对照)、无法靶向激酶结构的分子(作为负对照)、以及已被医药企业申请专利的分子。
在对数据库进行优化之后,研究人员们使用了强化学习的方法,初步得到了大约3万个不同的结构。随后,他们又根据反应基团与化学空间等指标,对所得到的结构做了进一步的筛选。完成这些潜在新药分子的筛选时,距离最初确认DDR1为目标靶点,仅仅过去了21天!
接下来,就是实际检验这些分子的成药潜力了。从筛选结果中,研究人员们随机挑选出了40个结构,其中39个具有新颖性。从中,科学家们根据合成的难易程度,挑选出了6个分子,用作后续的体外与体内实验。
▲对候选分子进行药代动力学分析和作用机理探索(图片来源:参考资料[1])
体外实验结果表明,其中的2个化合物对于DDR1具有很高的抑制性。在细胞系中,这两个化合物同样展现了可喜的DDR1抑制能力,且能有效降低与纤维化进程有关的标志物。最后,研究人员们选择1号化合物进行动物实验。结果表明,无论是通过静脉注射,还是通过口服,它的药代动力学特性均令人满意。
值得一提的是,在人工智能技术与研发人员的协同下,在选定靶点的46天后,新筛选出的分子就完成了初步的生物学验证。此外,科学家们也决定公开该算法的源代码,供产业更多研发人员使用。
▲选定靶点的46天后,新筛选出的分子就完成了初步的生物学验证(图片来源:参考资料[1])
在论文的最后,研究人员们也指出,在迈入临床试验之前,由人工智能设计出的分子还有进一步优化的空间。但考虑到新药研发周期之漫长,能在早期新药发现过程中缩短时间,已是一个喜人的进步。我们也期待在人工智能的助力下,未来能够更多新药的研发得到加速,最终造福全球病患!
参考资料:
[1] Alex Zhavoronkov et al., (2019), Deep learning enables rapid identification of potent DDR1 kinase inhibitors, Nature Biotechnology, DOI: https://doi.org/10.1038/s41587-019-0224-x