近日,来自瑞士洛桑联邦理工学院(EPFL)的科学家们建立了一个名为ShiftML的机器学习程序,用来预测分子中的原子在磁场中的移动状况。这项研究发表在了《Nature Communications》上,表明AI可以帮助化学家们用比传统建模方法更快的方式,来破解晶体的分子结构。
如今的许多药物都是以粉末状固体的形式生产出来的。但是,要想充分了解药物中的活性成分进入体内之后会如何表现,科学家们需要知道它们的确切原子结构,通常会采用核磁共振和密度泛函理论相结合的技术。
核磁共振技术通常用于探测原子之间的磁场,并确定相邻原子之间是如何相互作用的。然而,通过核磁共振测定完整的晶体结构,需要极其复杂且非常耗时的量子化学计算,这对于结构非常复杂的分子而言难度非常大,同时需要配合密度泛函理论(DFT)技术来进行计算工作。DFT技术使用复杂的量子化学计算来映射特定区域内的电子密度,这个过程中需要进行非常大量的计算。
为了优化这个过程,研究人员开发出了一个名为ShiftML的机器学习工具,可以用更快的速度来完成计算工作,并且在某些情况下可以像DFT程序一样准确地执行。研究人员利用来自Cambridge Structural database的数据对ShiftML进行了训练,其中2000个化合物结构用于对ShiftML的训练和验证,另外500个用于对其进行测试。该数据库包含数千种化合物计算得出的DFT化学位移,其中每一个化合物都由不到200个原子组成。研究人员表示,即使对于相对简单的分子,ShiftML的计算速度也比现有的方法快了将近1万倍。
对于更加复杂的化合物,这一优势将会更加明显。举例来说,ShiftML对一个分子的化学位移进行计算,这个分子由86个原子构成,其化学元素和可 卡 因相同,但排列成了不同的晶体结构。整个计算过程花费的CPU时间不到一分钟。相比之下,使用DFT技术计算同样一个分子的化学位移,需要的CPU时间大约为62至150小时。
研究小组希望未来的ShiftML可以用来辅助药物设计工作。“这项研究是非常令人兴奋的,因为大幅度加速计算时间可以让我们能够覆盖更大的构象空间,并准确界定那些以前无法确定的结构,”研究论文的共同作者之一、EPFL的化学教授Lyndon Emsley博士表示:“ShiftML可以让现代的大多数复杂药物分子触手可及。”
如今,ShiftML已经可以开源使用,任何人都可以在平台上上传分子,并获得其核磁共振特征。