日前,《自然》杂志发表了一篇文章,斯坦福大学的科学家借助人工智能为液体活检领域带来一项重要进展。他们开发出一种机器学习模型,通过分析血液中的DNA突变,可以识别出早期肺癌患者。
肺癌是发病率和致死率最高的癌症,每年有200多万人死于肺癌。虽然随着临床诊治技术的提高,肺癌的生存率有所提升。但还有不少患者确诊时就是中晚期,大大降低了生存机会。
目前,肺癌的推荐检测方法是CT扫描,但做CT不仅昂贵,而且有较高的假阳性率。因此,科研人员转向研究更加精准而简单方便的筛查手段,比如通过液体活检技术来“验血测癌”。
ctDNA检测是液体活检技术其中的一种,通过检测循环肿瘤DNA(释放到血液中的肿瘤DNA片段)就能了解肿瘤细胞内的基因突变情况。目前主要方法有:数字PCR、BEAMing 技术、标记扩增深度测序(TAM-Seq)、癌症个体化深度测序(CAPP-Seq)。
然而,癌症的发生是一种极为复杂的、动态发展的过程,大部分恶性肿瘤都是在中晚期才被发现。早期阶段血液中的ctDNA还很少,有研究显示,大多数I期肺癌患者血液内ctDNA水平不到0.1%。
因此,想要从血液中捕获到早期癌症的蛛丝马迹,就如同在宇宙中探测到来自外太空的微弱信号一样困难。
而且,如果血液中的ctDNA数量不足,液体活检也不一定能捕捉到这些基因突变,结果就可能出现假阴性。这些都对ctDNA检测早期肺癌带来了巨大的挑战。
为把ctDNA检测应用到癌症早期筛查中,斯坦福大学的马克西米利安·戴恩(Maximilian Diehn)和Ash A. Alizadeh教授等人改进了现有的ctDNA检测技术。通过癌症个体化深度测序(CAPP-Seq)来捕获患者血液样本中极少量的ctDNA,进而来检测与非小细胞肺癌相关的突变。
首先,在确定肺癌来源的ctDNA与正常细胞释放的DNA片段突变的差别后,研究团队开发了一种名为“Lung-CLiP”的人工智能程序。这套系统把分子测序与机器学习整合在一起,训练AI“验血”。
研究人员先给模型提供了104例早期非小细胞肺癌患者样本和56例非癌症的对照样本,并且这些对照组在年龄、吸烟史等因素上同属于肺癌高风险人群。
训练完毕后,研究人员通过另一组由46个早期病例和48例对照的独立队列,来验证Lung-CliP的筛查能力。
在测试过程中,该系统发现了63%的1期肺癌患者肿瘤。结果虽然不如CT扫描,但可以作为患肺癌高危人群的初步筛查手段。如果患者得到阳性结果,则建议他们进行更复杂的检测。
研究人员指出,目前基本没有针对高危患者的筛查,而这种筛查每年可能会延长一千多人的生命,甚至可以用来测试其他癌症。
虽然这项检测还不够完美,但意味着人们有望识别出处于早期阶段的大部分肺癌,未来治愈的几率也会大大增加。
很多肺癌患者都是因为确诊晚了而加速了死亡进程,但这项利用机器学习的新研究为我们提供了一种有前景的早筛方法。期待在经过更大规模的验证后,人工智能助力的液体活检技术可以帮助更多人早期发现癌症,挽救更多生命。