李游将电脑上密密麻麻的符号数据,运用到新药筛选上来。
提到程序员,人们往往瞬间联想到格子衬衫、双肩包、坐在电脑前敲代码等画面,而提到生物药企实验室的工作人员,人们眼前又可能会浮现出白大褂、护目镜以及一堆冰冷的实验器材。如果程序员与生物药企实验室工作人员结合呢?很多人会觉得难以想象。
其实,在成都先导药物开发有限公司(以下简称“成都先导”),就有一批“程序员”活跃其中。成都先导有一个在生物药企不常见的部门——“干实验室”,其成员几乎全部是“程序员”。但与传统意义上程序员不同的是,他们的工作主要是以成都先导的DNA编码化合物库为平台,结合生物和化学专业知识,利用人工智能,高效地找到新药研发所需的小分子化合物,从而大大减少新药筛选的时间和成本。在这个过程中,他们也要像程序员那样写代码,建立相关的数据模型。
“程序员”参与新药研发 用AI揪出潜在匹配目标
4月24日,记者走进成都先导“干实验室”。与一般的实验室不同,这里看不见身穿白大褂的实验人员,没有瓶瓶罐罐的实验器材,也没有各种名称复杂的化学试剂。办公桌、电脑便是实验室的全部配备。一眼看过去,无论是工作人员的穿着还是办公场地的布置,很难从中看出传统生物药企的影子。
然而,通过实验室工作人员李游的介绍,深藏在平凡表面背后的生物医药特点丝丝缕缕浮现,“你眼前看到的这些电脑,就是我们的实验器材。”李游说,这些电脑是用来帮助实验室人员在新药筛选过程中进行数据分析的。
“我的工作就是数据分析、算法研发、大数据分析平台搭建和应用。”李游说,DNA编码化合物库新药筛选,发现与相关靶点匹配的先导化合物,一般要经过7个步骤,数据分析是其中一个步骤。“数据分析主要是结合AI,通过序列解析和大数据分析找出与靶点匹配的潜在小分子化合物。”
李游打了一个比方——“每个小分子化合物有一个DNA标记。打个比方,这里有一盒糖纸包装统一、但口味不同的糖果。在没有品尝前,你并不知道随手拿到的糖果会是什么口味。但如果给不同口味的糖果设计带有身份标记的二维码,吃之前先扫一扫二维码,便能找到你想吃的那颗糖果。”在这个比喻里,糖果便是小分子化合物,二维码是DNA标记,扫码的过程就是实验室“程序员”进行数据解析的过程。李游说,成都先导DNA编码化合物已达到千亿级,从中找到目标对象,犹如在汪洋大海里寻找一粒沙子。“不过,通过大数据分析,定位与靶标蛋白相互作用的小分子化合物的过程却很快,一般3天左右即可完成。”
每周处理几十亿条DNA数据 新药筛选减少2/3的时间
在李游的工作电脑上,满屏都是符号与数据,让人有一种看“天书”的茫然,更别说将其运用到新药筛选上来。但在李游眼里,这些“天书”是世界上最美妙的语言之一。
“我本科是动物医学,但因为不喜欢做生物实验摆弄瓶瓶罐罐,所以后来硕博都选了生物信息专业。”博士毕业后,李游来到成都先导,成为“干实验室”中的一员。在成都先导任职一年多来,前前后后参与新药筛选也有20多个项目了,“目前针对所有内部和客户的新药筛选项目,每周至少需处理两张测序芯片约几十亿条DNA数据。”李游介绍,经过数据分析,再由实验室进行化合物合成、活性验证等几个步骤,整个新药筛选过程才算完成。
“传统的化合物库合成与筛选需要9到18个月左右,但有了‘干实验室’以后,只需要3到6个月时间,减少了约2/3的时间。”成都先导研发中心化学总监刘观赛说,药物研发速度慢,失败率高,一直是全世界药物研发企业希望解决的问题,而通过大数据和人工智能,让数据的计算模拟新药筛选、药品研发过程,预测药品的效果,可以极大避免代价高昂的临床试验失败。在刘观赛看来,人工智能应用与生物医药,将为制药业甚至整个社会带来翻天覆地的变化,在新药研发领域大放异彩,为患者带来更多治愈疾病的好药。