“在当今的转译基因组研究中,最大的挑战莫过于如何进行解析。”华盛顿大学圣路易斯医学院(Washington University School of Medicine in St. Louis)基因组技术促进中心联合主任Seth Crosby说。
通过现有的技术,人们可以轻而易举地从基因组中收集信息,而棘手的方面在于如何解析这些信息的临床相关性。Crosby解释说:“可以说,某个特定基因的变异对病人的健康或治疗选择具有这样、那样的影响。”
Crosby举了个例子:华盛顿大学临床基因组实验室的基因组和病理学服务部门提供的“下一代测序模块”是经过临床验证的,包括45个肿瘤相关基因。这一模块被广泛用于鉴别肿瘤和指导癌症病人的治疗。
“我们不得不查阅几百篇文献。”Crosby说,“只是为了搭建一个临床级别的数据库,其中包含这些基因中发现的各个临床相关突变的权威解释。这花费了理学和医学博士们几百个小时的时间去研读文献,鉴定相关的信息。”
Crosby发现,随着时间的推移,临床医生可能会开始掌握哪些基因组的变化会影响病人的健康,而哪些是无害的。
“一旦这些相关和不相关基因的列表范围逐渐缩小,而我们也领会到哪些多态性是重要的,这就可以用来打造非常廉价的芯片,有助于疾病的检测。”他说。
除了经济上的优势以外,基因芯片也提供了可掌控的数据数量。就像Crosby所解释的,“大部分基因组是没有变异的”。因此,通过基因芯片,“我们可以只收集我们所需要的数据。”
发展中的诊断学
在某些案例中,临床医生能够把明确的染色体缺陷与特定疾病联系起来,而基因芯片能给这套染色体分型或染色体表型的计数和评估方法带来新的功能。
唐氏综合症是一个众所周知的例子。该病症的患者具有一条额外的21号染色体。尽管在显微镜下能够观察到整条染色体的增加或缺失,甚至染色体的部分缺失,然而基因芯片则能够揭示染色体的精细变化。
“在细胞遗传学中,基因芯片作为工具的发展开始加速。”美国昂飞公司(Affymetrix,加州圣塔克拉拉市)遗传分析商业部执行副总裁Andy Last表示。专家们在被问及哪一领域的基因芯片技术使用最多时,很多专家都提到拷贝数目变异(是指特定区域DNA的增加或缺失),特别是那些与临床结果相关的变异。
“现在差不多有上百例的症状具有可以与特定表型相关联的染色体重组。”牛津基因科技公司(Oxford Gene Techonology,英国牛津)临床和基因组对策中心副总裁James Clough指出,“取决于受测群体,传统显微镜核型检测法诊断率为5~8%,而基因芯片的诊断率则是18~25%,而且芯片的分辨率远高于传统方法。”
但他接着说:“这里面的挑战在于如何分辨出一个小的偏差是致病的还是非致病的,或者是未知显著性的变异。”
为了帮助研究者更好的判别,牛津基因科技公司提供了一系列的基因芯片,例如:CytoSure ISCA 芯片能够观测到与已知症状有关的遗传缺陷,像Prader Willi综合征和Williams-Beuren综合征等。
PerkinElmer公司(沃尔瑟姆市,马萨诸塞州)研制的芯片能够检测染色体中与疾病相关的结构变化。例如,这家公司利用OncoChip产品,提供了肿瘤样品的基因组检测方案。
“这是一个高密度的全基因组芯片,靶定了超过1800个癌症基因和临床相关的平衡易位。”PerkinElmer 市场单元负责人Christopher Williams指出。这一芯片能够揭示目标区域低至1万个碱基长度的拷贝数目变异。
此外,来自昂飞公司的CytoScan HD细胞遗传学解决方案提供了囊括拷贝数目变异和单核苷酸多态性(single nucleotide polymorphisms, SNP)的探针。其中拷贝数目变异探针能够揭示临床应考虑的染色体变化,而SNP探针则能帮助研究者评估确切变异的更多细节,特别是单个核苷酸水平的变化。
“这是市面上密度最高的基因芯片。”Last表示,“它用在细胞遗传学的经典观念中,(去检测)可遗传的紊乱,并逐渐用于肿瘤的增长性,特别是血液系统恶性肿瘤。”
这一芯片可以揭示出染色体片段中小至25000个核苷酸的拷贝数目变异。目前来说,尽管还只是专用于研究的工具,但昂飞公司已经开始开展临床测试,以检测这一平台的体外诊断能力。
安捷伦公司(Agilent,加州圣克拉拉市)也研制了用于检测拷贝数目变异的基因芯片,譬如CGH(比较基因组杂交)加SNP芯片。
“我们的文库中已经定制了超过2800万个探针,用户甚至可以上传他们自己的探针序列。”安捷伦公司细胞遗传学产品经理Patricia Barco介绍。举例来说,在一个外显子内,这些芯片能够检测DNA片段中小至100个碱基对的拷贝数目变异。Barco指出:“这些可以用于产前产后的研究和癌症研究。”
据安捷伦公司临床软件部产品经理Anniek De Witte介绍,其中最流行的格式包含了18万个探针,分别分至四个样品。她认为:“这是样本数目和分辨率的最优平衡。”
此外,安捷伦的CytoGenomics 2.5软件通过将这些芯片产生的结果与外源或内源数据库进行比较,来区分普通的变异和会造成临床状况的变异。
创建定制工具
为了将基因芯片应用于临床诊疗,医生们需要那些经过认可的工具。Pathwork诊断公司(加州雷德伍德市)的Pathwork组织起源检测中使用的经FDA认证的诊断工具,是利用昂飞芯片去判定病人癌症起始的组织类型,如乳腺或结肠。
Pathwork诊断公司产品研发和临床事务部高级主任Raji Pillai说:“这项检测利用福尔马林固定并石蜡包埋(formalin-fixed, paraffin-embedded, FFPE)的病人肿瘤组织和2000个转录标记,来提供一个肿瘤基因表达模式的报告。利用数千份不同的肿瘤样本和专利化的计算机算法,Pathwork诊断公司的科研人员已经鉴定出能够用于分辨15种肿瘤的2000余个基因。
当某个病理学家收到一个很难在表型上鉴定的癌症样本,他们可以将其送到Pathwork诊断公司。
“在四到五天时间内,我们就能报告出经过实验室病理学家解析的结果。”该公司首席商务官David Craford表示。此外公司的病理专家也将会再次审阅这些结果以做出关于这项诊断的最真实的阐述。
该公司希望今后能够继续研发基因芯片检测技术,不仅能够获知肿瘤组织的来源,而且能够分辨出肿瘤亚型。这种高级检测甚至能够“提供信息,反映(病人)对某种特定治疗方案可预测的反应”。
除了可以用于研究个体的遗传特征外,基因芯片还可以用于探索不同群体和培养物间的遗传差异。例如,加州圣地亚哥Illumina公司拓展经理Jennifer Stone说:“我们研发出了名为Infinium HumanCore BeadChip的基因芯片家族,能够提供群体水平或生物样本库研究的解决方案。”相关研究会涉及到数十万的样品。“这些遗传学研究达到了空前的规模。”Stone指出。这些基因芯片能够容纳大量的样本,让科研人员可以实现强大的统计分析,这些分析能够揭示健康和疾病群体间遗传变异分布的差异。
HumanCore基因芯片提供了一个超过30万个SNP探针的标准组,涵盖了整个基因组,也包括了一些额外的探针,专门聚焦于“群体中的存在并导致基因功能缺失的变异”的探针,Stone解释说。这类新的基因芯片也能够定制,这样一来,科研人员就能够研究源于他们自己进行的实验或公共数据库中存在的变异。
为了探索整个群体的遗传变异,研究者需要一组多变的基因芯片。因此,HumanCore家族出现了第二个成员,这个名为Infinium HumanCoreExome BeadChip的产品涵盖了超过30万个SNP探针组,并附加了24万个特别针对外显子组的标记。利用这些组合标记,科学家可以比较样品间的单核苷酸变异,并且能够由基于外显子组的标记潜在地判别它们如何影响蛋白的产生。
随着这些公司开始越来越多地创制定制化工具,用什么来构成一个基因芯片这样一种概念也开始演化。传统上认为,基因芯片仅仅包含关联在固体表面的核苷酸,但关于这一主题上的变化也存在。
例如,美国生命技术公司(Life Technologies,加州卡尔斯巴德市)研发出了TaqMan OpenArray 实时定量PCR平板,包含3072个小孔。
“这一芯片可以被制成一个包含八百万个TaqMan芯片的大矩阵。”生命技术公司市场拓展经理Jami Elliott说。使用TaqMan探针的实时定量PCR芯片(因这些芯片依赖于Taq多聚合酶而定名)可以用来检测基因的表达,鉴定生物标记以及其他方面的应用。
如果八百万的选择范围仍然不够,生命技术公司的商业拓展部遗传分析单元主任Joshua Trotta说,“我们能够专门定制设计一个。”
现实的数据窘境
不仅仅制作基因芯片,表达分析公司(Expression Analysis,北卡罗莱纳州达勒姆)还利用芯片为客户实施范围更广的研究,如基因表达模式等。为了做到这些,表达分析公司利用了多家供应商的生物芯片产品,包括昂飞、Illumina和位于加州三藩市的Fluidigm公司。
据表达分析公司研发部副总裁Pat Hurban介绍,“基因芯片作为一项技术已经十分成熟,但当与数据打交道时仍然存在许多挑战,特别是当你想要深入到某些生物学问题中时。”
他还说:“一方面需要对数据进行统计处理,而另一方面又需要理解相关的途径并转化到生物学中去。”这家公司运用获得专利的工具集去为这种知识鸿沟架设桥梁。
事实上,Hurban建议科研人员在将最好的技术用于项目进展前,应该进行再次评估。“你们必须对基因芯片存在的技术缺陷保持警惕。”他表示。例如,他指出基因芯片是极好的发现工具,“用基因芯片去鉴定特定的基因并不罕见,”Hurban说。“当进入转化研究领域时,问题就出现了:当越来越接近临床时,是继续利用基因芯片平台还是转化到更合适、更强大的技术上去,例如,(定量的)PCR或测序。”
在近期的一项研究项目中,表达分析公司与一名客户进行了研究合作,这位客户具有Hurban描述的“在一定的指示区域内能够作为诊断工具,初步的基因特征模块”。
表达分析公司的研究人员研究了送来的病人样本,并将这些基因特征标记在基因芯片上。“我们证实了这一模块的有效性。”Hurban说,“项目发起人希望最终能将这些特征标记转化为一种诊断法,他们开始关注基因芯片的结果,因为精确性的确具有一定的挑战。”
因此,客户最终使用基于PCR的平台作为最终的诊断法。Hurban说,结果就是,“你会在某些程度上用到基因芯片,然后转向其他技术。”
明日之工具
测序技术的最新进展使得众多专家开始预测基因芯片的消亡。例如,位于加州Aliso Viejo镇的Ambry Genetics公司转化医学部主任 Elizabeth Chao说:“表达芯片我已经用了14年,它是一个不可多得的工具,但是在研究和转化中,RNA测序技术正在开始取代基因芯片的位置。”她还认为,“尽管测序技术目前还没有在临床中取代基因芯片,但说不定很快就会取代它。”
测序所产生的数据既是有益的,又充满挑战。“测序能在短时间内提供巨大的数据量,但解析这么多的数据会比较困难。”不过Chao对数据解析能力的飞速发展充满了信心,她说:“生物信息学已经迎头赶上,新方法的拓展让序列可以在整个基因组中纵横。”
为了赶上技术的改变,一些公司开始提供服务,教授、科研人员使用不断增长的数据量。例如,PerkinElmer研究和应用部高级负责人Todd Smith指出,“我们可以帮助人们从基因芯片过渡到DNA测序中去。”这可以包括处理大量数据的分析技术。按照Smith和他的同事们的说法,这些技术可能会相互补充。
“基因芯片可能在某些应用中表现的最好,而另一些则是测序更好。”Williams说,“也会有一些领域,测序技术发挥的作用不大,但基因芯片却可以。”例如,Williams透露他们准备开展一项涉及160个样品的研究,必须在一周左右的时间内处理完成的。
“如果我们想要通过测序来处理这个项目,并按时将它们转化成有意义的数据,那是根本行不通的。”他说。同时,Smith认为在查找基因组中的结构变异时,基因芯片的功效也优于测序。
尽管专家们有着不同的意见,但他们在基因芯片的未来预测上基本达成共识:基因芯片将会继续服务于基础研究,并提供基因组学相关的临床工具。最终,基因芯片将会在其功效发挥最出众的领域继续前进。(科讯网)