人类基因组包含大约20,000个蛋白编码基因,但这些基因只占人类基因组的不到2%,而基因组的70%都用以合成非编码RNA,但到目前为止,仍然缺少系统性描述长非编码RNA在人类癌症中变化的研究。大部分对癌症基因组变化的研究都聚焦在编码蛋白的一小部分基因组。
最近,来自美国宾夕法尼亚大学的一支国际研究团队在国际学术期刊cancer cell上发表了一项最新研究进展,他们深入挖掘了与13种不同类型癌症有关的非蛋白编码RNA序列。
研究人员指出:"在知晓了组成基因组四分之三的都是非编码RNA序列之后,人们对于深入了解基因组,表观遗传以及长非编码序列如何变化有着极大需求,而这项研究恰恰填补了癌症研究中的这一空白。"
在这项研究中,研究人员在转录,基因组和表观遗传水平上对不同类型的超过5000份肿瘤样品以及935种癌细胞系中的lncRNA进行了分析,他们发现相比于蛋白编码基因,lncRNA的变化存在高度的肿瘤和细胞系特异性,除此之外,lncRNA的变化还常与直接影响基因表达的表观遗传修饰改变存在关联。
该研究团队还开发了两个生物信息平台帮助发现癌症相关lncRNA并进一步探究其功能。其中一个是可搜索数据库,其中收录了与lncRNA分子改变相关联的临床信息,能够帮助研究人员获得候选lncRNA的列表。另外一个是用于预测lncRNA生物学功能的平台,研究人员利用这一平台成功发现了一个新的致癌lncRNA,如果这种lncRNA出现异常过表达就会促进细胞周期进行,导致癌症发生。
癌细胞基因组中,lncRNA会在多个层面上发生失调,并且这些改变具有非常显著的癌症类型特异性,这项研究为这一观点提供了充分证据。研究人员希望他们的工作能够帮助其他科学家发现更多有关lncRNA的秘密。