导语
目前,各种测序技术已经成为了药物研发过程中的得力工具。单细胞转录组测序(single-cell RNA sequencing,scRNA-seq),简单从字面理解,就是一种在单细胞水平上对转录组进行测序分析的技术。目前,这项技术已经得到了广泛地应用,并在应用中不断地快速发展,成为我们研究细胞类别、疾病发生过程等问题的有力工具。
PART. 01
为什么要用scRNA-seq?
传统的批量测序(bulk RNA sequencing)有一个绕不过的难题:细胞的异质性。
众所周知,对于多细胞生物来说,尽管由同一个受精卵发育而来,但不同细胞之间的基因表达必然是有差异的,这些差异导致了细胞的分化,使不同的细胞承担不同的生理功能。粗糙地看,不同器官、组织的细胞组成不同,但使分析变得棘手的问题在于,即使是在形态上无法区分的细胞之间基因表达水平和对刺激的反应方面也存在很大的异质性,这种异质性在组织生物学和疾病的发展中起着重要作用,例如病原体细胞或癌细胞之间的表达异质性可能与人类疾病有关,在进行药物研发时,细胞的异质性也往往造成靶点难寻、耐药性等问题。
图1. 肿瘤异质性(Nature 2013 Vol. 501 Issue 7467 Pages 338-345)
在使用多细胞水平的分析时,每个细胞的异质信息很容易被掩盖在多个细胞的平均信息中。比如大家非常熟悉的Western blot。当我们使用Western blot检测蛋白质的含量时,我们无法区分目标蛋白是在10%的细胞中强表达,还是在50%的细胞里中等表达,还是在所有细胞中弱表达。但如果使用流式细胞术,我们就可以清晰地区分上述情况。
图2. Western blot VS 流式细胞术(https://zhuanlan.zhihu.com/p/28844468)
单细胞转录组测序也是一样的道理。当使用bulk RNA-seq时,每个细胞的转录组差异同样会被多个细胞的平均信息所掩盖,而如果在单细胞水平对每个细胞进行分析,我们就可以得到异质性信息,进而可以对细胞进行更准确地分群、发现新的细胞种类、研究随机基因的表达,以及对细胞谱系路径进行探索。为药物研发提供更准确的信息,开辟新的路径,实现真正的“对症下药”。
图3. 单细胞测量保存了大量基因组分析丢失的关键信息(Genome Research 2015 Vol. 25 Issue 10 Pages 1491-1498)
自从2009年由汤富酬等人开发出第一种单细胞转录组测序技术,到今天已经有几十种不同的单细胞转录组测序技术被开发出来,它们各自有不同的优势与缺点,我们可以在了解不同技术的优缺点之后,选择最适合自己的研究的技术。
图4. scRNA-seq发展史
图5. 部分常用的scRNA-seq(Chen, G., et al. (2019). "Single-Cell RNA-Seq Technologies and Related Computational data Analysis." Frontiers in Genetics 10(317).)
PART. 02
单细胞RNA测序技术原理
单细胞测序基本流程通常分为以下几个部分:单细胞分离、基因扩增、构建信息库、高通量测序、数据分析。单细胞分离技术分类众多,单细胞分离溶解后获得pg级的核酸,通过扩增至ng或μg级,然后用于后续的测序。目前常用单细胞分离方法有有限稀释法、显微操作(手工细胞采集)、激光捕获显微切割、荧光活化细胞分选、磁活化细胞分选、微流体技术等。
图6. 单细胞测序流程 (李勃,朵泓睿.单细胞RNA测序数据分析方法研究进展[J].重庆师范大学学报(自然科学版),2021,38(05):129-135+142.)
目前单细胞RNA测序常用技术有Tang RNA-seq、Smart-seq、Smart-seq 2、CEL-seq、Quartz-seq、STRT-seq、dro-seq等,而利用这些技术构建的被大规模使用的测序平台有10Genomics平台、Illumina®Bio-Rad® 平台、BD Rhapsody™ 平台、ICELL8 平台和C1™ 单细胞全自动制备系统等等。接下来以10Genomics平台为代表具体介绍单细胞RNA测序过程中基因扩增与信息库构建的具体过程。
10Genomics
10×Genomics平台基于微滴的核酸条形码分配系统,该系统提供了数以百万计级的携带唯一DNA条形码的微滴,通过微流控技术,首先将带有条形码和引物的凝胶珠与单个细胞包裹在油滴(GEMs)中。凝胶珠溶解,细胞裂解释放mRNA,通过逆转录产生用于测序的带条形码和UMI信息的cDNA。液滴油层破碎,cDNA扩增,制备cDNA文库,然后使用Illumina测序平台对文库进行测序检测,即可获得大量单细胞的基因表达和免疫组库数据。
图7. 10Genomics平台流程图 (https://zhuanlan.zhihu.com/p/269461589)
10Genomics技术的核心是油滴包裹的凝胶珠(GEMs)。GEM(10X Genomics Gel in Emulsion)是一个由 mRNA、磁珠、乳液组成的液滴状反应系统,后续的细胞分选、反转录的反应都是在这个液滴反应系统中进行。GEMs 的结构确保了>90% 的油滴内反应产物都可以顺利用唯一的 barcode 分子标记。Gel bead由凝胶珠和磁珠上的一段引物构成。Gel bead上连接的引物序列包含四个部分:Illumina TruSeq Read 1测序引物、16 nt的条形码(Barcode)、12 nt的UMI和30 nt的Poly(dT)反转录引物
图8. GEM示意图(左),Gel bead示意图(右)
具体流程是先将样本制备成单细胞悬浮液,细胞质检然后进行细胞计数和细胞活性测定,最终使细胞活性高于90%,细胞浓度为700~1200个细胞/μL。
取75μL Master Mix+细胞悬浮液、40μL的含有barcode信息的凝胶珠和280μL的油滴分别加入到Chromium Chip B的不同小室,经由微流体“双十字”交叉系统形成油滴包裹的凝胶珠(Gel Bead-In- EMulsions,GEMs)。有效的GEMs包含凝胶珠、单细胞、Master Mix和油。
收集GEMs,并将其全部混合,凝胶珠在每个油滴内自动溶解释放大量Barcode引物序列,细胞裂解释放mRNA,mRNA与逆转录酶、凝胶珠上的poly dT反转录引物以及dNTP底物相接触,在逆转录酶的作用下发生逆转录反应,产生用于测序的带有Barcode和UMI信息的cDNA一链,再以SMART扩增方法完成第二链合成。
cNDA片段化油滴破碎,磁珠纯化cDNA一链,然后以cDNA为模板进行PCR扩增。
cDNA扩增完成后,首先利用化学方法将cDNA打断成200- 300bp左右的片段,通过末端修复、加A进行cDNA片段筛选,P7 adaptor接头连接Read2测序引物,并通过PCR扩引入样品Index,最后进行片段筛选,从而构建含有P5和P7接头的cDNA文库。
文库完成以后,进行库检,cDNA文库库检合格后,直接在Illumina的测序仪上进行测序。测序完成之后,进行数据分析。
数据分析
单细胞RNA测序得到的数据通常从这几个方面展开进行:1、序列比对和表达水平量化;2、数据预处理;3、数据标准化;4、高变异基因的选择和降维分析;5、聚类分析;6、细胞类型注释;7、差异表达的鉴定及富集分析;8、进阶分析:如细胞谱系追踪、生物网络构建、空间转录组等。
图9. scRNA-seq的数据分析(李勃,朵泓睿.单细胞RNA测序数据分析方法研究进展[J].重庆师范大学学报(自然科学版),2021,38(05):129-135+142.)
PART. 03
单细胞测序的优缺点与
现在一些主流技术之对比
单细胞测序的第一个缺陷是样本制备和建库成本更高,数据量更大,更加复杂,需要更多时间、设备、容量来进行该项工作。
单细胞测序第二个缺陷是跨细胞的生物学误差,是因为样品细胞之间存在一些生物学变异,主要包括:
1、转录脉冲,它指的是并不是所有基因的基因转录都处于启动阶段,主要由捕获时间来确定这些基因是打开还是关闭状态;
2、然后是每条RNA加工速度都不相同;
3、环境刺激也会影响基因的表达;
4、时序改变,指的是像细胞周期这样的细胞时序变化过程,会影响单个细胞的基因表达谱。
单细胞测序的第三个缺陷是样品之间的技术差异,主要包括:
1、细胞特异性捕获效率不同,不同细胞捕获转录本不同,导致测序深度不同;
2、文库质量:获得的样品中会存在降解的RNA、低存活力细胞、大量自由漂浮的RNA以及细胞定量不准确,这些导致质量指标降低;
3、扩增偏差:在文库制备的扩增步骤中,并非所有转录本都扩增到相同水平;
4、批次效应:可以从图中看到因为批次不同造成细胞表达显著性差异,这就要求在实验中最好在同一天、同一个人在同一个地点完成所有RNA分离及建库工作来尽量避免批次效应。
当前单细胞测序用到的两种主流技术主要为10x Genomics和smart-seq,他们有各自的优缺点。
首先是smart-seq 的大致步骤:细胞制成单细胞悬液、带poly(A)尾的RNA逆转录、模版转换、cDNA的扩增、cDNA片段化、加入文库PCR引物进行扩增、测序。
它的优点主要在于相对于截短的cDNAs,该技术所采用的M-MLV逆转录酶更倾向于选择全长cDNAs作为其末端转移酶活性的底物。因此它的测序深度大大增加,基本每个转录本的所有外显子都能被检测到,这使它可以用于检测可变剪接,还可以在转录本层面进行全面的突变分析,扩大了其应用范围。
此外它的优点还包括:
1、进行技术改进后,Smart-seq2利用现成的试剂能生产更高质量的文库,且成本也有所下降,为分析大量细胞提供了可能性。
2、Smart-seq2的方案组分和原理是公开的,让研究人员可以进一步对其进行改良,目前在这个方案基础上涌现了许多单细胞测序的新成果。
它的缺陷是:建库过程依赖于孔板,这使得它们难以达到很高的通量,smart-seq是基于96孔板的,那么同批次只能测96个细胞。
Microwell 通过缩小孔体积来增加细胞数量,但依然受到限制。
它的另一个缺陷是因为引物的设计,只能选择性识别聚腺苷酸化的RNA,所以不能分析没有poly(A)的RNA。
接下来是10x Genomics,它是依赖于液滴的,大致步骤就是通过微流控技术将单个细胞和一个捕获RNA的微珠包裹在液滴中,微珠连接的捕获mRNa上已经预先包含UMI和细胞条形码信息,让每个液滴带上独特信息,在液滴中完成mRNA的富集后将微珠合并,完成测序。
它的优点在于:
1、在该方法中,含有细胞的油滴占所有油滴比例大约5%,这样能够更好地保证了含细胞的液滴中只含有一个细胞。
2、每个液滴中均含有独特的细胞条形码和UMI,能够区分单细胞。
3、而且它不受限于孔板,可以短时间内同批次处理更多的细胞。
它的缺陷在于:
1、微珠对mRNA的捕获效率有限,在获得细胞数量的突破的同时,能够测得的细胞基因数较少,就是测序深度比较低。
2、而且该技术测序多为3‘端测序,测得的序列相同性很高,灵敏度和准确度都不及全场测序。
PART. 04
结语
scRNA-seq为异质性问题的解决提供转录组水平的解决方法,自这项技术问世以来,它就在飞速发展的同时得到了广泛的应用,从基因表达到细胞分群,再到谱系分析,scRNA-seq将这些点连成线,为今天的药物研发提供了更多的方向。scRNA-seq在今天大放异彩,在未来的表现也同样令人期待。
关于笔者
寻药真理团
他们是南京大学新药研发策略课程的学生,本篇为该课程中杜轶翔、徐倩、徐思琼、李飞4名同学共同完成。
他们朝气蓬勃、他们斗志昂扬,他们脚踏实地学习新药研发知识,他们坚信吾爱吾师吾更爱真理。
他们是新一代医药行业接班人,他们是新药研发领域的未来之光!
参考文献:
[1] Burrell, R. A., et al. (2013). "The causes and consequences of genetic heterogeneity in cancer evolution." Nature 501(7467): 338-345.
[2] Chen, G., et al. (2019). "Single-Cell RNA-Seq Technologies and Related Computational data Analysis." Frontiers in Genetics 10(317).
[3] Potter, S. S. (2018). "Single-cell RNA sequencing for the study of development, physiology and disease." Nature Reviews Nephrology 14(8): 479-492.
[4] Picelli, S. (2017). "Single-cell RNA-sequencing: The future of genome biology is now." RNA Biology 14(5): 637-650.
[5] Trapnell, C. (2015). "Defining cell types and states with single-cell genomics." Genome Research 25(10): 1491-1498.
[6] 李勃,朵泓睿.单细胞RNA测序数据分析方法研究进展[J].重庆师范大学学报(自然科学版),2021,38(05):129-135+142.
[7] 王磊,杨春艳,李芳芳,穆登彩,沈昊,郑尚永.单细胞测序技术的发展及应用[J].基因组学与应用生物学,2020,39(11):5381-5388.DOI:10.13417/j.gab.039.005381.
[8] 王权,王铸,张振,李晨,张萌萌,叶颖江,王杉,姜可伟.单细胞测序的技术概述[J].中国医药导刊,2020,22(07):433-439.
[9] https://www.jianshu.com/p/e3e015a97812
[10] https://zhuanlan.zhihu.com/p/269461589
[11] https://zhuanlan.zhihu.com/p/28844468