转录组为特定细胞在某一功能状态下转录出来的所有RNA,主要包括mRNA,某些情况下也包括非编码RNA。转录组测序利用高通量测序技术,快速且全面地揭示某一物种特定细胞或组织在某一状态下的几乎所有转录本信息,包括转录本表达量、可变剪接体、可变polyA位点等。
转录组分析的核心目标是准确定量样品中RNA转录本的丰度。目前,基于测序的方法(如RNA-Seq)具有消除基因之间杂交偏差的优势,但在RNA测序过程中,实验操作、逆转录、加接头、仪器等及PCR过程中存在的序列扩增偏好性等因素,都会使得常规RNA-Seq的结果准确度下降。
那怎样实现RNA-seq的准确定量呢?
2012年PNAS报道了一种可以降低RNA-Seq偏倚和噪音的方法,也是我们常说的UMI-RNA-Seq。下面让我们了解一下UMI是如何发挥作用的。
什么是UMI-RNA-Seq?
RNA测序在构建文库时,需要进行PCR扩增,但是所有的片段并非以同等速率进行扩增,片段的长度、GC含量及浓度等都会影响扩增速率,最终导致容易扩增的片段被极大的富集,而一些含量较低或碱基偏好较低的片段富集很少,甚至丢失,从而影响测序结果的准确性。
UMI-RNA-Seq实验原理是通过在每个cDNA分子上连接一个特异序列标签(UMI,Unique Molecular Identifier),随后这些UMI会随cDNA序列一起扩增。在测序完成后,通过识别UMI,将具有相同UMI的重复片段合并,去除由于PCR扩增偏好性及测序仪引起的重复,达到一比一还原样本扩增前的原始状态,从而定量原始样本中转录本的数量。
UMI≠绝对定量测序!
与常规转录组测序相比,添加UMI标签,转录本测序定量的准确性确实能够实现大幅提高,但通过UMI-RNA-Seq就能真正的实现绝对定量测序吗?
根据上述UMI-RNA-Seq的原理,可以发现UMI标签能够很好的消除文库构建过程中PCR扩增及测序仪引起的偏好性和重复性。但在测序过程中,除了PCR扩增过程中产生的干扰,逆转录、加接头、上机量等实验过程中存在的问题以及数据量的差异也会影响RNA的定量,最终导致转录组测序准确性下降。因此仅仅通过UMI标签不能完全消除这些差异,也无法实现RNA的准确定量。
另外,对于多个样本的RNA-seq数据,通常还会利用组间的数据进行差异分析。差异分析的前提是每个样本的获得的原始数据量是相等的,而数据量的矫正仅通过UMI技术是很难实现的。因此,尽管添加了UMI标签,一些差异也无法消除,无法实现真正的绝对定量。
云序生物UMI + spike-in矫正实现“真”绝对定量RNA测序!!
为了弥补UMI-RNA-Seq方法无法消除的干扰问题,云序生物联合UMI与spike in矫正共同实现对转录组测序的精准定量!
Spike in是一种标准物,也称为外源性内标,是指在每个样品中加入等量的已知序列信息的非亲缘标准品基因组,与实验样品共同进行文库构建及测序。在进行分析时,通过不同样本间spike in的表达量,能够非常准确地对不同样本之间RNA的表达量进行矫正,消除样本间的由于实验操作及数据量引起的误差,很好的弥补了UMI无法消除的偏差,从而实现测序高准确性定量。