快:整个实验流程的速度比探针捕获的时间要快3倍以上
简单:实验不需要探针捕获那么多步骤,简单易行
省钱:只需要合成特异性引物就可以了
多重PCR的分析流程图如上,基本上分成三个模块:原始数据质控,数据预处理,突变检测。
从结构上看,分析流程和标准的WES(全外显子测序)分析流程是类似的,那么差别在哪里呢?
有经验的读者应该知道,主要的差别就是在去除PCR重复这一阶段,通常的WES分析都是需要把比对后文件进行去重复的,但是多重PCR不需要这一步,具体原因就要从实验方式上面讲了。
实验方式通常的WES测序数据都是使用外显子探针对目标序列进行捕获,接着使用PCR对捕获结果进行扩增,然后进行建库上机测序。而多重PCR则没有探针捕获这一步,直接使用事先设计好的目标区域引物对基因组进行扩增就可以了。
这里我们可以看到,由于探针捕获比多重PCR多了一个PCR扩增过程,这个扩增过程实际上拿到的并不是最原始的模版序列,而是部分模版序列和模版序列扩增的产物,这个地方由于PCR的本身问题,扩增出来的探针产物并不一定是均一性的,可能有的模版多有的模版少,这样在上机测序的时候有些模版就会被测到很多次,所以我们需要进行去重复这一个步骤。
多重PCR则因为是特异性引物,第一轮的PCR是线性扩增,模版产物都是同一个数量级的,上机测序的片段都是目标序列,所以最后我们拿到的原始测序数据是不需要去重复的。
原始数据质控目前的测序大多数都是illumina的边合成边测序的二代测序技术,对测序数据影响最大的一般就是开头的几个bp的碱基和末尾的序列,一般来说开头的碱基质量值会波动,但还是在高质量的范围。但是末尾就不一样了,越到后面碱基合成的错误率就会越高,这是当前NGS测序读长普遍偏短的一个原因。质控的目的一般有两个:去掉非目标片段序列(一般是接头序列)和去掉低质量的测序序列(包括N碱基)。那么实际的操作步骤有哪些呢?
过滤测序fq序列的工具有很多,这里介绍一个Trimmomatic,官方下载地址石家庄白癜风医院治疗白癜风有什么偏方吗