查看原文
其他

NGS测序基础梳理01-文库构建

pythonic生物人 pythonic生物人 2022-09-11

本系列文章?

本系列文章共三篇,分别介绍,文库构建(Library Preparation),簇生成(ClusterGeneration),测序及测序后数据处理得到FASTQ文件(Sequencing and Data Analysis)也就是下图中的ABCD四个部分。


本文目的?

了解二代测序文库的构建步骤,文库的结构。

    

为何构建文库?

由于二代测序读长的限制,不可能一下将一个很长的基因序列测通,so需要先将长基因序列随机片段化成小片段,这样的话,这些片段就可以覆盖整个基因组。


文库构建步骤?

   文库构建大致步骤类似,但是各有各自独特的点,例如,RNAseq里miRNA,lncRNA,mRNA方法各有差异,具体方法以后有机会再补充。这里以Illumina的 PE文库为例,其官网流程图如下图。

文库构建详细步骤?

  • DNA片段化 (Fragment DNA)
使用超声、酶或者加热的方式将DNA样品打碎成小片段,一般在300 ~ 800bp之间除非有特殊要求。
  • 末端修复(End Repair)

补平片段化时导致的不平末端。

  • 3' 末端加“A” (A-tailing)

3‘ 末端加A,转换为粘性末端,与adapter 互补配对,因为adapter 3‘端有一个突出的T。


  • 接头连接( ligation adaptor)

这一步有两种不同的添加策略如下图。

左边的图是直接在fragment DNA的两端直接加上full Y-adapter, adapter中已经包括了和P5/P7 oligo互补的序列, index, 以及Read1/Read2的测序引物。

右边的图是先在fragment DNA的两端加上PE adapter, 然后再引入和P5/P7 oligo互补配对的序列以及index序列,右图策略详细图如下,分两步:

1)PE adapter添加

利用碱基互补配对的原则,加上PE adapter。PE adpater中一部分是建库PCR富集时候需要用的引物序列,另一部分是测序时需要用的引物。

2)PCR 添加 index,P5,P7

Index也称barcode,用来区分不同样本的文库,因为测序仪一个lane产生数据量若干Gb,为了最大化利用测序仪,一次上机常会进行多个样本文库混合测序,在后续分析时,Index用来区分数据是来自哪个样本。

P5,P7是与flowcell上芯片连接的碱基序列,flowcell上也存在同样的P5 P7,flowcell下文介绍。

  • PCR富集目的片段

进行PCR扩增,循环数与投入的DNA量有关,使得文库达到上机浓度。

  • 扩增文库大小质检

使用Agilent 2100对文库的insert size进行检测。

  • 文库浓度定量

Qubit3.0 进行初步定量 Q-PCR对文库的有效浓度进行准确定量,至此文库构建结束。

建好的文库图?

illumina官网另外一张图

参考资料

https://www.fimm.fi/en/services/technology-centre/sequencing/next-generation-sequencing/dna-library-preparation

illumina官网

https://zhuanlan.zhihu.com/p/35278810

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存