生物信息学导论-北大-新一代测序NGS:转录组分析RNA-Seq 1

ref: https://www.coursera.org/learn/sheng-wu-xin-xi-xue/home

本文主要来自本课的讲义+搜索内容。


Real-Time qRT-PCR

基于互补杂交反应(complementary hybridization reaction),PCR技术的发展促进了本技术的发展,缺点是:1.低通量 2.需要有转录本序列的先验知识。步骤:

Real-Time Quantitative Reverse Transcription Polymerase Chain Reaction(qRT-PCR)是一种用于测量RNA在生物样本中的数量的分子生物学技术。以下是一般流程:

  1. RNA提取: 从生物样本(细胞、组织等)中提取RNA。这个步骤确保后续的分析基于目标RNA。
  2. 逆转录(Reverse Transcription): 利用逆转录酶(Reverse Transcriptase)将提取的RNA转录成相应的DNA(亦称为cDNA)。这一步将RNA转化为qRT-PCR所需要的模板。
  3. 引物设计: 设计适当的引物(primers),这是用于在PCR过程中扩增目标DNA序列的短片段。
  4. 合成标记探针: 合成荧光标记的DNA探针,这是用于在PCR过程中测量DNA合成的标记。
  5. qRT-PCR反应: 在PCR仪器中进行Real-Time qRT-PCR反应。这包括以下步骤:
    • 初始变性(Denaturation): 在高温下,DNA双链分离。
    • 引物结合(Annealing): 使引物与目标DNA序列结合。
    • 延伸(Extension): DNA聚合酶(DNA polymerase)在引物的引导下合成新的DNA链。
    • 检测: 同时测量PCR过程中DNA的数量,通过荧光标记的DNA探针实时监测PCR反应的进程。
  6. 数据分析: 在PCR反应进行的同时,PCR仪器实时生成荧光信号数据。这些数据用于计算目标RNA在样本中的初始量,并通过比较不同样本的数据来进行定量分析。
  7. 结果解释: 根据数据分析的结果,研究人员可以了解目标RNA在不同样本中的表达水平,从而研究基因表达调控、疾病诊断等方面的信息。

总体而言,Real-Time qRT-PCR是一种高灵敏度、高特异性的技术,常用于基因表达研究、病毒检测、生物标记物测定等领域。

Microarray

也是基于互补杂交反应,用来分析基因表达情况。用到:1.Labeled targets:RNA是从生物样本中产生的 2.Probes:一组已知序列的、有序的、固定的核酸分子。缺点也是需要有转录本序列的先验知识。步骤:

RNA microarray是一种用于研究基因表达水平的高通量技术。以下是RNA microarray的一般流程:

  1. 样本准备: 首先,需要从研究对象(如细胞、组织等)中提取RNA。这可能涉及到细胞裂解、RNA提取和纯化等步骤。
  2. RNA标记: 提取的RNA需要标记,通常采用荧光标记物。这种标记使得可以在后续的分析中追踪RNA的存在和量
  3. 芯片制备: 准备芯片,芯片上固定有大量的DNA或RNA探针。这些探针对特定的基因或基因组区域具有亲和性。
  4. 杂交: 标记的RNA样本与芯片上的DNA或RNA探针进行杂交。通过这种方式,标记的RNA会与芯片上的相应基因或基因组区域结合。
  5. 洗脱和扫描: 将芯片洗脱,去除未结合的RNA。然后,使用荧光扫描仪扫描芯片,检测标记的RNA的强度。
  6. 数据分析: 对扫描得到的数据进行分析。通过比较不同样本的RNA表达水平,可以识别哪些基因在不同条件下表达发生变化。
  7. 结果解释: 最后,研究人员根据分析得到的数据解释实验结果,识别在不同生物条件下的基因表达模式。

Expressed Sequence Tags(ESTs)

是一种基因组学技术,用于快速鉴定和分析一个生物体中活跃基因的部分序列。不需要转录本序列的先验知识,中等通量。流程:

  1. cDNA合成: 从目标组织或细胞中提取总RNA。然后,使用逆转录酶(Reverse Transcriptase)将RNA转录成相应的互补DNA(cDNA)。
  2. cDNA文库构建: 将产生的cDNA片段插入到载体中,形成cDNA文库。这个文库包含了目标组织或细胞中活跃基因的cDNA。
  3. EST的产生: 从cDNA文库中随机挑选一些cDNA片段,进行测序。由于是随机选择,所以测序得到的片段代表了目标组织或细胞中的各种基因的表达序列。
  4. 序列比对: 将测序得到的EST序列与已知的基因组序列进行比对,以确定这些ESTs对应的基因。
  5. 注释: 对已识别的基因进行功能注释,了解这些基因可能参与的生物学过程。

ESTs的主要应用包括:基因发现、基因表达分析、分子标记。

ESTs技术在过去是基因组学研究中的一种常用方法,尤其在全基因组测序之前。随着新技术的发展,ESTs逐渐被更高通量的测序技术取代,但其在基因表达分析和基因发现领域的贡献仍然有价值。

RNA-Seq

RNA-Seq(RNA测序)是一种高通量测序技术,用于研究和分析转录组的全面信息。相比传统的ESTs等技术具有更高的灵敏性和分辨率,不过这些也依赖于测序深度。

流程:

  1. 样本准备: 首先,需要从研究对象(如细胞、组织等)中提取总RNA
  2. RNA片段化: 提取的总RNA通常会被分解成较短的片段,通常是几百碱基长。
  3. 逆转录: 对RNA片段进行逆转录,将其转录成互补DNA(cDNA)。这通常涉及到使用逆转录酶和随机引物。
  4. cDNA合成: 将逆转录得到的cDNA片段进行合成,形成双链DNA。
  5. 建库: 将cDNA片段构建成测序文库,通常通过连接适配器序列。
  6. 测序: 进行高通量测序,通常采用Illumina、Ion Torrent、PacBio等测序平台。在这一步,对文库中的cDNA片段进行逐个碱基的测序。
  7. 数据分析: 对测序得到的数据进行生物信息学分析,包括:
    • 比对到基因组: 将测序得到的reads与参考基因组比对,确定它们在基因组上的位置。
    • 基因表达定量: 通过统计reads的数量,确定每个基因的表达水平。
    • 可变剪接分析: 检测同一基因不同可变剪接形式的存在。
    • 新基因和突变检测: 识别新的基因或变异。
  8. 结果解释

测序的几种方式:

生物信息学导论-北大-新一代测序NGS:转录组分析RNA-Seq 1_第1张图片

RPKM:the number of mapped Reads per KB per million reads

R P K M = 1 0 9 C N L RPKM=10^9\frac{C}{NL} RPKM=109NLC

其中,C是某个转录本map上的reads数量,N是map的总reads数量,L是某个转录本的长度。RPKM体现了表达水平

你可能感兴趣的:(生物信息学,生物,生物信息)