转录组数据分析流程重磅升级(202407)

本流程用于转录组二代测序数据的标准分析,可生成表达量矩阵和测序数据质控结果。

本次升级的亮点有:

  1. 1. 支持单端测序数据

  2. 2. 支持多Lane数据自动合并分析

流程步骤

本工具执行一套非常流行的转录组定量分析流程,即 Hisat2 + Stringtie 经典组合,其步骤为:

  1. 1. Fastp,进行质量控制,去除测序数据中不合格的序列,保留高质量序列用于后续分析;

  2. 2. Hisat2,将经过质控得到的 Clean data,比对到参考基因组上;

  3. 3. Samtools,将 SAM 文件转换成 BAM 文件;

  4. 4. Stringtie,结合 hisat2 得到的比对文件(BAM)和基因组注释文件(GTF),进行定量分析,得到每个样本的表达量文件(FPKM / TPM);

  5. 5. prepDE.py,将 FPTM / TPM 转化为 Counts 计数的表达量矩阵,用于后续差异基因等分析。

  6. 6. MultiQC,用于汇总质控以及比对统计信息。

样本信息表

  • • 如果不涉及样本数据合并,可以不提供样本信息表。

  • <

你可能感兴趣的:(数据分析,算法,人工智能,数据挖掘)