Q30与Phred值

转录组测序数据中,经常会出现Q30或Phred值,它们究竟是什么含义?

Q30
表示一个碱基的质量值,也表示该碱基错误率百分比。Q30指碱基质量值为30,错误率为0.1%,正确率为99.99%。同理Q40表示错误率为0.01%,正确率为99.999%。

二代测序中,每测一个碱基会给出一个相应的质量值,这个质量值是衡量测序准确度的。碱基的质量值13,错误率为5%,20的错误率为1%,30的错误率为0.1%。行业中Q20与Q30则表示质量值≧20或30的碱基所占百分比。例如一共测了1G的数据量,其中有0.9G的碱基质量值大于或等于20,那么Q20则为90%。

首先,碱基质量值是衡量测序质量的重要指标,质量值(Q)越高代表碱基被测错的概率(P)越小,其计算公式为Q=-10lgP。

Illumina官方一般以Q30作为评价标准,以目前最常用的HiSeq 2000平台2×100PE测序为例,Illumina官方保证大于80%碱基准确度达Q30。

Phred
每个碱基测序错误率是通过测序碱基质量值(Phred score,Qphred)通过公式转化得到,

Q20:原始数据中Phred数值大于20的碱基数量占总碱基数量的百分比。

Q30:原始数据中Phred数值大于30的碱基数量占总碱基数量的百分比。

参考1:测序中Q20 Q30 Q40
参考2:重磅干货:转录组测序常见问题

你可能感兴趣的:(Q30与Phred值)