拼接序列为什么会出现短序列?

扩增子测序双末端序列拼接的时候,往往会出现短序列

stat <-qiimedata@refseq@ranges@width
plot(table(stat),xlab = "Length/bp",
     ylab = "Count")
flash.png
fastp.png

DADA2.png

这些小于400bp一下的序列是否属于我们想要的呢?

qiimedata@refseq[which(qiimedata@refseq@ranges@width%in%c(50,51,53,57,107,244,245,247,248,251))]

短序列93


image.png

短序列146


image.png

短序列294


image.png

过滤长度小于396的序列

qiimedata <- prune_taxa(qiimedata@refseq@ranges@width>=396,qiimedata)

过滤所以样本中总丰度小于1000的序列

qiimedata <- prune_taxa(rowSums(qiimedata@otu_table)>=1000, qiimedata)

你可能感兴趣的:(拼接序列为什么会出现短序列?)