hifiasm软件安装与使用

HiFi测序以及hifiasm软件的使用,目前是市场上二倍体动植物基因组组装的最佳选择,没有之一,多倍体目前也是最佳选择,也正因为HiFi跟hifiasm软件,使得动植物基因组组装变得简单了很多,组装质量提高了很多。

1、安装,官网下载源代码包hifiasm官网,目前用的新版本,v0.16.0

cd hifiasm && make  #hifiasm安装非常简单,只需要到代码包里make就好

2、常用参数 ,hifiasm常用参数有-l和-n参数,
-l:0-没有对组装去冗余,组装结果包括全部组装出来的contig,可能包含多个单倍体基因组;2/3,会对组装出来的基因组进行去冗余,对于二倍体,得到的结果基本上是全基因组一半的大小,小编用的多的是 -l 2
-n一般给3或者4,默认3,表示组装的contig中,unitigs支持大于3或4才保留,该参数会将支持度比较低的contig去掉
其他参数:hifiasm -h
hifiasm软件使用
(1)市场上绝大多数二倍体基因组,只需要组装2n中的n,所以参数一般给 -l 2 -n 4:

hifiasm -o test.asm -t 16 -l 2 -n 4 HiFi-reads.fa.gz 2> test.assemble.log  #-t16为16线程,test.ccs.fa.gz为处理好的ccs数据,可为fasta或者fastq,用法很简单

(2)对于二倍体,结合HiC数据拆单倍体组装,注:听该软件作者讲座了解到,HiC数据拆单倍体成功率还是挺高的,相对也比较准确,所以如果做了HiC数据,建议用该方法尝试组装:

hifiasm -o HiC.asm -t 16 --h1 read1.fq.gz --h2 read2.fq.gz HiFi-reads.fa.gz 2> HiC.assemble.log

(3)多倍体组装,如果是异源多倍体,可以当做二倍体进行组装,用以上方法即可。如果是同源多倍体,可以先尝试-l 2参数,如果结果不好,尤其是比较复杂的同源多倍体,小编建议,使用-l 0参数进行组装,然后使用HiC数据进行挂载后,通过HiC互作信号,进行染色体拆分,如果深度足够,可以得到所有的单倍体,如果深度不够,拆分出其中的一半:

hifiasm --primary -o test.asm -t 16 -l 0 -n 3 HiFi-reads.fa.gz 2>test.assemble.log
以上是个人对hifiasm软件的理解,若有错误,辛苦指正

你可能感兴趣的:(hifiasm软件安装与使用)