Fit-hic 2 通过hic数据检测显著性互作

  1. 安装
    官网中提到三种安装方法,可通过conda, pip,git clone 安装该软件.
    我们这里利用conda,非常简单快速.
    1.1 conda创建环境
conda create -n fithic python=3.8

1.2 conda 安装 fithic

conda install fithic

1.3 测试

fithic -V

1.4 测试数据

svn export https://github.com/ay-lab/fithic/trunk/fithic/tests/

1.5 获得源代码

git clone https://github.com/ay-lab/fithic.git

利用源代码/fithic/tests/run_tests-pip.sh 测试软件,正常情况下应该看到所有步骤都是成功的.

  1. 用自己的数据检测显著性互作
    2.1 在源代码fithic/utils/目录下有很多辅助脚本,这里我们使用HiCPro2FitHiC.py脚本准备input文件
    利用hic-pro的结果:
python3 ./fithic/utils/HiCPro2FitHiC.py -i /hicpro/matrix/WT/raw/10000/WT_10000.matrix --bed /hicpro/matrix/WT/raw/10000/WT_10000_abs.bed -s /hicpro/matrix/WT/iced/10000/WT_10000_iced.matrix.biases -o ./WT -r 10000

参数解释:
-i hicpro结果中产生的原始矩阵
--bed 原始矩阵相对应的bin的数目及坐标
-s hicpro结果iced校正后的值
-o 输出结果的目录
-r 解析度
2.2 在完成上一步之后,我们会得到三个压缩文件可以作为fithic 主程序的输入文件.分别为:
fithic.fragmentMappability.gz, hic实验中的片段信息;
fithic.interactionCounts.gz, hic实验中片段之间的互作信息.
fithic.biases.gz, ICE方法的校正信息.
有了这些文件,我们终于可以进行分析,找到显著性的互作.
2.3 执行fithic

fithic -f fithic.fragmentMappability.gz -i fithic.interactionCounts.gz -o ./10k_WT -r 10000 -t fithic.biases.gz -v -x All

参数解释: -f, -i, -t是我们准备好的输入文件.
-o 是输出文件的目录
-r 解析度
-v 产生相应的显著性互作的图
-x All. 是指找到染色体间和染色体内的互作,还有另外两个选项是 'interOnly', 'intraOnly'.

运行时间还是挺快的,两个小时左右产生结果.

  1. 结果
    产生出5个文件,由于我们添加了-v选项,因此会有两个图.其中一个如下所示


    image.png

    我们主要关注的FitHiC.spline_pass1.res10000.significances.txt.gz文件包含互作信息.如下所示


    image.png

    前四列分别是互作的两个片段的染色体位置和互作片段的中点位置,contactCount是互作数目,p-value 和 q-value 是显著性统计值,bias1 和 bias2 是两个互作片段的Bias value,ExpCC 是预期的互作个数.
    3.1 过滤和合并
    由于我们想得到显著性的互作,因此可以根据实际情况通过p-value 或者q-value进行过滤,此外也可以利用./fithic/utils/下的merge-filter.sh 或者 merge-filter-parallelized.sh对临近的互作合并.

,就到这里吧.
更多信息和问答可以参考GitHub网站

https://github.com/ay-lab/fithic

你可能感兴趣的:(Fit-hic 2 通过hic数据检测显著性互作)