2021.06.08|提取、比较各样品vcf文件中snp突变频率

目录

  • 摘要
  • 环境与方法
  • 使用代码
  • 分析结果
  • 总结

摘要

接到一个wgs项目,要帮助客户统计vcf文件中snp突变频率,比较两个样品的突变位点。这个工作在上一个项目中是手动处理的,当时参考序列短,突变位点少。这次经过比对后,发现了有个样品有上万个snp位点,肯定不能用手动处理的方式。因此,写了一个脚本来统计各个样品的突变频率。
需要统计的信息
包括染色体,突变位置,参考位点,各样品突变位点,突变率(AD杂合位点覆盖度/DP总覆盖度)

在这里插入图片描述

环境与方法

python 3.7
R version 3.6.1 

使用代码

统计各样品各位点突变频率
我们输入的vcf文件为GATK经过去重过滤后生成的,
bash python snp_frequency.py XX.snp.vcf
 
 

你可能感兴趣的:(生物信息,基因组,R语言,动态规划)